Topic modeling
2123 UAHUse data from https://github.com/thedenaas/hse_seminars/tree/master/2018/seminar_13/data.zip
Implement model in pytorch from "An Unsupervised Neural Attention Model for Aspect Extraction, He et al, 2017", also desribed in https://github.com/thedenaas/hse_seminars/blob/master/2019/seminar_13/topic.ipynb .
You can use sentence embeddings with attention :
sentence embedding
attention weight for i-th token
attention with trainable matrix 
sentence context
, token embedding of size d
- number of tokens in a sentence
Or just use sentence embedding as an average over word embeddings :
sentence embedding
, token embedding of size d
- number of tokens in a sentence
topic weights for sentence
, with trainable matrix
and bias vector 
reconstructed sentence embedding as a weighted sum of topic embeddings
trainable matrix of topic embeddings, K=number of topics
Training objective:
where
random sentences are sampled as negative examples from dataset
for each sentence 
average of word embeddings in the i-th sentence
regularizer, that enforces matrix
to be orthogonal
Frobenius norm
Compute topic coherence for at least for 3 different number of topics. Use 10 nearest words for each topic. It means you have to train one model for each number of topics. You can use code from seminar notes with word2vec similarity scores.
-
80 Могу выполнить Ваше задание. Есть опыт работы с нейронными сетями и имплементации их с научных статей на pytorch/tensorflow.
О сроках и цене можем договориться.
-
356 8 0 Добрый день!
У меня имеется большой опыт в DataScience. Есть экспертиза в NLP и разработке моделей на pytorch. Пишите, обсудим детали:)
Актуальные фриланс-проекты в категории Python
Необходимо создать бота в ТГ для оплаты подписки.
2000 UAH
Необходимо создать бота в телеграме, где пользователь сможет оформить подписку на доступ к веб-камерам, которые находятся во дворе. Организовать в боте оплату двух видов подписок (на месяц и на один день). Бот должен автоматически проверять оплату и после выдавать ссылку-доступа. Python, Разработка ботов ∙ 11 часов 35 минут назад ∙ 62 ставки |
Python / Network Engineer: Сетевая оптимизация бота (WAF, Connection Pooling, Asyncio)Упрощенный вариант! Прошу откликнуться только тех, кто понимает и разбирается. О проекте: Автоматизированный бот для снайпинга. Базовая бизнес-логика (парсинг, авторизация, сборка JSON/XML пакетов) уже готова и работает на Python. Целевое окружение — Linux (Ubuntu). Текущая… Python, Парсинг данных ∙ 14 часов 5 минут назад ∙ 14 ставок |
Парсинг и классификация большого массива изображенийНеобходимо реализовать проект по сбору и структурированию большого массива архитектурных изображений из открытых веб-источников.Задача включает: автоматизированный сбор изображений; загрузка файлов в максимально доступном качестве; классификацию изображений по категориям:… Python, Парсинг данных ∙ 18 часов 35 минут назад ∙ 30 ставок |
Бизнес-логикa платформы: подтверждение занятий, контроль посещаемости-и история уроков (DjangoДоработка бизнес-логики образовательной платформы: подтверждение занятий, контроль посещаемости и история уроков (Django + React) Необходимо реализовать полноценную систему подтверждения уроков, контроля посещаемости и хранения истории подтверждений. Важно Перед началом… Python ∙ 2 дня 23 часа назад ∙ 29 ставок |
Доработка административной панели образовательной платформы (Django + React)Доработка административной панели образовательной платформы (Django + React) Описание проекта: Есть действующая образовательная платформа (marketplace, аналог Preply), разработанная на Django + React. Требуется доработать существующую административную панель и реализовать… Python, Веб-программирование ∙ 4 дня 20 часов назад ∙ 58 ставок |