Topic modeling
2123 UAHUse data from https://github.com/thedenaas/hse_seminars/tree/master/2018/seminar_13/data.zip
Implement model in pytorch from "An Unsupervised Neural Attention Model for Aspect Extraction, He et al, 2017", also desribed in https://github.com/thedenaas/hse_seminars/blob/master/2019/seminar_13/topic.ipynb .
You can use sentence embeddings with attention :
sentence embedding
attention weight for i-th token
attention with trainable matrix 
sentence context
, token embedding of size d
- number of tokens in a sentence
Or just use sentence embedding as an average over word embeddings :
sentence embedding
, token embedding of size d
- number of tokens in a sentence
topic weights for sentence
, with trainable matrix
and bias vector 
reconstructed sentence embedding as a weighted sum of topic embeddings
trainable matrix of topic embeddings, K=number of topics
Training objective:
where
random sentences are sampled as negative examples from dataset
for each sentence 
average of word embeddings in the i-th sentence
regularizer, that enforces matrix
to be orthogonal
Frobenius norm
Compute topic coherence for at least for 3 different number of topics. Use 10 nearest words for each topic. It means you have to train one model for each number of topics. You can use code from seminar notes with word2vec similarity scores.
-
60 Могу выполнить Ваше задание. Есть опыт работы с нейронными сетями и имплементации их с научных статей на pytorch/tensorflow.
О сроках и цене можем договориться.
-
356 8 0 Добрый день!
У меня имеется большой опыт в DataScience. Есть экспертиза в NLP и разработке моделей на pytorch. Пишите, обсудим детали:)
Актуальные фриланс-проекты в категории Python
Создание Тик-ток фермы с генерацией дохода
27 000 UAH
в поиске человека, который может написать софт, для фермы тик ток, чтобы мы смогли генерировать трафик, получать доход. Ищем готовое решение с полным циклом. Python, Разработка ботов ∙ 19 часов 21 минута назад ∙ 13 ставок |
AI Commenting Platform для TikTok и Instagram.Цель проекта Разработать систему, которая позволяет управлять большим количеством аккаунтов TikTok и Instagram и автоматически публиковать релевантные комментарии под выбранными видео с использованием ИИ. Основной функционал1. Управление аккаунтами Необходимо реализовать… AI и машинное обучение, Python ∙ 2 дня 2 часа назад ∙ 21 ставка |
Построить модель классификации клиентов1. Есть данные клиентов в Mongo/SQL (примерно 20 000 записей с сырыми данными). 2. Необходимо на их основе построить фичи и модель классификации клиентов на поведенческие группы. 3. Проект выполнить на Python. AI и машинное обучение, Python ∙ 3 дня 20 часов назад ∙ 43 ставки |
ИТ Автоматизация ведения VAT-отчетности
10 000 UAH
Необходимо разработать систему для автоматизации переноса данных о продажах из CRM в бухгалтерскую систему Wafeq. Система должна импортировать банковские и платежные отчеты, автоматически сверять платежи с инвойсами, формировать инвойсы для VAT-отчетности и минимизировать ручную… AI и машинное обучение, Python ∙ 4 дня 2 часа назад ∙ 51 ставка |
Инструмент сверки счетов с банком, картами и бухгалтеромТехническое задание: инструмент сверки счетов с банком, картами и бухгалтеромОбщая цель Нужен локальный инструмент (скрипт/небольшое приложение на Python), который запускается вручную раз в 1-2 месяца на моём компьютере и делает сверку между: Счетами, которые я выставил клиентам… Python, Десктопные приложения ∙ 4 дня 14 часов назад ∙ 43 ставки |