Topic modeling
2123 UAHUse data from https://github.com/thedenaas/hse_seminars/tree/master/2018/seminar_13/data.zip
Implement model in pytorch from "An Unsupervised Neural Attention Model for Aspect Extraction, He et al, 2017", also desribed in https://github.com/thedenaas/hse_seminars/blob/master/2019/seminar_13/topic.ipynb .
You can use sentence embeddings with attention :
sentence embedding
attention weight for i-th token
attention with trainable matrix 
sentence context
, token embedding of size d
- number of tokens in a sentence
Or just use sentence embedding as an average over word embeddings :
sentence embedding
, token embedding of size d
- number of tokens in a sentence
topic weights for sentence
, with trainable matrix
and bias vector 
reconstructed sentence embedding as a weighted sum of topic embeddings
trainable matrix of topic embeddings, K=number of topics
Training objective:
where
random sentences are sampled as negative examples from dataset
for each sentence 
average of word embeddings in the i-th sentence
regularizer, that enforces matrix
to be orthogonal
Frobenius norm
Compute topic coherence for at least for 3 different number of topics. Use 10 nearest words for each topic. It means you have to train one model for each number of topics. You can use code from seminar notes with word2vec similarity scores.
-
80 Могу выполнить Ваше задание. Есть опыт работы с нейронными сетями и имплементации их с научных статей на pytorch/tensorflow.
О сроках и цене можем договориться.
-
356 8 0 Добрый день!
У меня имеется большой опыт в DataScience. Есть экспертиза в NLP и разработке моделей на pytorch. Пишите, обсудим детали:)
Актуальні фриланс-проєкти в категорії Python
Потрібно створити бот в тг для оплати підписки.
2000 UAH
Потрібно створити бот в телеграмі де користувач зможе оформити підписку на доступ до веб камер котрі знгаходяться у дворі. Організувати в боті оплату двух видів підписок (на місяць і на один день). Бот повинен автоматично перевірити оплату і після видавати посилання-доступу Python, Розробка ботів ∙ 12 годин 44 хвилини тому ∙ 64 ставки |
Парсинг та класифікація великого масиву зображеньПотрібно реалізувати проєкт зі збору та структурування великого масиву архітектурних зображень із відкритих вебджерел.Задача включає: автоматизований збір зображень; завантаження файлів у максимально доступній якості; класифікацію зображень за категоріями: Exterior; Interior;… Python, Парсинг даних ∙ 19 годин 44 хвилини тому ∙ 30 ставок |
Бізнес-логіка платформи: підтвердження занять, контроль відвідуваності та історія уроків (DjangoДоопрацювання бізнес-логіки освітньої платформи: підтвердження занять, контроль відвідуваності та історія уроків (Django + React) Необхідно реалізувати повноцінну систему підтвердження уроків, контролю відвідуваності та зберігання історії підтверджень. Важливо Перед початком… Python ∙ 3 дні тому ∙ 29 ставок |
Доопрацювання адміністративної панелі освітньої платформи (Django + React)Доопрацювання адміністративної панелі освітньої платформи (Django + React) Опис проекту: Є діюча освітня платформа (маркетплейс, аналог Preply), розроблена на Django + React. Необхідно доопрацювати існуючу адміністративну панель і реалізувати відсутній функціонал управління… Python, Веб-програмування ∙ 4 дні 22 години тому ∙ 58 ставок |
Скрипт сбору даних (виконання JS)Добрий день, є список ссилок на оголошення 0lx, потрібно написати скрипт якій буде збиратителефон. Він з'являється при натисканні на кнопку "показати телефон". Бажано виконати на python, але інші варіанти теж ок. Скілько приблизно по вартості та часу? Python, Парсинг даних ∙ 5 днів 12 годин тому ∙ 47 ставок |