Консольний додаток на Python для зіставлення даних
2000 UAHПередісторія. Google Scholar - платформа індексації публікацій. Суть у тому, що ми отримуємо дані про публікації автора, використовуючи публічну апішку (це робити не треба, для програми уявімо, що дані вже отримано і покладено в json файл).
Також, у нас є другий json файл, який являє собою базу даних публікацій цього ж автора, але не повну. Тобто деякі публікації, отримані за апі вже є в базі, а деякі - ні.
Мета: написати алгоритм (консольну програму на Python) а-ля entity resolution, у якому ми маємо перевірити кожен отриманий за апі запис на належність автору. Передбачається, що деякі публікації Google Scholar йому присвоїв випадково.
Шляхи перевірки:
1. ім'я автора може мати різні написання, скорочення тощо. Його пропонується перевіряти відстанню Левенштейна (дистанція редагування).
2. Приблизно так само, як і ім'я, якимось простим способом порівняти дату\місце публікації з тими, що вже зустрічалися в публікаціях автора в бд.
3. Перевірити тему роботи. Тобто порівняти з уже наявними записами в бд (json, який імітує бд). Якщо такої теми немає, то перевірити тематику роботи з темами, на які автор уже писав статті. Це можна зробити, використовуючи одну з моделей Word2vec, отримуючи загальну тему з назв публікацій.
Наскільки я розумію, то все це можна зробити регулярними виразами, але я не дуже розумію як, тож запропоновані вище варіанти - це те, до чого я змогла дійти.
У результаті ми маємо для кожної публікації, отриманої за апі, отримати статус: належить автору, не належить або вже є в бд.
Приблизний вигляд json-файлів з отриманими за апі даними і даними бд прикріплюю.
Додатки 2
Відгук замовника про співпрацю з Oleksandr V.
Консольний додаток на Python для зіставлення данихВсе отлично, работа выполнена качественно и раньше срока. Исполнитель уточнял все необходимые детали, чтобы не сделать не то, что нужно; постоянно был на всязи даже после выполнения работы. Рекомендую к сотрудничеству!
Відгук фрилансера про співпрацю з Іриною Лактіоновою
Консольний додаток на Python для зіставлення данихИрина поставила четкое ТЗ, даже предложила несколько решений, быстрые ответы на все уточнение, работа прошла идеально. Рекомендую к сотрудничеству.
Актуальні фриланс-проєкти в категорії Python
Python програміст
5000 UAH
Вітаю, потрібен програміст на python для деякої наукової роботи, пов'язаної з генерацією звукових сигналів та їх розпізнаванням. Проект більше для ентузіастів, багато грошей не заробите, на даному етапі принаймні. Працювати над проектом можна ввечері. Усі деталі проекту… Python ∙ 40 хвилин тому ∙ 9 ставок |
Потрібен телеграм бот. Мова програмування пайтон, бот має мати адмін панель для обробки заявок
1100 UAH
Ось детальний опис проєкту Псіля натискання кнопки /start Бот присилає текст з правилми та умови користування (під текстом, кнопка ознайомленний) Після, йде невеличке заповнення анкети: Ваший вік? ... звідки дізнались про нас? ... Чи був досвід до цього? ... Скільки часу… Python, Розробка ботів ∙ 57 хвилин тому ∙ 21 ставка |
Розробка веб-сервісу з платним доступом до онлайн-чатуДоброго дня, необхідно розробити веб-сервіс, який включає: * персональні посилання для користувачів; * сторінку з описом послуги; * оплату через PayPal; * онлайн-чат в реальному часі; * відображення відео на сторінці користувача; * облік оплаченного часу та автоматичне… Python, Веб-програмування ∙ 2 години 10 хвилин тому ∙ 36 ставок |
Створення додаткуБажаю створити мобільний додаток для спілкування, в застосунку має бути аудіо,відео дзвінок, створення групових чатів,можливість синхронізувати з контактами телефону, налаштуваннями акаунта: привязка по мейлу, 2фа, номеру телефону,можливість налаштовувати сповіщення… Java, Python ∙ 1 день тому ∙ 32 ставки |
Налаштування двосторонньої інтеграції WhatsApp з Odoo CRMВітаю! Шукаємо спеціаліста для реалізації технічного завдання з налаштування двосторонньої інтеграції месенджера WhatsApp з CRM-системою Odoo. ⚠️ Важливе технічне уточнення:Офіційний WhatsApp Business API (WABA) не розглядається. Необхідно впровадити стабільне «сіре» рішення… Python, Веб-програмування ∙ 1 день 9 годин тому ∙ 23 ставки |