Потрібен спеціаліст з Big Data, ML, NLP, RAG
1. Мета
Створити інструмент аналізу великих масивів текстових даних (переписки на сайті знайомств) з метою визначення ключових психологічних характеристик клієнтів.
2. Короткий опис завдання
Є кілька сотень великих файлів (кілька сотень аркушів у кожному файлі, може бути до десятків тисяч повідомлень на аркуші), що містять переписку клієнтів.
Потрібно проаналізувати ці дані з точки зору ряду психологічних показників.
Планується використовувати підхід RAG (Retrieval-Augmented Generation) та векторні бази даних для ефективного пошуку та аналізу.
3. Вимоги до спеціаліста
Big Data: розуміння роботи з великими обсягами даних (Spark/Hadoop або аналоги).
NLP / ML:
Досвід обробки тексту (попередня обробка, токенізація, очищення) та застосування ML-моделей.
Знання сучасних методів аналізу тексту (sentiment, topic modeling, класифікація).
Vector Databases / RAG:
Практика роботи з Pinecone, Milvus, Weaviate (або аналогами) та ембеддинговими моделями.
Здатність побудувати пайплайн Retrieval-Augmented Generation (генерація ембеддингов, пошук за схожістю, інтеграція LLM).
Додатково:
Вміння документувати рішення, пояснювати вибір інструментів.
Навички DevOps (Docker/Kubernetes) вітаються.
4. Очікувані завдання
Підготовка даних: читання, очищення, структуризація переписки.
Формування ембеддингов: налаштування моделей (BERT, Sentence-BERT, OpenAI Embeddings тощо).
Використання векторної БД: завантаження ембеддингов, пошук релевантних фрагментів.
RAG-аналіз: інтеграція з мовною моделлю для витягування ключових характеристик поведінки клієнтів.
Оцінка психологічних критеріїв: налаштування/створення моделей, що дозволяють виділяти потрібні аспекти. (є готовий список критеріїв, за якими потрібно буде оцінювати клієнтів)
5. Ключові навички та технології
Мова: Python (pandas, scikit-learn, PySpark, HuggingFace Transformers або інші).
Інфраструктура: знання хмарних сервісів (AWS, GCP, Azure або інші) або локальних кластерів Big Data.
Векторні бази: Pinecone, Milvus, Weaviate або FAISS або інші.
NLP-бібліотеки: spaCy, NLTK, а також інструменти для лемматизації та очищення.
ML-пайплайн: знання MLOps-інструментів (Airflow, MLflow, Docker або інші).
-
2 дні4491 UAH2 дні4491 UAH
Привіт, є досвід роботи з Big Data, навіть одного разу брала участь у конкурсі Kaggle з аналізу даних і отримала там призове місце. З Kubernetes, різними методами машинного навчання, бібліотеками Python, також знайома не з чуток, був досвід вирішення практичних завдань. Чекаю повідомлення в приват.
Актуальні фриланс-проєкти в категорії AI та машинне навчання
Створення АІ асистента для комунікації із КлієнтамиПотрібно створити АІ асистента для комунікації із Клієнтами. Вікно чату буде розташовано на нашому сайті, далі йде спілкування з ботом. Питання по продукції, налаштуванням, можливостям і т.д. У випадку коли невідома інформація чи запит, відповідь на який має тільки менеджер -… AI та машинне навчання, Консультування з AI ∙ 17 годин 1 хвилина тому ∙ 29 ставок |
Шукаю відеомонтажера, який створює ролики ІІСтворення AI-відео для стоматологів та інших експертів Мета: Створення коротких вертикальних відео для Instagram Reels, Facebook Reels, TikTok та YouTube Shorts, які пояснюють складні теми простими словами та утримують увагу глядача завдяки поєднанню AI-анімації та відео… AI та машинне навчання ∙ 1 день тому ∙ 2 ставки |
Шукаю ментора / викладача з ComfyUI для онлайн-навчання (робота через RunPod)
700 UAH
Добрий день. Шукаю практикуючого спеціаліста та ментора, який допоможе мені опанувати роботу з ComfyUI. Головна особливість мого запиту — робота буде відбуватися повністю у хмарі, без завантаження програми на локальний комп'ютер. Я планую орендувати відеокарту через сервіс… AI та машинне навчання ∙ 1 день 11 годин тому ∙ 1 ставка |
ИИ-агент технолога спортивного харчуванняАгент допомагає розробляти рецептури нових продуктів спортивного харчування — протеїнових батончиків, протеїнів, передтренувальних добавок, ізотоніків, батончиків тощо. Головна особливість: агент знає законодавство різних країн і автоматично враховує його при створенні… AI та машинне навчання, Веб-програмування ∙ 1 день 11 годин тому ∙ 59 ставок |
Інтеграція системи аналітики з Бази даних в Таблиці
5000 UAH
Потрібно довести поточну систему аналітики до стабільного робочого стану. Зараз дані з CRM, телефонії та рекламних кабінетів підтягуються через Supabase через МСП потім в гугл таблиці, але частину процесів ще доводиться контролювати вручну. Це треба прибрати.1. Стабілізувати… AI та машинне навчання, Розробка ботів ∙ 2 дні 1 година тому ∙ 32 ставки |