Потрібен спеціаліст з Big Data, ML, NLP, RAG
1. Мета
Створити інструмент аналізу великих масивів текстових даних (переписки на сайті знайомств) з метою визначення ключових психологічних характеристик клієнтів.
2. Короткий опис завдання
Є кілька сотень великих файлів (кілька сотень аркушів у кожному файлі, може бути до десятків тисяч повідомлень на аркуші), що містять переписку клієнтів.
Потрібно проаналізувати ці дані з точки зору ряду психологічних показників.
Планується використовувати підхід RAG (Retrieval-Augmented Generation) та векторні бази даних для ефективного пошуку та аналізу.
3. Вимоги до спеціаліста
Big Data: розуміння роботи з великими обсягами даних (Spark/Hadoop або аналоги).
NLP / ML:
Досвід обробки тексту (попередня обробка, токенізація, очищення) та застосування ML-моделей.
Знання сучасних методів аналізу тексту (sentiment, topic modeling, класифікація).
Vector Databases / RAG:
Практика роботи з Pinecone, Milvus, Weaviate (або аналогами) та ембеддинговими моделями.
Здатність побудувати пайплайн Retrieval-Augmented Generation (генерація ембеддингов, пошук за схожістю, інтеграція LLM).
Додатково:
Вміння документувати рішення, пояснювати вибір інструментів.
Навички DevOps (Docker/Kubernetes) вітаються.
4. Очікувані завдання
Підготовка даних: читання, очищення, структуризація переписки.
Формування ембеддингов: налаштування моделей (BERT, Sentence-BERT, OpenAI Embeddings тощо).
Використання векторної БД: завантаження ембеддингов, пошук релевантних фрагментів.
RAG-аналіз: інтеграція з мовною моделлю для витягування ключових характеристик поведінки клієнтів.
Оцінка психологічних критеріїв: налаштування/створення моделей, що дозволяють виділяти потрібні аспекти. (є готовий список критеріїв, за якими потрібно буде оцінювати клієнтів)
5. Ключові навички та технології
Мова: Python (pandas, scikit-learn, PySpark, HuggingFace Transformers або інші).
Інфраструктура: знання хмарних сервісів (AWS, GCP, Azure або інші) або локальних кластерів Big Data.
Векторні бази: Pinecone, Milvus, Weaviate або FAISS або інші.
NLP-бібліотеки: spaCy, NLTK, а також інструменти для лемматизації та очищення.
ML-пайплайн: знання MLOps-інструментів (Airflow, MLflow, Docker або інші).
-
2 дні4491 UAH2 дні4491 UAH
Привіт, є досвід роботи з Big Data, навіть одного разу брала участь у конкурсі Kaggle з аналізу даних і отримала там призове місце. З Kubernetes, різними методами машинного навчання, бібліотеками Python, також знайома не з чуток, був досвід вирішення практичних завдань. Чекаю повідомлення в приват.
Актуальні фриланс-проєкти в категорії AI та машинне навчання
Автоматичний постінг сторіз в інстаграмДоброго дня, Потрібна допомога із налаштуванням автоматичного постингу історій в інстаграм. В архіві інстаграм вже є історії що були опубліковані, ії треба робити повторний перепостинг AI та машинне навчання, Розробка ботів ∙ 2 години 21 хвилина тому ∙ 11 ставок |
Створення АІ асистента для комунікації із КлієнтамиПотрібно створити АІ асистента для комунікації із Клієнтами. Вікно чату буде розташовано на нашому сайті, далі йде спілкування з ботом. Питання по продукції, налаштуванням, можливостям і т.д. У випадку коли невідома інформація чи запит, відповідь на який має тільки менеджер -… AI та машинне навчання, Консультування з AI ∙ 21 година 50 хвилин тому ∙ 29 ставок |
Шукаю відеомонтажера, який створює ролики ІІСтворення AI-відео для стоматологів та інших експертів Мета: Створення коротких вертикальних відео для Instagram Reels, Facebook Reels, TikTok та YouTube Shorts, які пояснюють складні теми простими словами та утримують увагу глядача завдяки поєднанню AI-анімації та відео… AI та машинне навчання ∙ 1 день 5 годин тому ∙ 2 ставки |
Шукаю ментора / викладача з ComfyUI для онлайн-навчання (робота через RunPod)
700 UAH
Добрий день. Шукаю практикуючого спеціаліста та ментора, який допоможе мені опанувати роботу з ComfyUI. Головна особливість мого запиту — робота буде відбуватися повністю у хмарі, без завантаження програми на локальний комп'ютер. Я планую орендувати відеокарту через сервіс… AI та машинне навчання ∙ 1 день 15 годин тому ∙ 1 ставка |
ИИ-агент технолога спортивного харчуванняАгент допомагає розробляти рецептури нових продуктів спортивного харчування — протеїнових батончиків, протеїнів, передтренувальних добавок, ізотоніків, батончиків тощо. Головна особливість: агент знає законодавство різних країн і автоматично враховує його при створенні… AI та машинне навчання, Веб-програмування ∙ 1 день 16 годин тому ∙ 59 ставок |