Нужен специалист по Big Data, ML, NLP, RAG
1. Цель
Создать инструмент анализа больших массивов текстовых данных (переписки на сайте знакомств) с целью определения ключевых психологических характеристик клиентов.
2. Краткое описание задачи
Есть пару сотен больших файлов (несколько сотен листов в каждом файле, может быть до десяток тысяч сообщений на лист), содержащие переписку клиентов.
Нужно проанализировать эти данные с точки зрения ряда психологических показателей.
Планируется использовать подход RAG (Retrieval-Augmented Generation) и векторные базы данных для эффективного поиска и анализа.
3. Требования к специалисту
Big Data: понимание работы с большими объёмами данных (Spark/Hadoop или аналоги).
NLP / ML:
Опыт обработки текста (предобработка, токенизация, очистка) и применения ML-моделей.
Знание современных методов анализа текста (sentiment, topic modeling, классификация).
Vector Databases / RAG:
Практика работы с Pinecone, Milvus, Weaviate (или аналогами) и эмбеддинговыми моделями.
Способность построить пайплайн Retrieval-Augmented Generation (генерация эмбеддингов, поиск по схожести, интеграция LLM).
Дополнительно:
Умение документировать решения, пояснять выбор инструментов.
Навыки DevOps (Docker/Kubernetes) приветствуются.
4. Ожидаемые задачи
Подготовка данных: чтение, очистка, структурирование переписки.
Формирование эмбеддингов: настройка моделей (BERT, Sentence-BERT, OpenAI Embeddings и пр.).
Использование векторной БД: загрузка эмбеддингов, поиск релевантных фрагментов.
RAG-аналитика: интеграция с языковой моделью для извлечения ключевых характеристик поведения клиентов.
Оценка психологических критериев: настройка/создание моделей, позволяющих выделять нужные аспекты. (есть готовый список критериев по которым нужно будет оценивать клиентов)
5. Ключевые навыки и технологии
Язык: Python (pandas, scikit-learn, PySpark, HuggingFace Transformers или другие.).
Инфраструктура: знание облачных сервисов (AWS, GCP, Azureили другие) или локальных кластеров Big Data.
Векторные базы: Pinecone, Milvus, Weaviate или FAISS или другие.
NLP-библиотеки: spaCy, NLTK, а также инструменты для лемматизации и очистки.
ML-пайплайн: знание MLOps-инструментов (Airflow, MLflow, Docker или другие).
-
10 дней62 542 UAH
261 1 0 10 дней62 542 UAHДоброго времени суток.
Приходилось разрабатывать гибридный поиск на основе Elasticsearch, а также использовать модель с эмбеддингами и обычный текстовый поиск для коммерческого проекта, охватывающего 1 млн товаров. Проводил работы по фильтрации, токенизации, очистке и лемматизации данных. Результаты оказались весьма приемлемыми.
-
2 дня4169 UAH
1135 13 0 1 2 дня4169 UAHЗдравствуйте, есть опыт работы с Big Data, даже однажды участвовала в конкурсе Kaggle по анализу данных и получила там призовое место. С Kubernetes, различными методами машинного обучения, библиотеками Python, также знакома не понаслышке, был опыт решения практических задач. Жду сообщения в приват.
-
7 дней4169 UAH
792 18 1 1 7 дней4169 UAHДелал на Python подобный анализ текста. Составлял словари лексем, словари тональности и общий анализ по них.
Актуальные фриланс-проекты в категории AI и машинное обучение
Помощь настроить модуль TikTok Campaign Management в Make.com
700 UAH
Помощь/консультация, нужно настроить модуль TikTok Campaign Management в Make.com Скрин модуля – https://roliki.ua/s/ziygz2828.png Получаю ошибку формата – https://roliki.ua/s/vg1af3325.png Но я не могу врубить где получить, похожу нужны эти данные –… AI и машинное обучение, Автоматизация управления предприятием ∙ 4 минуты назад |
Разработать телеграм-бота, который будет генерировать презентации
2000 UAH
Здравствуйте, у меня есть несколько идей по созданию тг ботов (saas), примеры и условия сотрудничества мы можем обсудить в переписке AI и машинное обучение, Разработка ботов ∙ 6 минут назад ∙ 1 ставка |
Создать AI Telegram-бота, агента врача-эндокринолога-диабетологаМета: Создать интеллектуального Telegram-бота, который информирует, консультирует и помогает пациентам с диабетом 1 и 2 типа (и преддиабетом), НЕ заменяя врача. Человеческая (врачебная) модель общения БЕЗ лишних оборотов и излишней вежливости. Подробное ТЗ отправлю в ЛС… AI и машинное обучение ∙ 11 часов 17 минут назад ∙ 8 ставок |
Прасинг кандидатов ворк работа
3000 UAH
Интересует парсинг кандитов (контактные данные имя и должность) с ворк и работа юей интересуют линейные должности по типу грузчиков, и неквалифицированный персонал AI и машинное обучение, Работа с клиентами ∙ 17 часов 50 минут назад ∙ 1 ставка |
Промпт инжениринг - создание системы агентов для интервью с пользователямиНужно создать AI-систему на агентах которая будет проводить интервью с экспертом. В ходе интервью (около 5 этапов, как "тема", "специализация", "ниша" итд), нужно создавать вопросы что бы углубляться в экспертизу специалиста (на пример зубной врач). AI-агенты должны быть… AI и машинное обучение, Python ∙ 23 часа 57 минут назад ∙ 6 ставок |