Побудувути модель калсифікації клієнтів
1. Є дані клієнтів в Mongo/SQL (приблизно 20 000 заисів із сирими даними).
2. Необхідно на їх основі побудувати фічі та модель класифікації клієнтв на поведінкові групи.
3. Проект виконати на Python.
-
2991 73 4 2 Добрий день! Виконаю дану задачу швидко, а головне якісно за 1 день!!!! Звертайтесь!!!!
-
232 Доброго вечора! Робив сегментацію клієнтів на Python — фічі в стилі RFM (давність, частота, суми, активність) + кластеризація і профілювання кожної групи, щоб виходили живі сегменти, а не безіменні номери. Витягну дані з Mongo/SQL, почищу сирі записи й зберу пайплайн. Одразу головне: що приблизно є в тих 20к записах і для чого вам потім сегменти — під це підберу фічі. Зроблю за 3 дні.
-
615 3 0 Вітаю.
Можу зробити першу робочу версію ML-пайплайну на Python для сегментації клієнтів за поведінковими ознаками.
Ключове уточнення на старті: чи є вже готові мітки груп. Якщо є — робимо supervised classification з train/test split і метриками якості. Якщо міток немає — будуємо сегментацію через clustering, з підбором кількості груп і описом логіки кожного сегмента.
У роботі закладу:
- витяг даних з MongoDB / SQL або з експортів
- очищення сирих записів, пропуски, аномалії
… - feature engineering: активність, частота, давність, обсяги, RFM-like ознаки
- baseline-модель на scikit-learn
- оцінку якості, збереження моделі і розмічений датасет
- короткий звіт, щоб було зрозуміло, що означає кожна група клієнтів
Перед початком роботи маю уточнити:
- яка структура даних у MongoDB / SQL
- чи є готові класи клієнтів
- який результат потрібен: файл, модель, скрипт або запис груп назад у БД
- як ці групи будуть використовуватись далі
Деталі можемо обговорити в особистих повідомленнях.
-
3481 49 2 Вітаю!
Робив схожі задачі на Python. Уточніть чи це групи невідомі, треба знайти чи є готові мітки груп? Від цього залежить підхід.
-
141 Добрий день!
Задача зрозуміла — побудова поведінкової сегментації клієнтів на основі сирих даних.
Що зроблю:
Підключення до MongoDB/SQL, витяг і аудит 20к записів
Чистка даних: аномалії, пропуски, нормалізація
Feature Engineering: з поведінкових логів — метрики активності, частоти, обсягів, RFM-ознаки
… Модель: кластеризація (K-Means + DBSCAN) для виявлення поведінкових груп, підбір оптимальної кількості кластерів (elbow method + silhouette score)
Результат: розмічений датасет, збережена модель, звіт з описом кожної групи клієнтів та рекомендаціями
Стек: Python, pandas, scikit-learn, pymongo
Уточніть: дані вже очищені чи повністю сирі? Є цільова мітка (supervised) чи потрібно самостійно знайти групи (unsupervised)?
-
240 Вітаю! Задача побудови поведінкової моделі клієнтів мені повністю зрозуміла. Навчаюся на спеціальності «Системи штучного інтелекту», тому розробка архітектури ML-моделей та Feature Engineering — це мій профільний стек.
Як пропоную реалізувати проєкт на Python:
Data Prep: Витягуємо сирі дані з вашої бази (SQL/Mongo), проводимо чистку від аномалій та заповнення пропусків.
Feature Engineering: На основі поведінкових логів згенеруємо щільну матрицю фіч (метрики активності, частоти та об'ємів взаємодії).
Modeling: Побудуємо та навчимо оптимальну модель (класифікація/кластеризація через scikit-learn), підберемо гіперпараметри та виведемо метрики оцінки якості моделі.
Буду рада обговорити специфіку сирих даних в особистих повідомленнях!
-
1048 7 1 Вітаю!
На основі ваших 20 000 сирих записів із Mongo/SQL я розроблю оптимізований пайплайн для очищення даних та генерації поведінкових ознак (features) на Python. Реалізую точну модель, яка сегментує клієнтів на групи та за потреби оновить статус кожного користувача в базі даних. Ви отримаєте готовий задокументований скрипт, який автоматично завантажує сирі дані, формує матрицю ознак та прогнозує класи. Підкажіть, у вас вже є розмічені класи для навчання моделі, чи завдання полягає у пошуку прихованих сегментів шляхом кластеризації? Напишіть в особисті — обговоримо структуру бази і стартуємо.
-
Поставте ваше запитання замовнику