Алгоритм машинного обучения в R - обнаружение мошеннических трансакций
800 UAHЗдравствуйте,
Необходимо протестировать эффективность 3 алгоритмов, каких именно не принципиально, однако, согласно наблюдениям наиболее часто используемые:
Decision Tree (CART)
k-Nearest Neighbors (KNN)
Random Forest (RF)
Имеется несколько синтетически набора данных о трансакциях:
1. https://www.kaggle.com/ntnu-testimon/paysim1
2. https://www.kaggle.com/mlg-ulb/creditcardfraud
3. https://www.kaggle.com/dileep070/anomaly-detection
Можно выбрать любой из набора данных, критерии выбора: сложность и актуальность работы.
Так как наборы данных в открытом доступе, уже существуют готовые работы которые можно использовать в качестве образца (но что бы это не было плагиатом). Необзодимо сделать что то вроде этого:
1. https://towardsdatascience.com/detecting-credit-card-fraud-using-machine-learning-a3d83423d3b8
2. https://machinelearningmastery.com/imbalanced-classification-with-the-fraudulent-credit-card-transactions-dataset/
3. https://www.kaggle.com/janiobachmann/credit-fraud-dealing-with-imbalanced-datasets
Работу можно упростить, не нужно так много вычислений и графиков как в примерах, только самое необходимой для функционирования и оценки эффективности алгоритмов.
-
1263 10 0 Александр,
что-то Вы так и не ответили на мои вопросы и предложения, поэтому оплата и сроки могут измениться как в одну, так и в другую стороны :)
можем обсудить все по скайпу - live:69c0d0e6933ce681
решайте
-
Александр, добрый день
Я могу предложить Вам свои услуги в этом проекте, но у меня есть несколько вопросов и предложений:
- Вам принципиален объем датасета для работы или нет? Просто в kaggle датасеты содержат несколько сотен тысяч транзакций и их обработка потребует больших затрат времени
- можно было бы вытащить из датасета 10-20 тысяч транзакций и на них провести работы по анализу самих данных и сравнению моделей. С таким датасетом ресурсов потребуется меньше, а результаты все-равно покажут определенную динамику и качество моделей
- при анализе данных можно получить html файл со следующей информацией:
- Сводка по основным характеристикам: типы, уникальные значения, пропущенные значения.
- Статистика квантилей: минимальное и максимальное значения, Q1, медиана, Q3, межквартильный диапазон.
- Описательные статистические данные: среднее значение, мода, стандартное отклонение, среднее абсолютное отклонение, коэффициент вариации, коэффициенты асимметрии и эксцесса.
- Наиболее частые значения.
- Гистограмма.
- Корреляции для высоко коррелированных переменных, матрицы корреляции Спирмена, Пирсона и Кендалла.
- Отсутствующие значения: матрица, счетчик, тепловая карта и дендрограмма отсутствующих значений.посмотрите картинки во вложении





-
Актуальные фриланс-проекты в категории AI и машинное обучение
Построить модель классификации клиентов1. Есть данные клиентов в Mongo/SQL (примерно 20 000 записей с сырыми данными). 2. Необходимо на их основе построить фичи и модель классификации клиентов на поведенческие группы. 3. Проект выполнить на Python. AI и машинное обучение, Python ∙ 11 часов 13 минут назад ∙ 21 ставка |
Інтеграція в CRM модулів сканерів стоматологій
27 000 UAH
Мы разработали CRM систему для взаимодействия с зубными врачами и лабораториями. Нужно интегрировать сервисы iTero, sirona, medit и др чтобы подтягивались файлы автоматически AI и машинное обучение, Java ∙ 12 часов 58 минут назад ∙ 12 ставок |
Создать команду AI агентовХочу создавать себе команду AI агентов, которые будут помогать в повседневной жизни, контролировать бизнес процессы, анализировать отчеты и тд. AI и машинное обучение ∙ 15 часов 20 минут назад ∙ 19 ставок |
ИТ Автоматизация ведения VAT-отчетности
10 000 UAH
Необходимо разработать систему для автоматизации переноса данных о продажах из CRM в бухгалтерскую систему Wafeq. Система должна импортировать банковские и платежные отчеты, автоматически сверять платежи с инвойсами, формировать инвойсы для VAT-отчетности и минимизировать ручную… AI и машинное обучение, Python ∙ 16 часов 38 минут назад ∙ 29 ставок |
Разработка AI-агента по продажам для интернет-магазина на PrestaShop 1.6 с интеграцией KeyCRMИщем разработчика или небольшую команду для создания AI-консультанта по продажам для интернет-магазина учебной литературы. Сайт работает на PrestaShop 1.6, CRM — KeyCRM. Нужен не обычный чат-бот с готовыми ответами, а AI-продавец, который поможет клиенту подобрать нужные книги и… AI и машинное обучение, Интернет-магазины и электронная коммерция ∙ 21 час 52 минуты назад ∙ 35 ставок |