Алгоритм машинного обучения в R - обнаружение мошеннических трансакций
18 USDЗдравствуйте,
Необходимо протестировать эффективность 3 алгоритмов, каких именно не принципиально, однако, согласно наблюдениям наиболее часто используемые:
Decision Tree (CART)
k-Nearest Neighbors (KNN)
Random Forest (RF)
Имеется несколько синтетически набора данных о трансакциях:
1. https://www.kaggle.com/ntnu-testimon/paysim1
2. https://www.kaggle.com/mlg-ulb/creditcardfraud
3. https://www.kaggle.com/dileep070/anomaly-detection
Можно выбрать любой из набора данных, критерии выбора: сложность и актуальность работы.
Так как наборы данных в открытом доступе, уже существуют готовые работы которые можно использовать в качестве образца (но что бы это не было плагиатом). Необзодимо сделать что то вроде этого:
1. https://towardsdatascience.com/detecting-credit-card-fraud-using-machine-learning-a3d83423d3b8
2. https://machinelearningmastery.com/imbalanced-classification-with-the-fraudulent-credit-card-transactions-dataset/
3. https://www.kaggle.com/janiobachmann/credit-fraud-dealing-with-imbalanced-datasets
Работу можно упростить, не нужно так много вычислений и графиков как в примерах, только самое необходимой для функционирования и оценки эффективности алгоритмов.
-
1263 10 0 Александр,
что-то Вы так и не ответили на мои вопросы и предложения, поэтому оплата и сроки могут измениться как в одну, так и в другую стороны :)
можем обсудить все по скайпу - live:69c0d0e6933ce681
решайте
-
Александр, добрый день
Я могу предложить Вам свои услуги в этом проекте, но у меня есть несколько вопросов и предложений:
- Вам принципиален объем датасета для работы или нет? Просто в kaggle датасеты содержат несколько сотен тысяч транзакций и их обработка потребует больших затрат времени
- можно было бы вытащить из датасета 10-20 тысяч транзакций и на них провести работы по анализу самих данных и сравнению моделей. С таким датасетом ресурсов потребуется меньше, а результаты все-равно покажут определенную динамику и качество моделей
- при анализе данных можно получить html файл со следующей информацией:
- Сводка по основным характеристикам: типы, уникальные значения, пропущенные значения.
- Статистика квантилей: минимальное и максимальное значения, Q1, медиана, Q3, межквартильный диапазон.
- Описательные статистические данные: среднее значение, мода, стандартное отклонение, среднее абсолютное отклонение, коэффициент вариации, коэффициенты асимметрии и эксцесса.
- Наиболее частые значения.
- Гистограмма.
- Корреляции для высоко коррелированных переменных, матрицы корреляции Спирмена, Пирсона и Кендалла.
- Отсутствующие значения: матрица, счетчик, тепловая карта и дендрограмма отсутствующих значений.посмотрите картинки во вложении





-
Current freelance projects in the category AI & Machine Learning
Integration of the analytics system with the Database in Tables
112 USD
The current analytics system needs to be brought to a stable working state. Currently, data from CRM, telephony, and advertising accounts is pulled through Supabase via MSP into Google Sheets, but some processes still require manual control. This needs to be eliminated.1.… AI & Machine Learning, Bot Development ∙ 12 hours 44 minutes back ∙ 22 proposals |
Write meta data for ALT using AIA website on Laravel, the site has many images for which it is necessary to automatically generate correct semantic and relevant ALT descriptions for the images, with the possibility of verification. AI & Machine Learning, PHP ∙ 18 hours 44 minutes back ∙ 28 proposals |
N8n - automation of processing requests for an online store on Shopify
45 USD
I'm looking for an n8n specialist to build a workflow that automatically processes incoming customer inquiries for our Shopify store: classifies them, pulls order data from Shopify, and routes to the correct action (auto-response, ticket, team notification). What needs to be… AI & Machine Learning ∙ 1 day 17 hours back ∙ 22 proposals |
Need to create a bot in Telegram with an AI assistant.A bot needs to be created that will make deepfakes through an API service connected for deepfakes (face or photo alteration). AI & Machine Learning, AI Consulting ∙ 1 day 20 hours back ∙ 26 proposals |
I am looking for a person who can help me understand Vibe coding.
22 USD
I need a person for ongoing consultations in VibeCoding, I am interested in pursuing this direction as a hobby. But I need a coach who can show and advise me on what works and how. AI & Machine Learning ∙ 1 day 22 hours back ∙ 21 proposals |