Набір даних загроз кібербезпеки
Цей набір даних надає детальний огляд глобальних загроз кібербезпеці та інцидентів. Він включає різні атрибути, такі як джерела атак, типи, залучені країни, фінансовий вплив та механізми захисту. Дані були покращені додатковими функціями для підтримки розширених аналітичних та машинних навчальних завдань.
1-Назва файлу: cyber_security_threats.csv
2-Джерело: Kaggle
3-Рядки: (3000)
4-Стовпці: 13
##Використані інструменти: 1-Python (Pandas, Matplotlib, Seaborn), Power BI
##Статус: Очищено, проаналізовано та візуалізовано
##Функції
Опис функції
1-attack_source Джерело або ініціатор атаки (наприклад, ботнет, шкідливе ПЗ, інсайдер). 2-attack_type Тип кібернападу (наприклад, DDoS, фішинг, програмне забезпечення-вимагач). 3-country Країна, де була ініційована або зареєстрована атака. 4-defence_mechanism Метод, що використовується для пом'якшення або реагування на атаку. 5-financial_loss Оцінений грошовий збиток через атаку (USD). 6-incident_resolution_time Час, витрачений на вирішення інциденту (в годинах або днях). 7-number_of_affected_user Кількість користувачів, на яких вплинула атака. 8-security_vulnerability_type Вразливість, що експлуатувалася (наприклад, SQL-ін'єкція, нульовий день, неправильна конфігурація). 9-target_industry Галузь, що постраждала (наприклад, фінанси, охорона здоров'я, освіта). 10-year Рік виникнення. 11-threats_level (Додано) Користувацький розрахований рівень загрози (наприклад, Низький, Середній, Високий). 12-attacks_per_country (Додано) Загальна кількість атак на країну.
##Випадки використання
1-Дослідження даних (EDA)
2-Аналіз тенденцій загроз кібербезпеці протягом років
3-Предиктивне моделювання фінансових втрат або часу вирішення
4-Кластеризація на основі рівнів загрози або регіонів
5-Візуалізаційні панелі (Power BI, Tableau тощо)
6-Аналіз ризиків кібербезпеки
7-Візуалізаційні панелі для розповіді даних
8-Експерименти з машинним навчанням (наприклад, прогнозування фінансових втрат)
9-Корпоративне профілювання загроз
##Набір даних був очищений і оброблений за допомогою Python, включаючи:
1-Обробка відсутніх значень
2-Інженерія функцій (threats_level, attacks_per_country)
3-Конверсії типів даних
4-Дослідження даних за допомогою Matplotlib & Seaborn
##Візуалізація
Оброблений набір даних був імпортований у Power BI для створення інтерактивних панелей. Основні візуалізації включали:
1-Розподіл загроз за країною та галуззю
2-Щорічні тенденції типів атак
3-Аналіз фінансових втрат за рівнем загрози
4-Топ 10 вразливих країн та галузей
##Приклади висновків
1-Топ 5 країн з найбільшою кількістю кібернападів
2-Найпоширеніші типи атак у фінансовій галузі
3-Кореляція між рівнем загрози та фінансовими втратами
4-Зростання кількості атак програм-вимагачів з року в рік
1-Назва файлу: cyber_security_threats.csv
2-Джерело: Kaggle
3-Рядки: (3000)
4-Стовпці: 13
##Використані інструменти: 1-Python (Pandas, Matplotlib, Seaborn), Power BI
##Статус: Очищено, проаналізовано та візуалізовано
##Функції
Опис функції
1-attack_source Джерело або ініціатор атаки (наприклад, ботнет, шкідливе ПЗ, інсайдер). 2-attack_type Тип кібернападу (наприклад, DDoS, фішинг, програмне забезпечення-вимагач). 3-country Країна, де була ініційована або зареєстрована атака. 4-defence_mechanism Метод, що використовується для пом'якшення або реагування на атаку. 5-financial_loss Оцінений грошовий збиток через атаку (USD). 6-incident_resolution_time Час, витрачений на вирішення інциденту (в годинах або днях). 7-number_of_affected_user Кількість користувачів, на яких вплинула атака. 8-security_vulnerability_type Вразливість, що експлуатувалася (наприклад, SQL-ін'єкція, нульовий день, неправильна конфігурація). 9-target_industry Галузь, що постраждала (наприклад, фінанси, охорона здоров'я, освіта). 10-year Рік виникнення. 11-threats_level (Додано) Користувацький розрахований рівень загрози (наприклад, Низький, Середній, Високий). 12-attacks_per_country (Додано) Загальна кількість атак на країну.
##Випадки використання
1-Дослідження даних (EDA)
2-Аналіз тенденцій загроз кібербезпеці протягом років
3-Предиктивне моделювання фінансових втрат або часу вирішення
4-Кластеризація на основі рівнів загрози або регіонів
5-Візуалізаційні панелі (Power BI, Tableau тощо)
6-Аналіз ризиків кібербезпеки
7-Візуалізаційні панелі для розповіді даних
8-Експерименти з машинним навчанням (наприклад, прогнозування фінансових втрат)
9-Корпоративне профілювання загроз
##Набір даних був очищений і оброблений за допомогою Python, включаючи:
1-Обробка відсутніх значень
2-Інженерія функцій (threats_level, attacks_per_country)
3-Конверсії типів даних
4-Дослідження даних за допомогою Matplotlib & Seaborn
##Візуалізація
Оброблений набір даних був імпортований у Power BI для створення інтерактивних панелей. Основні візуалізації включали:
1-Розподіл загроз за країною та галуззю
2-Щорічні тенденції типів атак
3-Аналіз фінансових втрат за рівнем загрози
4-Топ 10 вразливих країн та галузей
##Приклади висновків
1-Топ 5 країн з найбільшою кількістю кібернападів
2-Найпоширеніші типи атак у фінансовій галузі
3-Кореляція між рівнем загрози та фінансовими втратами
4-Зростання кількості атак програм-вимагачів з року в рік