Zbiór danych zagrożeń w cyberbezpieczeństwie
Ten zbiór danych przedstawia szczegółowy widok globalnych zagrożeń i incydentów związanych z cyberbezpieczeństwem. Zawiera różne atrybuty, takie jak źródła ataków, typy, zaangażowane kraje, wpływ finansowy i mechanizmy obronne. Dane zostały wzbogacone o dodatkowe cechy, aby wspierać zaawansowane analizy i zadania uczenia maszynowego.
1-Nazwa pliku: cyber_security_threats.csv
2-Źródło: Kaggle
3-Wiersze: (3000)
4-Kolumny: 13
##Narzędzia użyte: 1-Python (Pandas, Matplotlib, Seaborn), Power BI
##Status: Oczyszczone, analizowane i wizualizowane
##Cechy
Opis cechy
1-źródło_ataku Pochodzenie lub inicjator ataku (np. botnet, złośliwe oprogramowanie, insider). 2-typ_ataku Typ cyberataku (np. DDoS, phishing, ransomware). 3-kraj Kraj, w którym atak został zainicjowany lub zgłoszony. 4-mechanizm_obronny Metoda użyta do złagodzenia lub odpowiedzi na atak. 5-strata_finansowa Szacunkowa strata finansowa spowodowana atakiem (USD). 6-czas_rozwiązania_incydentu Czas potrzebny na rozwiązanie incydentu (w godzinach lub dniach). 7-liczba_dotkniętych_użytkowników Liczba użytkowników dotkniętych atakiem. 8-typ_wrażliwości_bezpieczeństwa Wykorzystana podatność (np. SQL injection, zero-day, błędna konfiguracja). 9-branża_docelowa Branża dotknięta (np. finanse, opieka zdrowotna, edukacja). 10-rok Rok wystąpienia. 11-poziom_zagrożeń (Dodane) Niestandardowo obliczony poziom zagrożenia (np. Niski, Średni, Wysoki). 12-ataki_na_kraj (Dodane) Zsumowana liczba ataków na kraj.
##Przykłady zastosowań
1-Analiza eksploracyjna danych (EDA)
2-Analiza trendów zagrożeń cyberbezpieczeństwa na przestrzeni lat
3-Modelowanie predykcyjne strat finansowych lub czasu rozwiązania
4-Klasteryzacja na podstawie poziomów zagrożeń lub regionów
5-Dashbordy wizualizacyjne (Power BI, Tableau itp.)
6-Analiza ryzyka cyberbezpieczeństwa
7-Dashbordy opowiadające historie danych
8-Doświadczenia z uczeniem maszynowym (np. przewidywanie strat finansowych)
9-Profilowanie zagrożeń korporacyjnych
##Zbiór danych został oczyszczony i przetworzony przy użyciu Pythona, w tym:
1-Zarządzanie brakującymi wartościami
2-Inżynieria cech (poziom_zagrożeń, ataki_na_kraj)
3-Konwersje typów danych
4-Analiza eksploracyjna danych przy użyciu Matplotlib i Seaborn
##Wizualizacja
Przetworzony zbiór danych został zaimportowany do Power BI w celu stworzenia interaktywnego dashboardu. Kluczowe wizualizacje obejmowały:
1-Rozkład zagrożeń według kraju i branży
2-Roczne trendy typów ataków
3-Analiza strat finansowych według poziomu zagrożenia
4-Top 10 najbardziej wrażliwych krajów i branż
##Przykładowe spostrzeżenia
1-Top 5 krajów z największą liczbą cyberataków
2-Najczęstsze typy ataków w branży finansowej
3-Korelacja między poziomem zagrożenia a stratami finansowymi
4-Roczny wzrost ataków ransomware
1-Nazwa pliku: cyber_security_threats.csv
2-Źródło: Kaggle
3-Wiersze: (3000)
4-Kolumny: 13
##Narzędzia użyte: 1-Python (Pandas, Matplotlib, Seaborn), Power BI
##Status: Oczyszczone, analizowane i wizualizowane
##Cechy
Opis cechy
1-źródło_ataku Pochodzenie lub inicjator ataku (np. botnet, złośliwe oprogramowanie, insider). 2-typ_ataku Typ cyberataku (np. DDoS, phishing, ransomware). 3-kraj Kraj, w którym atak został zainicjowany lub zgłoszony. 4-mechanizm_obronny Metoda użyta do złagodzenia lub odpowiedzi na atak. 5-strata_finansowa Szacunkowa strata finansowa spowodowana atakiem (USD). 6-czas_rozwiązania_incydentu Czas potrzebny na rozwiązanie incydentu (w godzinach lub dniach). 7-liczba_dotkniętych_użytkowników Liczba użytkowników dotkniętych atakiem. 8-typ_wrażliwości_bezpieczeństwa Wykorzystana podatność (np. SQL injection, zero-day, błędna konfiguracja). 9-branża_docelowa Branża dotknięta (np. finanse, opieka zdrowotna, edukacja). 10-rok Rok wystąpienia. 11-poziom_zagrożeń (Dodane) Niestandardowo obliczony poziom zagrożenia (np. Niski, Średni, Wysoki). 12-ataki_na_kraj (Dodane) Zsumowana liczba ataków na kraj.
##Przykłady zastosowań
1-Analiza eksploracyjna danych (EDA)
2-Analiza trendów zagrożeń cyberbezpieczeństwa na przestrzeni lat
3-Modelowanie predykcyjne strat finansowych lub czasu rozwiązania
4-Klasteryzacja na podstawie poziomów zagrożeń lub regionów
5-Dashbordy wizualizacyjne (Power BI, Tableau itp.)
6-Analiza ryzyka cyberbezpieczeństwa
7-Dashbordy opowiadające historie danych
8-Doświadczenia z uczeniem maszynowym (np. przewidywanie strat finansowych)
9-Profilowanie zagrożeń korporacyjnych
##Zbiór danych został oczyszczony i przetworzony przy użyciu Pythona, w tym:
1-Zarządzanie brakującymi wartościami
2-Inżynieria cech (poziom_zagrożeń, ataki_na_kraj)
3-Konwersje typów danych
4-Analiza eksploracyjna danych przy użyciu Matplotlib i Seaborn
##Wizualizacja
Przetworzony zbiór danych został zaimportowany do Power BI w celu stworzenia interaktywnego dashboardu. Kluczowe wizualizacje obejmowały:
1-Rozkład zagrożeń według kraju i branży
2-Roczne trendy typów ataków
3-Analiza strat finansowych według poziomu zagrożenia
4-Top 10 najbardziej wrażliwych krajów i branż
##Przykładowe spostrzeżenia
1-Top 5 krajów z największą liczbą cyberataków
2-Najczęstsze typy ataków w branży finansowej
3-Korelacja między poziomem zagrożenia a stratami finansowymi
4-Roczny wzrost ataków ransomware