Analiza amerykańskiego systemu bankowego
Zaprojektowano i wdrożono kompleksowy proces ELT oraz pulpit analityczny w Snowflake w celu analizy historycznego wzrostu, kapitalizacji rynkowej i aktywności rejestracyjnej sektora bankowego w USA, korzystając z zestawu danych FDIC Institutions.
Kluczowe obowiązki i techniczne osiągnięcia:
Architektura danych (ELT): Wyodrębniono surowe dane na poziomie jednostki z rynku Snowflake do warstwy stagingowej, wykonując wszystkie transformacje danych dynamicznie w chmurze magazynu danych.
Modelowanie danych: Zaprojektowano wysoko wydajny schemat gwiazdy, przekształcając surowe dane w centralną tabelę faktów (FACT_BANK_PERFORMANCE) oraz powiązane tabele wymiarów (DIM_BANK_DETAILS, DIM_GEO, DIM_DATE).
Programatyczne generowanie wymiarów: Opracowano ciągły wymiar kalendarza (1900–2050) przy użyciu funkcji generatorów Snowflake (SEQ4(), ROW_NUMBER, DATEADD) w celu rozwiązania luk w szeregach czasowych i umożliwienia dokładnych historycznych JOINów przy użyciu kluczy zastępczych.
Wizualizacja danych i analiza vintage: Opracowano interaktywne pulpity w Snowflake Snowsight. Stworzono analityczne wykresy obok siebie (Wolumen finansowy vs. Aktywność tworzenia banków), aby zilustrować trendy makroekonomiczne, takie jak wpływ kryzysu finansowego z 2008 roku na nowe rejestracje banków i całkowitą akumulację aktywów.
Kluczowe obowiązki i techniczne osiągnięcia:
Architektura danych (ELT): Wyodrębniono surowe dane na poziomie jednostki z rynku Snowflake do warstwy stagingowej, wykonując wszystkie transformacje danych dynamicznie w chmurze magazynu danych.
Modelowanie danych: Zaprojektowano wysoko wydajny schemat gwiazdy, przekształcając surowe dane w centralną tabelę faktów (FACT_BANK_PERFORMANCE) oraz powiązane tabele wymiarów (DIM_BANK_DETAILS, DIM_GEO, DIM_DATE).
Programatyczne generowanie wymiarów: Opracowano ciągły wymiar kalendarza (1900–2050) przy użyciu funkcji generatorów Snowflake (SEQ4(), ROW_NUMBER, DATEADD) w celu rozwiązania luk w szeregach czasowych i umożliwienia dokładnych historycznych JOINów przy użyciu kluczy zastępczych.
Wizualizacja danych i analiza vintage: Opracowano interaktywne pulpity w Snowflake Snowsight. Stworzono analityczne wykresy obok siebie (Wolumen finansowy vs. Aktywność tworzenia banków), aby zilustrować trendy makroekonomiczne, takie jak wpływ kryzysu finansowego z 2008 roku na nowe rejestracje banków i całkowitą akumulację aktywów.