Model ML do prognozowania meczów tenisowych — analiza na żywo współczynnika
Opracowałem i wytrenowałem model uczenia maszynowego do prognozowania wyników meczów tenisowych na podstawie danych historycznych oraz live-quotów bukmacherów.
Na początku przygotowano uporządkowany zbiór danych: historyczne mecze, kursy przed meczem i na żywo, wynik, turniej, zawodnicy, wynik końcowy. Do budowy modelu zastosowano podejście AI/AutoML: testowano różne modele regresyjne i sieci neuronowe, wybierano konfigurację z najlepszą jakością prognozy (prawdopodobieństwa wygranej, dynamika zmiany szans w trakcie meczu).
Dodatkowo opracowałem osobny parser live, który w trybie zbliżonym do rzeczywistego czasu pozyskiwał kursy oraz tymczasowe wyniki bieżącego meczu tenisowego, przekazywał te dane do modelu i uzyskiwał ocenę prawdopodobieństw możliwych wyników zdarzenia. Cały pipeline działał w chmurze: ładowanie danych, wstępne przetwarzanie, inferencja modelu oraz logowanie wyników.
Byłem odpowiedzialny za pełny cykl:
– projektowanie struktury danych i logiki zbierania;
– konfiguracja i trening modeli ML (podejście AutoML, regresja, sieci neuronowe);
– opracowanie live-parsera do kursów i wyników;
– integracja całego rozwiązania w chmurze oraz przygotowanie prognoz z wystarczająco wysoką dokładnością do dalszego wykorzystania w analizie i strategiach.
Wykorzystane technologie: biblioteki ML/AutoML do budowy modeli regresyjnych i sieci neuronowych, środowisko chmurowe do treningu i inferencji, parser danych live (mecze tenisowe, kursy, wyniki), praca ze strukturalnymi zbiorami danych (CSV/format tabelaryczny, Baza Danych).
Na początku przygotowano uporządkowany zbiór danych: historyczne mecze, kursy przed meczem i na żywo, wynik, turniej, zawodnicy, wynik końcowy. Do budowy modelu zastosowano podejście AI/AutoML: testowano różne modele regresyjne i sieci neuronowe, wybierano konfigurację z najlepszą jakością prognozy (prawdopodobieństwa wygranej, dynamika zmiany szans w trakcie meczu).
Dodatkowo opracowałem osobny parser live, który w trybie zbliżonym do rzeczywistego czasu pozyskiwał kursy oraz tymczasowe wyniki bieżącego meczu tenisowego, przekazywał te dane do modelu i uzyskiwał ocenę prawdopodobieństw możliwych wyników zdarzenia. Cały pipeline działał w chmurze: ładowanie danych, wstępne przetwarzanie, inferencja modelu oraz logowanie wyników.
Byłem odpowiedzialny za pełny cykl:
– projektowanie struktury danych i logiki zbierania;
– konfiguracja i trening modeli ML (podejście AutoML, regresja, sieci neuronowe);
– opracowanie live-parsera do kursów i wyników;
– integracja całego rozwiązania w chmurze oraz przygotowanie prognoz z wystarczająco wysoką dokładnością do dalszego wykorzystania w analizie i strategiach.
Wykorzystane technologie: biblioteki ML/AutoML do budowy modeli regresyjnych i sieci neuronowych, środowisko chmurowe do treningu i inferencji, parser danych live (mecze tenisowe, kursy, wyniki), praca ze strukturalnymi zbiorami danych (CSV/format tabelaryczny, Baza Danych).