Specyfikacja techniczna
Jest plik z sekwencją składającą się tylko z 0 i 1.
Konieczne jest przeanalizowanie tej sekwencji i próba znalezienia jakichkolwiek wzorców, które pozwolą przewidywać następny symbol lepiej niż losowe zgadywanie.
Przy tym nie stawia się zadania nauczenia się przewidywania każdego następnego symbolu. Jeśli okaże się, że to niemożliwe, wystarczy znaleźć takie powtarzające się wzorce lub stany sekwencji, po których prawdopodobieństwo następnego symbolu jest znacznie wyższe niż 50%.
Na przykład, jeśli po określonej kombinacji symboli następny symbol okazuje się równy 1 w 70–80% przypadków, to taki wzorzec już stanowi interes, nawet jeśli występuje niezbyt często.
Główne zadanie — znaleźć jakiekolwiek wzorce, które można wykorzystać do uzyskania dodatniego oczekiwania matematycznego.
Reguły oceny są bardzo proste:
- poprawna prognoza — +1 punkt;
- niepoprawna prognoza — −1 punkt.
Ostatecznym celem jest zbudowanie modelu lub znalezienie reguły, która na długim dystansie będzie miała dodatnie oczekiwanie matematyczne, to znaczy suma poprawnych prognoz powinna przewyższać sumę niepoprawnych.
Wykonawca samodzielnie wybiera metody badawcze. Mogą to być metody statystyczne, poszukiwanie powtarzających się wzorców, uczenie maszynowe, sieci neuronowe lub jakiekolwiek inne podejścia. Nie należy ograniczać się do standardowych metod — mile widziane są wszelkie pomysły, które mogą pomóc w odkryciu wzorca.
W wyniku pracy należy przedstawić:
- opis znalezionych wzorców (jeśli istnieją);
- opis tego, jakie metody zostały użyte;
- wyniki testowania modelu lub znalezionych wzorców;
- dokładność prognozowania;
- ostateczny wynik według systemu oceny (+1 za poprawną prognozę, −1 za niepoprawną);
- kod źródłowy badania.