Техническое задание
Есть файл с последовательностью, состоящей только из 0 и 1.
Необходимо проанализировать эту последовательность и попытаться найти любые закономерности, которые позволят предсказывать следующий символ лучше, чем случайное угадывание.
При этом не ставится задача научиться предсказывать каждый следующий символ. Если окажется, что это невозможно, достаточно найти такие повторяющиеся паттерны или состояния последовательности, после которых вероятность следующего символа значительно выше 50%.
Например, если после определенной комбинации символов следующий символ оказывается равен 1 в 70–80% случаев, то такой паттерн уже представляет интерес, даже если встречается не очень часто.
Главная задача — найти любые закономерности, которые можно использовать для получения положительного математического ожидания.
Правила оценки очень простые:
- правильный прогноз — +1 балл;
- неправильный прогноз — −1 балл.
Итоговая цель — построить модель или найти правило, которое на длинной дистанции будет иметь положительное математическое ожидание, то есть сумма правильных прогнозов должна превышать сумму неправильных.
Исполнитель самостоятельно выбирает методы исследования. Это могут быть статистические методы, поиск повторяющихся паттернов, машинное обучение, нейронные сети или любые другие подходы. Не стоит ограничиваться стандартными методами — приветствуются любые идеи, которые могут помочь обнаружить закономерность.
В результате работы необходимо предоставить:
- описание найденных закономерностей (если они есть);
- описание того, какие методы были использованы;
- результаты тестирования модели или найденных паттернов;
- точность прогнозирования;
- итоговый результат по системе оценки (+1 за правильный прогноз, −1 за неправильный);
- исходный код исследования.