Цель проекта:
1) Познакомиться с моделью обучения Reinforcement Learning, узнать о DQN и применить его на практике.

2) Создать нейронную сеть, которая использует алгоритм обучения с подкреплением (Reinforcement Learning Algorithm), чтобы научиться играть в Mario.

На смене мы изучали то, как работают нейронные сети, а также как работает алгоритм DQN (Deep Q-learning), который мы создали, чтобы обучить агента играть в Mario Bros.

При разработке алгоритма, наша команда писала код на Python с использованием библиотеки PyTorch. Конкретно я занимался создание прототипов алгоритма DQN, на основе которых далее была написана версия модели, используемая при обучении агента, а также я писал текст для статьи на Habr и текст для Github’а.
Детали работы
Добавлена 11 июня
45 просмотров
Фрилансер
Владислав Артюхов
 3  0

Свободен для работы Свободен для работы
3 Сейфа завершены
На сервисе 1 год