AlphaGo обучится побеждать в Pitfall и Montezuma’s Revenge. Эти игры требуют воображения, которое, как полагают учёные, присуще только человеку. Именно в этом заключает главная сложность обучения AlphaZero подобным играм.
Разработчики уже «скормили» AlphaZero большой объём структурированной информации о видеоиграх, однако эта система до сих пор не может играть на одном уровне с живыми игроками. Теперь им предстоит научить AlphaZero самостоятельно адаптироваться к различным сценариям и предугадывать дальнейший ход игры.
Ранее разработанная DeepMind система AlphaGo была обучена игре в го и победила чемпиона мира, хотя до недавних пор считалось, что компьютеры на это не способны.
Канал iG в Telegram — t.me/iguides_ru