Поединок AlphaZero против StockFish закончился убедительной победой первого. Понадобилось лишь 4 часа обучения.

Всего через полгода после полной доминации AlphaGo и безоговорочной победы над лучшим игроком в го, в DeepMind (подразделение Google, занимающееся искусственным интеллектом) переключились на шахматы, и уже добились потрясающих результатов.

После четырехчасового обучения (AlphaZero для этого играла 700 тысяч партий сама с собой), программу, работающую по принципам машинного обучения, поставили играть 100 партий против одного из сильнейших компьютерных движков — Stockfish 8.

Поединок закончился без шансов для Stockfish. 28-72-0. 28 побед AlphaZero, 72 ничьих, и ни одной победы Stockfish.  Кроме шахмат, программа также играла в шоги и го, где легко расправилась с текущими чемпионами (даже со своим прародителем, AlphaGo).

Проанализировавшие процесс обучения (подробно описанный в опубликованном докладе) профессиональные игроки в шахматы замечают, что стиль игры AlphaZero больше похож на человеческий, нежели на игру компьютера. Программа чаще принимает стратегические решения, и значительно глубже оценивает позицию на доске.

Любимым дебютом AlphaZero стал ферзевый гамбит. Обучаясь, программа чаще выбирала именно его.

В шахматах наступает новая эра. Классические движки в кратчайшее время уступят пьедестал движкам, основанным на машинном обучении. Это не может не повлиять на шахматную теорию, которая глубоко базируется на оценках позиций классическими движками.


У нас есть группа во «ВКонтакте», твиттер и фейсбук – подписывайтесь, чтобы точно ничего не пропустить.

Больше текстов, новостей и других полезных историй – в нашем Telegram-канале.