Новости сегодня - Метод Google для игры в го стал самообучаемым
Обновленная версия алгоритма AlphaGo Zero для игры в го, разработанная подразделением Google DeepMind, способна к самообучению без анализа партий, сыгранных человеком.
Люди новому искусственному интеллекту не нужны даже в качестве наставников.
Программа AlphaGo популярна тем, что первой обыграла профессионального игрока в го без гандикапа на обычной доске 19 х 19. Он может обучать новым задачам без помощи человека.
Новая программа AlphaGo Zero на протяжении нескольких дней освоила старинную китайскую настольную игру го. Ни одной! В отличие от AlphaGo, у Zero всего одна нейросеть вмсто 2-х, но и данного хватило. Ведущий программист AlphaGo Дэвид Сильвер сказал, что в процессе самообучения AlphaGo Zero вначале повторяла модель поведения начинающего, а после этого и опытного игрока в го, однако потом стала исполнять ходы, которые нетипичны для профессиональных игроков. После 3-х дней самостоятельных занятий AlphaGo Zero сыграл с прошлой соей версией AlphaGo и одержал победу с результатом 100 к нулю. В AlphaGo Zero ученые загрузили только правила игры и условия победы, после этого искусственный интеллект в произвольном порядке размещал камни на доске, фиксировал удачные ходы и на основании прошлого опыта вырабатывал успешную стратегию против самого себя. По словам одного из знатоков DeepMind, Ника Хинса, ИИ лучше человека играет в старинную китайскую игру, но в иных областях не блещет: он был создан для решения узкого круга задач.
В DeepMind выделили, что избавили метод от ограничений человеческого разума.