Вход на сайт

МЕДИАМЕТРИКА

Облако тегов

Программа за 72 часа сама себя научила играть в шахматы

Аватар пользователя Xexen

Добро пожаловать в новый мир, где рядом с людьми будут жить и развиваться программы и машины.

Студент Мэтью Лаи из Имперского колледжа в Лондоне создал шахматную компьютерную программу Giraffe, которая полностью построена на принципах машинного обучения и не использует вручную настроенные инструменты для анализа партии, пишет портал N+1. Описание программы опубликовано на arXiv.org.

Программа Giraffe обучалась шахматам, играя сама с собой, и за рекордные 72 часа достигла уровня, соответствующего двум верхним процентам рейтинга по версии Международной шахматной ассоциации.

При создании программы ее автор использовал два подхода, которые принципиально отличают Giraffe от других шахматных программ. Во-первых, для оценки позиции на доске алгоритм автоматически отбирал наиболее значимые признаки в ходе игр с самим собой. При этом программа не имела доступа к предварительно заложенным рекомендациям, созданным при помощи шахматных экспертов или на основании анализа большого числа партий.

Во-вторых, в Giraffe был применен качественно новый подход к анализу дерева решений. Обычно в ходе типичной партии может возникнуть огромное число допустимых вариантов хода. Для анализа всех таких вариантов необходимы вычислительные мощности, доступные только на суперкомпьютерах, поэтому, чтобы снизить объем вычислений, алгоритм на каждом ходе анализирует лишь часть дерева решений.

Существующие шахматные программы применяют метод, основанный на максимальной длине ветвей. Например, перед каждым ходом обычная программа анализирует все доступные ветви не далее чем на 10 ходов.

Создатель Giraffe вместо длины ветви использовал значение вероятности того, что данная ветвь приведет к наиболее длинной цепочке ходов. Таким образом, анализировались только те ветви, в которых эта вероятность была выше определенного порога. Применение такого метода объясняется тем, что поиск наилучшего хода предполагает, что противник также выберет наилучший ход, и в результате партия будет продолжаться настолько долго, насколько возможно.

Программа Giraffe обучалась шахматам в течение 72 часов, после чего прошла проверку на специальном наборе из 15000 позиций на доске, в котором все доступные ходы проранжированы от 0 до 10, где 10 соответствует лучшему ходу. По итогам теста программа заняла второе место среди девяти популярных алгоритмов для настольных компьютеров, обнаружив 9641 "правильный" ход из 15000 возможных. Первое место в этом рейтинге заняла программа Stockfish 5, которая нашла 10505 наилучших решений.

По словам Лаи, основная цель разработки Giraffe заключалась в том, чтобы создать программу, способную обучаться независимо от "ручных" настроек или участия экспертов-шахматистов. Предполагается, что обобщенный подход к обучению позволит Giraffe столь же эффективно играть и в другие настольные игры.

Источник

Фонд поддержки авторов AfterShock

Комментарии

Аватар пользователя alexsword
alexsword(6 лет 1 месяц)(18:59:46 / 15-09-2015)

> обнаружив 9641 "правильный" ход из 15000 возможных.

заголовок - дезинформирует, смел. 

Аватар пользователя Xexen
Xexen(3 года 11 месяцев)(19:12:55 / 15-09-2015)

Поменял заголовок.

Комментарий администрации:  
*** Мистер "Сомнительная Копипаста" ***
Аватар пользователя tuk
tuk(2 года 6 месяцев)(19:14:21 / 15-09-2015)

А шахматные программисты то не в курсе....

Что-же было на самом деле. Переборные алгоритмы практически ничем не отличаются от обычных программ. А оценочная функция была сделана по аналогии с оценочной функцией в сильнейших программах в нарды. На основе нейронной сети.

И нетрудно догадаться что программа в итоге обучения кое-как научилась оценивать позицию, но по сравнению "с нормальными" программами естественно оценка намного медленней, и намного хуже.

Предполагается, что обобщенный подход к обучению позволит Giraffe столь же эффективно играть и в другие настольные игры.

Программы в нарды уже давно используют такие-же методы обучения оценочной функции.

Аватар пользователя Xexen
Xexen(3 года 11 месяцев)(19:32:39 / 15-09-2015)

Переборные алгоритмы практически ничем не отличаются от обычных программ.

А что: у нас другие алгоритмы обучения? Мы точно также учимся: либо методом тыка, либо по уже готовым алгоритмам, которые нам выдают учителя, которые нас окружают.

И только набрав достаточно солидный опыт некоторые из нас сами начинают придумывать алгоритмы поведения, изучения, строительства и так далее...

Комментарий администрации:  
*** Мистер "Сомнительная Копипаста" ***
Аватар пользователя tuk
tuk(2 года 6 месяцев)(19:44:31 / 15-09-2015)

Я совсем не понимаю о чем вы. Речь идет о том, что ничего особо нового и интересного для программирования настольных игр в этом движке нет, и большего чем короткой статьи на профильном сайте

https://chessprogramming.wikispaces.com/Giraffe - он недостоин. Интереса этот движок не представляет ни для пользователей, ни для шахматных программистов.

Аватар пользователя Xexen
Xexen(3 года 11 месяцев)(20:30:00 / 15-09-2015)

Я совсем не понимаю о чем вы.

О том, что люди тоже начинают самостоятельно мыслить (придумывать свои алгоритмы решения проблем) далеко не сразу. Они тоже сначала обучаются на своих ошибках, приспосабливаясь к окружающему миру.

Эта программа, как первые шаги ребенка: раз-два ухватился за горячее - закрепился алгоритм,   дернул кота за хвост - получил царапины - опять выработал алгоритм поведения с котом... И так далее.

Дело не в шахматах. Дело во внедрении алгоритмов решений еще незнакомых задач.

Эти программы будут постепенно совершенствоваться

Комментарий администрации:  
*** Мистер "Сомнительная Копипаста" ***
Аватар пользователя tuk
tuk(2 года 6 месяцев)(20:33:48 / 15-09-2015)

Эта программа - не первые шаги. Таких программ прорва. В шахматах их мало по одной причине - в шахматах такой метод настройки ОФ не работает. Получаются совсем слабые программы. И сабж не исключение.

Эта программа не внедряет алгоритмы решения незнакомых задач. Она с помощью нейронной сети подбирает веса признаков в оценочной функции. Ничего больше.

Аватар пользователя Bledso
Bledso(4 года 8 месяцев)(22:00:52 / 15-09-2015)

Угу, все верно. Нейронные сети с оптимизирующими алгоритмами. Ничаво асобливаго.

Жаль, что не указано, на каком компе программа "обучалась" трое суток.

Аватар пользователя Дирижёр
Дирижёр(2 года 3 месяца)(19:22:10 / 15-09-2015)

А вам-то от этого - какая радость? Вы думаете, что капиталисты эту программу приспособят для вашего щастья и подарят вам? Держите карман шире!

Мне кажется, что капиталисты как всегда, купят с потрохами этого юнного гения и он станет пахать над тем, чтобы его программы держали вас в кабале у капиталистов.

Комментарий администрации:  
*** "Большевиков приравниваю к Геббельсу... Сам - дочь сдавшегося в плен расстрелянного петуха" (с) ***
Аватар пользователя Fandaal
Fandaal(2 года 12 месяцев)(19:03:14 / 16-09-2015)

Сегодня досмотрю последнюю серию шведского сериала "Настоящие люди" (Äkta människor) об ИИ.

Неплохой фантастический сериал, но ТОЛЕРАСТИИ в нём столько, что порой подташнивает. То же чувство было при просмотре "Во плоти", хорошая драма, но главный герой-зомби - пидор.

В первом трансгуманисты и роботы, во втором зомби, жравшие мозги - "они такие же, как мы". Пидары уже неинтересны, пипл схавал.

 

Лидеры обсуждений

за 4 часаза суткиза неделю

Лидеры просмотров

за неделюза месяцза год

СМИ

Загрузка...