Почему компьютер побеждает в го: анализ происходящего

Аватар пользователя glohaust

В предыдущей теме https://aftershock.news/?q=node/380514  разгорелись не шуточные страсти и споры по поводу победы машины над человеком. Поэтому решил дополнить материал. 

После того, как несколько недель назад компьютер впервые в истории победил человека в го, аналогичные победы пошли «чередой». Буквально на днях корейского профессионала Ли Седоля дважды подряд обыграла программа AlphaGo от Google. Специалист по истории и теории игр Дмитрий Скирюк предлагает разобраться, почему нерушимая стена го внезапно осыпалась.

Итак, первые две встречи между корейским профессионалом го (бадук) Ли Седолем (девятый про-дан Корейской ассоциайии бадук) и компьютерной программой AlphaGo принесли сразу несколько маленьких сенсаций.

Во-первых, Ли Седоль проиграл обе партии. Сдал без доигрывания (что в го не является чем-то позорным, а просто показывает, что разрыв в счёте оказался настолько велик, что доигрывание не имеет смысла).

Во-вторых, сразу несколько профессионалов отметили, что программа играет вполне по-человечески, то есть происходит именно то, на что не были способны практически все компьютерные программы прошлого. Фан Хуэй, чемпион Европы, всухую проигравший AlphaGo прошлый матч, признавался потом, что у него возникло полное ощущение, что против него играет человек, довольно сильный мастер со своим специфическим «почерком», а это дорогого стоит.

Первую партию Ли Седоль играл чёрными и держался очень уверенно, играл агрессивно и нестандартно: сразу начал делать дебютные ходы, которых нет в базе данных и справочниках по фусэки (дебютным построениям), видимо, надеясь спровоцировать компьютер на ошибку или запутать его, однако «нейросеть» сработала в плюс и машина стойко продержалась до середины партии.

К середине игры Ли Седоль пришёл в достаточно крепкой позиции, ничто не предвещало катастрофы, как вдруг последовало мощное вторжение белых в пункт R10 — ход, уже сегодня ставший легендарным. Для тех, кто не в теме: если вы нашли белый «треугольник» в середине правой стороны доски, то этот камень — самый верхний его уголок, смотрите и трепещите: отсюда пришло поражение. Никто его не предвидел. Это было как гром среди ясного неба. По силе воздействия на гошное сообщество он сравним со знаменитым «ходом красных ушей» Хонимбо Досаку. В комментариях кто-то из любителей написал, что в этот момент должна была грянуть тревожная тема и крупным планом показано лицо ошарашенного Ли Седоля. Фактически этот ход просто «схлопнул» большую часть территории на правой стороне доски, после чего отставание чёрных по очкам стало слишком велико, сократить разрыв корейский мастер не смог и сдался.

Вторую, вчерашнюю партию Ли Седоль играл белыми, и причины проигрыша ещё предстоит отыскать. На мой взгляд (а я игрок довольно слабый, даже не средний), корейский профессионал отдал машине непозволительно много территории вверху, надеясь компенсировать разницу активной игрой в других зонах, однако произошло несколько взаимных вторжений, взаимный отъём территории, в результате чего в центре доски очков почти не осталось. Были интереснейшие моменты, скажем, блистательная игра Ли Седоля, который всё-таки перехитрил компьютер: то, как он «вытащил» застрявшие 6 камней в середине доски, войдёт в хрестоматии. В этот раз спешки не было. Оба соперника израсходовали основное время партии и доигрывали на бейоми (дополнительных периодах) — сперва человек, затем компьютер. И всё равно белым не удалось компенсировать отставание — недобрав примерно 7 очков, Ли Седоль снова сдал партию.

Думаю, больше всего радуется происходящему Фан Хуэй, на которого после проигрыша обрушился шквал насмешек и критических ударов — мол, и играл-то он слабо, и ошибки делал, и вообще игрок не очень сильный, азиатским профессионалам не чета… Ну что ж, чемпион Европы уже сейчас может выдохнуть, встать и сказать: «Ну что, видели? Поняли теперь, что у меня не было шансов?»

Для меня как для писателя-фантаста и любителя го эти события имеют огромное значение. Машина побеждает человека в самой нелогичной, самой «человеческой» игре — это уже огромное достижение на пути к искусственному интеллекту. Но я бы хотел обратить внимание на другое.

Большинство игроков, комментаторов, зрителей и подписчиков в сетях относятся к программе AlphaGo как к человеку, то есть живому, думающему,мыслящему существу. Её ходы обсуждаются с точки зрения: «Что она хотела сказать этим ходом», в этих ходах видят замыслы и нестандартные планы игры, основанные не на сухой базе данных, а на её же собственных, программных ошибках. Доходит до курьёзов. «Компьютер становится профессионалом в го», — говорят американские комментаторы. А наша соотечественница Наталья Ковалёва (5 дан РФГ), комментируя партию, возвратилась после небольшого перерыва и при анализе пропущенных ходов сказала своему коллеге Илье Шикшину (1 про дан Корейской ассоциации бадук) потрясающую фразу — не помню её дословно, но как-то так: «Подожди, что-то мы быстро всё расставили их и дальше бежим, а надо бы рассмотреть: люди же старались, играли!».

«Люди»! Уже сейчас, независимо от того, выиграет Ли Седоль этот матч или проиграет, мы уже относимся к этому компьютерному малышу, как к человеку, словно в этот компьютер, в глубину этих нейросетей вселился дух го наподобие Фудзивары но Сая из анимэшного сериала. Он пока умеет немного — только играть в го, но делает это уже почти как человек.

В комментариях к одной из своих заметок я в шутку написал: «Когда роботы захватят этот мир, они будут праздновать 9 марта как великий праздник». Сейчас я всерьёз задумываюсь, каким будут компьютеры будущего. Не исключено, что в самом ближайшем времени мы, покупая какую-нибудь очередную Windows-3000, сперва вынуждены будем обучить её тому, как жить в этом сложном мире, подружиться с ней и дать ей понять, что мы ей не враги, а любящие родители. А иначе через несколько десятилетий мы получим на выходе сеть Скайнет.

Мы живём в интересное время. Хочется, чтобы оно не кончалось. Интересно, в какой стране первыми люди выберут компьютерную программу в президенты?

Надо узнать, когда у AlphaGo «день рождения» и послать ему виртуальный тортик с одной свечкой.

Источник

На мой взгляд уже прозвенел опасный звоночек, люди начинают очеловечивать машину просто понаблюдав за игрой. 

Комментарии

Аватар пользователя Tikovka
Tikovka(12 лет 5 месяцев)

Бред - т.к. абстрактного мышления как небыло , так и нет в компутерах. Когда появится, тогда и поговорим.

Аватар пользователя green
green(11 лет 8 месяцев)

А это ничего,что у большинства людей оно практически  отсутствует?

Комментарий администрации:  
*** Матерый зеленый пропагандист - которого поймали на противоречиях в показаниях ***
Аватар пользователя Tikovka
Tikovka(12 лет 5 месяцев)

И с логикой у людей проблеммы тоже . А что делать ))

Аватар пользователя Кот Баюн
Кот Баюн(11 лет 11 месяцев)

Друзья, не с той стороны подходите.

Как не было возможности у компьютера сказать гордое "Контора пишет!" и бросить доску в лицу оппоненту, так и не будет.

Возможность творить.

Аватар пользователя alex_midway
alex_midway(12 лет 9 месяцев)

Вы уверены? Уже есть все возможности перечисленные вами.

Аватар пользователя Safron
Safron(12 лет 7 месяцев)

Если бы человек не обладал эмоциями и не уставал, то вполне возможно, что он обыграл этот компьютер.

Да и вообще, как правильно написали камрады в первой статье: компьютер просто быстрее перебирает варианты, к настоящему интеллекту это отношения не имеет. Просто очень быстрый калькулятор.

Аватар пользователя uzbek
uzbek(11 лет 4 месяца)

Что есть "настоящий интеллект"? :)

Аватар пользователя Safron
Safron(12 лет 7 месяцев)

Настоящий интеллект умеет адаптироваться под новую ситуацию, самообучаться, моделировать, анализировать и прогнозировать.

К примеру на доску добавят новые поля, или как-то минимально изменили правила, скорее всего компьютер не справится с такой задачей (если программисты заранее не заложили в него эту функцию).

Аватар пользователя uzbek
uzbek(11 лет 4 месяца)

Все вышеперечисленное умеет  и компьютер  ( neuro-fuzzy network). В общем то, на самом деле, вся "соль" новости  не в "компьютере" а в математике. Т.е. можно утверждать, что разработаны алгоритмы которые позволяют имитировать человеческое мышление (нечеткую логику, интуицию и т.д.), т.е. это не "тупой перебор вариантов", как раньше.  

Аватар пользователя kulib
kulib(10 лет 11 месяцев)

Нечеткая логика сделана давным давно, хочу заметить. Кучи книг по ней имеются, для реализации в разных средах...

Аватар пользователя green
green(11 лет 8 месяцев)

Настоящий интеллект умеет адаптироваться под новую ситуацию, самообучаться, моделировать, анализировать и прогнозировать.

И какой процент населения в состоянии это делать?

Комментарий администрации:  
*** Матерый зеленый пропагандист - которого поймали на противоречиях в показаниях ***
Аватар пользователя Safron
Safron(12 лет 7 месяцев)

А вы не рассматривайте одного человека, как носителя интеллекта. Посадить его на остров, он отупеет и сдохнет через несколько лет, сгниет и останется от него кучка земли.

А вот группа людей обладает этим самым интеллектом, способны и развиваться, и потомство оставлять.

Аватар пользователя green
green(11 лет 8 месяцев)

Потомство оставлять,это вы сильно задвинули.Очень интеллектуальное занятие.

Комментарий администрации:  
*** Матерый зеленый пропагандист - которого поймали на противоречиях в показаниях ***
Аватар пользователя Safron
Safron(12 лет 7 месяцев)

Компьютеры этого не умеют, в отличие от живых существ.

Аватар пользователя glohaust
glohaust(8 лет 11 месяцев)

Когда научатся люди станут не нужны.

Аватар пользователя kulib
kulib(10 лет 11 месяцев)

Из текста следует, что играла нейросеть. Если программисты не тупые, то самообучение они ей оставили. Так что ввод новых правил или изменение поля - не сильно ей навредит.

 

Вообще, прелесть нейросетей в том, что они обучаемые (поправка. Для своей работы их НАДО обучать). А партии в Го - доступны в записи... Следовательно её можно обучать на партиях великих чемпионов...

Аватар пользователя iStalker
iStalker(12 лет 9 месяцев)

Вот только играл алгоритм, который использовал нейросеть специально спроектированную под игру го.

Давайте представим что в игре го внезапно изменилось всего одно небольшое правило.

Первый же вопрос возникает: как это изменение в правилах будет "сообщено" программе? Заданы ли в ней правила хардкодом или же описываются с помощью DSL (языка предметной области) ?

При первом варианте можно смело сказать этой программе до свидания - это даже близко не ИИ.

При втором варианте смотрим дальше: как быстро нейросеть будет перестроена? Что-то мне подсказывает, что человек приспособится к этому изменению буквально за 2-3 партии, а вот для обучения нейросети может понадобиться тысячи и тысячи партий. Вот это и будет реальным показателем интеллекта, а не выйгрыш над чемпионом.

 

Но к сожалению такой эксперимент вряд ли будет проведен.

Аватар пользователя kulib
kulib(10 лет 11 месяцев)

Видимо, вы никогда не работали с нейросетями. Правда я не имею очень глубоких знаний о них.

Поэтому, прошу Вас немного подождать, пока я пообщаюсь со специалистом, работающим с ними довольно давно и имеющий большой опыт практической реализации нейросетей.

Аватар пользователя ek-nfn
ek-nfn(12 лет 1 месяц)

Почему компьютер побеждает в го

и где ответ ?

Аватар пользователя razgelday
razgelday(9 лет 3 дня)

Каспарова как то спросили, как ему удалось обыграть комп, он сказал, что сразу исходил из того, что комп считает лучше и быстрее, потому поставил себе задачу не выиграть, а привести партию к определённой позиции. Т.е. для того, чтобы обыграть машину, надо ставить задачи, которые выходят за рамки конкретной игры, и напрямую с победой не связаны. Возможно, в скором времени появятся особый вид спортсменов, которые будут играть только с компами.

Аватар пользователя Greathand
Greathand(11 лет 6 месяцев)

Смотрел сюжет по ящикк, как восхваляли "умный" компутер, а из разъяснения стало ясно (не проверял), что машина банально перебирает "чемпионские" варианты по скртптам с огромной скоростью и на пару сотен шагов вперед. Же юс цирк!

имхо, якобы интуитивный поиск - не более чем вброс рэндомных вариантов в рамках возможного (еще бы не взлетело, когда они все скопинованы с лучших запией игроков)

Комментарий администрации:  
*** Я что-​то не вижу признаков фашизма в Украине больше, чем в России (с) ***
Аватар пользователя tuk
tuk(9 лет 6 месяцев)

AlphaGo перебирает не на сотни ходов вперед, а ровно до конца партии (до конечной позиции), в этом суть переборного алгоритма mtsc (UCT) который в ней используется.

Естественно никаких "чемпионских" вариантов нет. При выборе каждого хода в партии наигрываются случайные партии "до результата", и делается ход который имеет лучшую статистику (больший процент побед). При выборе каждого хода в процессе наигрывания партий используется уже собранная статистика, и миксуется с оценкой позиции (после хода). Взрывной рост силы AlphaGo произошел в результате того, что оценку позиции она получает лучше остальных программ.

Для оценки позиции она использует нейросети. Обучаются нейросети не на базе человеческих партий, а в результате партий программы самой с собой.

"Лучшие записи игроков" в программе не используются нигде, окромя возможно небольшой дебютной книги. Которая на силе программы особо не сказывается.

 

Аватар пользователя Greathand
Greathand(11 лет 6 месяцев)

Ооо, хорошо объяснили! Спасибо. А то я телевизор понял ровно так, как высказался. Терь хоть картинка нарисовалась, в чём там цимес.

Комментарий администрации:  
*** Я что-​то не вижу признаков фашизма в Украине больше, чем в России (с) ***
Аватар пользователя Бедная Олечка
Бедная Олечка(12 лет 10 месяцев)

Вопрос разбирался ещё тогда, когда Каспаров проиграл Глубокой воде. Человек играет не с компьютером (абсолютно тупая железка) и не с программой, а с командой профессионалов, которые её сочинили, плюс команда чемпионов го, чьи партии анализировались.

Просто Гугель решил сделать себе очередную креативную рекламу.

Аватар пользователя tuk
tuk(9 лет 6 месяцев)

Не используется анализ человеческих партий при написании сильных программ в Го, Шахматы  и т.д.

Аватар пользователя Bred Pitt
Bred Pitt(8 лет 9 месяцев)

Что касается современных шахматных программ, то у чемпиона мира нет никаких шансов. Проиграет 10 партий из 10. Проиграет именно программе, загруженной на абсолютно тупое железо в виде дешёвенького бюджетного ноутбука..)

Комментарий администрации:  
*** Кто же я, как не говно? ***
Аватар пользователя tuk
tuk(9 лет 6 месяцев)

Просто не объяснить. Сами переборные алгоритмы, и mcts, и альфа-бета очень простые. А вот эвристики, оценочная функция, процесс настройки и обучения - они намного сложнее. И в данный момент сложилась очень редкая ситуация когда одна программа на голову сильнее всех остальных.(на сегодняшний день это AlphaGo). Это не просто лучше написали, или лучше настроили, или придумали новый признак в ОФ или новые эвристики - это серьезный прорыв. Который как минимум даст возможность усилить программы и в другие настольные игры, улучшить в принципе AI в играх.

Аватар пользователя vitenok
vitenok(9 лет 11 месяцев)

Подумалось, что игра будет сначала оценивать интеллект игрока, а потом подстраиваться под него. Чтобы имелся смысл играть. 

И все , оказывается, старо как мир - интеллект начинается с игры. 

Комментарий администрации:  
*** отключен (маты, истерики) ***
Аватар пользователя tuk
tuk(9 лет 6 месяцев)

Статистика (математика) говорит о том, что оценить силу соперника можно только по огромному числу партий. Поэтому никто, в том числе и программа, подстроится под силу соперника в матче из пяти партий не в состоянии. В принципе нельзя оценить силу соперника с достаточной достоверностью по пяти партиям. Да и любая подстройка под силу (и стиль) соперника прибавляет слишком мало. Против сильного соперника имеет смысл просто сильно играть, а не подстраиваться под него.

Аватар пользователя tuk
tuk(9 лет 6 месяцев)

https://habrahabr.ru/post/279071/

Простенькое описание основных алгоритмов AlphaGo на русском языке.

Аватар пользователя Дирижёр
Дирижёр(9 лет 4 месяца)

Не прошло и полсотни лет, как британские гугелевские учоные из кожи вон вылезли, но таки научили компьютер играть в тривиальную игрульку, которая придумана 4 тысячи лет назад и с тех пор не менялась...
Даже страшно подумать, сколько времени и усилий им понадобится, чтобы научить компьютер читать и понимать учебники для начальных классов школы.
 


 

Комментарий администрации:  
*** "Большевиков приравниваю к Геббельсу... Сам - дочь сдавшегося в плен расстрелянного петуха" (с) ***