Почему компьютер побеждает в го: анализ происходящего

0.9K 09:08 - 17/Мар/16 Аккаунт приостановлен

(10 лет 1 месяц)

В предыдущей теме https://aftershock.news/?q=node/380514 разгорелись не шуточные страсти и споры по поводу победы машины над человеком. Поэтому решил дополнить материал.

После того, как несколько недель назад компьютер впервые в истории победил человека в го, аналогичные победы пошли «чередой». Буквально на днях корейского профессионала Ли Седоля дважды подряд обыграла программа AlphaGo от Google. Специалист по истории и теории игр Дмитрий Скирюк предлагает разобраться, почему нерушимая стена го внезапно осыпалась.

Итак, первые две встречи между корейским профессионалом го (бадук) Ли Седолем (девятый про-дан Корейской ассоциайии бадук) и компьютерной программой AlphaGo принесли сразу несколько маленьких сенсаций.

Во-первых, Ли Седоль проиграл обе партии. Сдал без доигрывания (что в го не является чем-то позорным, а просто показывает, что разрыв в счёте оказался настолько велик, что доигрывание не имеет смысла).

Во-вторых, сразу несколько профессионалов отметили, что программа играет вполне по-человечески, то есть происходит именно то, на что не были способны практически все компьютерные программы прошлого. Фан Хуэй, чемпион Европы, всухую проигравший AlphaGo прошлый матч, признавался потом, что у него возникло полное ощущение, что против него играет человек, довольно сильный мастер со своим специфическим «почерком», а это дорогого стоит.

Первую партию Ли Седоль играл чёрными и держался очень уверенно, играл агрессивно и нестандартно: сразу начал делать дебютные ходы, которых нет в базе данных и справочниках по фусэки (дебютным построениям), видимо, надеясь спровоцировать компьютер на ошибку или запутать его, однако «нейросеть» сработала в плюс и машина стойко продержалась до середины партии.

К середине игры Ли Седоль пришёл в достаточно крепкой позиции, ничто не предвещало катастрофы, как вдруг последовало мощное вторжение белых в пункт R10 — ход, уже сегодня ставший легендарным. Для тех, кто не в теме: если вы нашли белый «треугольник» в середине правой стороны доски, то этот камень — самый верхний его уголок, смотрите и трепещите: отсюда пришло поражение. Никто его не предвидел. Это было как гром среди ясного неба. По силе воздействия на гошное сообщество он сравним со знаменитым «ходом красных ушей» Хонимбо Досаку. В комментариях кто-то из любителей написал, что в этот момент должна была грянуть тревожная тема и крупным планом показано лицо ошарашенного Ли Седоля. Фактически этот ход просто «схлопнул» большую часть территории на правой стороне доски, после чего отставание чёрных по очкам стало слишком велико, сократить разрыв корейский мастер не смог и сдался.

Вторую, вчерашнюю партию Ли Седоль играл белыми, и причины проигрыша ещё предстоит отыскать. На мой взгляд (а я игрок довольно слабый, даже не средний), корейский профессионал отдал машине непозволительно много территории вверху, надеясь компенсировать разницу активной игрой в других зонах, однако произошло несколько взаимных вторжений, взаимный отъём территории, в результате чего в центре доски очков почти не осталось. Были интереснейшие моменты, скажем, блистательная игра Ли Седоля, который всё-таки перехитрил компьютер: то, как он «вытащил» застрявшие 6 камней в середине доски, войдёт в хрестоматии. В этот раз спешки не было. Оба соперника израсходовали основное время партии и доигрывали на бейоми (дополнительных периодах) — сперва человек, затем компьютер. И всё равно белым не удалось компенсировать отставание — недобрав примерно 7 очков, Ли Седоль снова сдал партию.

Думаю, больше всего радуется происходящему Фан Хуэй, на которого после проигрыша обрушился шквал насмешек и критических ударов — мол, и играл-то он слабо, и ошибки делал, и вообще игрок не очень сильный, азиатским профессионалам не чета… Ну что ж, чемпион Европы уже сейчас может выдохнуть, встать и сказать: «Ну что, видели? Поняли теперь, что у меня не было шансов?»

Для меня как для писателя-фантаста и любителя го эти события имеют огромное значение. Машина побеждает человека в самой нелогичной, самой «человеческой» игре — это уже огромное достижение на пути к искусственному интеллекту. Но я бы хотел обратить внимание на другое.

Большинство игроков, комментаторов, зрителей и подписчиков в сетях относятся к программе AlphaGo как к человеку, то есть живому, думающему,мыслящему существу. Её ходы обсуждаются с точки зрения: «Что она хотела сказать этим ходом», в этих ходах видят замыслы и нестандартные планы игры, основанные не на сухой базе данных, а на её же собственных, программных ошибках. Доходит до курьёзов. «Компьютер становится профессионалом в го», — говорят американские комментаторы. А наша соотечественница Наталья Ковалёва (5 дан РФГ), комментируя партию, возвратилась после небольшого перерыва и при анализе пропущенных ходов сказала своему коллеге Илье Шикшину (1 про дан Корейской ассоциации бадук) потрясающую фразу — не помню её дословно, но как-то так: «Подожди, что-то мы быстро всё расставили их и дальше бежим, а надо бы рассмотреть: люди же старались, играли!».

«Люди»! Уже сейчас, независимо от того, выиграет Ли Седоль этот матч или проиграет, мы уже относимся к этому компьютерному малышу, как к человеку, словно в этот компьютер, в глубину этих нейросетей вселился дух го наподобие Фудзивары но Сая из анимэшного сериала. Он пока умеет немного — только играть в го, но делает это уже почти как человек.

В комментариях к одной из своих заметок я в шутку написал: «Когда роботы захватят этот мир, они будут праздновать 9 марта как великий праздник». Сейчас я всерьёз задумываюсь, каким будут компьютеры будущего. Не исключено, что в самом ближайшем времени мы, покупая какую-нибудь очередную Windows-3000, сперва вынуждены будем обучить её тому, как жить в этом сложном мире, подружиться с ней и дать ей понять, что мы ей не враги, а любящие родители. А иначе через несколько десятилетий мы получим на выходе сеть Скайнет.

Мы живём в интересное время. Хочется, чтобы оно не кончалось. Интересно, в какой стране первыми люди выберут компьютерную программу в президенты?

Надо узнать, когда у AlphaGo «день рождения» и послать ему виртуальный тортик с одной свечкой.

Источник

На мой взгляд уже прозвенел опасный звоночек, люди начинают очеловечивать машину просто понаблюдав за игрой.

Блог пользователя glohaust | Войдите или зарегистрируйтесь, чтобы отправлять комментарии

Да и вообще, как правильно написали камрады в первой статье: компьютер просто быстрее перебирает варианты, к настоящему интеллекту это отношения не имеет. Просто очень быстрый калькулятор.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(12 лет 7 месяцев)09:44-17/Мар/16

Что есть "настоящий интеллект"? :)

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(13 лет 10 месяцев)10:13-17/Мар/16

Настоящий интеллект умеет адаптироваться под новую ситуацию, самообучаться, моделировать, анализировать и прогнозировать.

К примеру на доску добавят новые поля, или как-то минимально изменили правила, скорее всего компьютер не справится с такой задачей (если программисты заранее не заложили в него эту функцию).

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(12 лет 7 месяцев)10:38-17/Мар/16

Все вышеперечисленное умеет и компьютер ( neuro-fuzzy network). В общем то, на самом деле, вся "соль" новости не в "компьютере" а в математике. Т.е. можно утверждать, что разработаны алгоритмы которые позволяют имитировать человеческое мышление (нечеткую логику, интуицию и т.д.), т.е. это не "тупой перебор вариантов", как раньше.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(12 лет 2 месяца)11:02-17/Мар/16

Нечеткая логика сделана давным давно, хочу заметить. Кучи книг по ней имеются, для реализации в разных средах...

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(12 лет 11 месяцев)10:38-17/Мар/16

Настоящий интеллект умеет адаптироваться под новую ситуацию, самообучаться, моделировать, анализировать и прогнозировать.

И какой процент населения в состоянии это делать?

Комментарий администрации:

*** Матерый зеленый пропагандист - которого поймали на противоречиях в показаниях ***

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(13 лет 10 месяцев)10:49-17/Мар/16

А вы не рассматривайте одного человека, как носителя интеллекта. Посадить его на остров, он отупеет и сдохнет через несколько лет, сгниет и останется от него кучка земли.

А вот группа людей обладает этим самым интеллектом, способны и развиваться, и потомство оставлять.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(12 лет 11 месяцев)11:18-17/Мар/16

Потомство оставлять,это вы сильно задвинули.Очень интеллектуальное занятие.

Комментарий администрации:

*** Матерый зеленый пропагандист - которого поймали на противоречиях в показаниях ***

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(13 лет 10 месяцев)15:26-17/Мар/16

Компьютеры этого не умеют, в отличие от живых существ.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(10 лет 1 месяц)17:51-17/Мар/16

Когда научатся люди станут не нужны.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(12 лет 2 месяца)11:00-17/Мар/16

Из текста следует, что играла нейросеть. Если программисты не тупые, то самообучение они ей оставили. Так что ввод новых правил или изменение поля - не сильно ей навредит.

Вообще, прелесть нейросетей в том, что они обучаемые (поправка. Для своей работы их НАДО обучать). А партии в Го - доступны в записи... Следовательно её можно обучать на партиях великих чемпионов...

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(14 лет 2 недели)11:53-17/Мар/16

Вот только играл алгоритм, который использовал нейросеть специально спроектированную под игру го.

Давайте представим что в игре го внезапно изменилось всего одно небольшое правило.

Первый же вопрос возникает: как это изменение в правилах будет "сообщено" программе? Заданы ли в ней правила хардкодом или же описываются с помощью DSL (языка предметной области) ?

При первом варианте можно смело сказать этой программе до свидания - это даже близко не ИИ.

При втором варианте смотрим дальше: как быстро нейросеть будет перестроена? Что-то мне подсказывает, что человек приспособится к этому изменению буквально за 2-3 партии, а вот для обучения нейросети может понадобиться тысячи и тысячи партий. Вот это и будет реальным показателем интеллекта, а не выйгрыш над чемпионом.

Но к сожалению такой эксперимент вряд ли будет проведен.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(12 лет 2 месяца)12:03-17/Мар/16

Видимо, вы никогда не работали с нейросетями. Правда я не имею очень глубоких знаний о них.

Поэтому, прошу Вас немного подождать, пока я пообщаюсь со специалистом, работающим с ними довольно давно и имеющий большой опыт практической реализации нейросетей.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(13 лет 3 месяца)09:42-17/Мар/16

Почему компьютер побеждает в го

и где ответ ?

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(10 лет 2 месяца)10:10-17/Мар/16

Каспарова как то спросили, как ему удалось обыграть комп, он сказал, что сразу исходил из того, что комп считает лучше и быстрее, потому поставил себе задачу не выиграть, а привести партию к определённой позиции. Т.е. для того, чтобы обыграть машину, надо ставить задачи, которые выходят за рамки конкретной игры, и напрямую с победой не связаны. Возможно, в скором времени появятся особый вид спортсменов, которые будут играть только с компами.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(12 лет 9 месяцев)10:55-17/Мар/16

Смотрел сюжет по ящикк, как восхваляли "умный" компутер, а из разъяснения стало ясно (не проверял), что машина банально перебирает "чемпионские" варианты по скртптам с огромной скоростью и на пару сотен шагов вперед. Же юс цирк!

имхо, якобы интуитивный поиск - не более чем вброс рэндомных вариантов в рамках возможного (еще бы не взлетело, когда они все скопинованы с лучших запией игроков)

Комментарий администрации:

*** Я что-то не вижу признаков фашизма в Украине больше, чем в России (с) ***

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(10 лет 9 месяцев)11:58-17/Мар/16

AlphaGo перебирает не на сотни ходов вперед, а ровно до конца партии (до конечной позиции), в этом суть переборного алгоритма mtsc (UCT) который в ней используется.

Естественно никаких "чемпионских" вариантов нет. При выборе каждого хода в партии наигрываются случайные партии "до результата", и делается ход который имеет лучшую статистику (больший процент побед). При выборе каждого хода в процессе наигрывания партий используется уже собранная статистика, и миксуется с оценкой позиции (после хода). Взрывной рост силы AlphaGo произошел в результате того, что оценку позиции она получает лучше остальных программ.

Для оценки позиции она использует нейросети. Обучаются нейросети не на базе человеческих партий, а в результате партий программы самой с собой.

"Лучшие записи игроков" в программе не используются нигде, окромя возможно небольшой дебютной книги. Которая на силе программы особо не сказывается.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(12 лет 9 месяцев)12:48-17/Мар/16

Ооо, хорошо объяснили! Спасибо. А то я телевизор понял ровно так, как высказался. Терь хоть картинка нарисовалась, в чём там цимес.

Комментарий администрации:

*** Я что-то не вижу признаков фашизма в Украине больше, чем в России (с) ***

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(14 лет 1 месяц)13:33-17/Мар/16

Вопрос разбирался ещё тогда, когда Каспаров проиграл Глубокой воде. Человек играет не с компьютером (абсолютно тупая железка) и не с программой, а с командой профессионалов, которые её сочинили, плюс команда чемпионов го, чьи партии анализировались.

Просто Гугель решил сделать себе очередную креативную рекламу.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(10 лет 9 месяцев)13:36-17/Мар/16

Не используется анализ человеческих партий при написании сильных программ в Го, Шахматы и т.д.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(10 лет 2 недели)13:46-17/Мар/16

Что касается современных шахматных программ, то у чемпиона мира нет никаких шансов. Проиграет 10 партий из 10. Проиграет именно программе, загруженной на абсолютно тупое железо в виде дешёвенького бюджетного ноутбука..)

Комментарий администрации:

*** Кто же я, как не говно? ***

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(10 лет 9 месяцев)13:35-17/Мар/16

Просто не объяснить. Сами переборные алгоритмы, и mcts, и альфа-бета очень простые. А вот эвристики, оценочная функция, процесс настройки и обучения - они намного сложнее. И в данный момент сложилась очень редкая ситуация когда одна программа на голову сильнее всех остальных.(на сегодняшний день это AlphaGo). Это не просто лучше написали, или лучше настроили, или придумали новый признак в ОФ или новые эвристики - это серьезный прорыв. Который как минимум даст возможность усилить программы и в другие настольные игры, улучшить в принципе AI в играх.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(11 лет 2 месяца)22:16-17/Мар/16

Подумалось, что игра будет сначала оценивать интеллект игрока, а потом подстраиваться под него. Чтобы имелся смысл играть.

И все , оказывается, старо как мир - интеллект начинается с игры.

Комментарий администрации:

*** отключен (маты, истерики) ***

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(10 лет 9 месяцев)00:36-18/Мар/16

Статистика (математика) говорит о том, что оценить силу соперника можно только по огромному числу партий. Поэтому никто, в том числе и программа, подстроится под силу соперника в матче из пяти партий не в состоянии. В принципе нельзя оценить силу соперника с достаточной достоверностью по пяти партиям. Да и любая подстройка под силу (и стиль) соперника прибавляет слишком мало. Против сильного соперника имеет смысл просто сильно играть, а не подстраиваться под него.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(10 лет 9 месяцев)13:55-17/Мар/16

https://habrahabr.ru/post/279071/

Простенькое описание основных алгоритмов AlphaGo на русском языке.

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

(10 лет 6 месяцев)11:06-18/Мар/16

Не прошло и полсотни лет, как ~~британские~~ гугелевские учоные из кожи вон вылезли, но таки научили компьютер играть в тривиальную игрульку, которая придумана 4 тысячи лет назад и с тех пор не менялась...
Даже страшно подумать, сколько времени и усилий им понадобится, чтобы научить компьютер читать и понимать учебники для начальных классов школы.

Комментарий администрации:

*** "Большевиков приравниваю к Геббельсу... Сам - дочь сдавшегося в плен расстрелянного петуха" (с) ***

Войдите или зарегистрируйтесь, чтобы отправлять комментарии

Почему компьютер побеждает в го: анализ происходящего

Комментарии

Почему компьютер побеждает в го