Нейросеть AlphaStar одолела профессиональных игроков в StarCraft II

Аватар пользователя Tima_bes

Программа AlphaStar, разработанная DeepMind, смогла обыграть двух профессиональных игроков в стратегию в реальном времени StarCraft II. Каждого из игроков-людей нейросеть победила в пяти матчах. Описание работы программы доступно на сайте DeepMind, а посмотреть на AlphaStar в деле можно на YouTube.

Для обеих частей StarCraft уже достаточно давно разрабатываются боты и даже проводятся соревнования подобных программ, однако до сих пор таким алгоритмам не удавалось победить человека. Дело в том, что несмотря на победу программы AlphaGo в настольной игре го (которая долгое время считалось слишком сложной для машин) со стратегией в реальном времени все обстоит иначе — это игра с закрытой информацией, в которой нужно решать большое количество задач одновременно. Компания Blizzard объявила о создании открытого API для StarCraft II еще летом 2017 года, но с тех пор заметного прогресса почти не было — даже нейросеть, разработанная DeepMind, долгое время не могла показать блестящего результата и проигрывала легкому уровню сложности встроенных алгоритмов.

Теперь компания DeepMind (входит в состав холдинга Alphabet) продемонстрировала, что их новая программа AlphaStar способна обыграть профессиональных игроков. При создании AlphaStar использовался метод глубокого обучения с подкреплением, а также обучение с учителем, в качестве тренировочного датасета разработчики использовали предоставленные компанией Blizzard анонимизированные записи игр настоящих людей. Обученная на этих играх нейросеть научилась побеждать встроенные алгоритмы StarCraft II на самой высокой сложности в 95 процентах случаев, после чего специалисты DeepMind заставили программу играть с самой собой. Разработчики отмечают, что сначала в «лиге AlphaStar» доминировал раш — тактика быстрой победы путем строительства большого количества сравнительно дешевых юнитов. Однако затем нейросеть научилась бороться с такими атаками и начала делать упор в том числе и на экономическое развитие. Всего на «лигу AlphaStar» ушло 14 дней игры агентов друг с другом, что эквивалентно 200 годам игры в StarCraft II.

 

Сначала нейросеть выиграла пять матчей из пяти против TLO (Дарио Вунш, Германия), а затем другая версия нейросети победила пять раз подряд игрока MaNa (Гжегож Коминч, Польша). Оба профессионала входят в сотню сильнейших игроков в StarCraft II. Интересно, что средний APM (количество действий в минуту) нейросети оказался значительно меньше, чем у ее противников.

8c4e55dfb73064e1b4eaad4c84e5f343.png

 

Стоит отметить что все же небольшое преимущество у AlphaStar было — несмотря на то, что туман войны закрывал карту для нейросети так же, как и для человека, программа получала для обработки не частичное изображение известной области (условный экран), а видела сразу все, что позволяет увидеть игра. Благодаря этому нейросети не приходилось постоянно переключаться между разными зонами карты для контроля за происходящим. Когда же для еще одного демонстрационного матча с MaNa разработчики заставили AlphaStar играть с обычным ограничением масштаба видимой области, то нейросеть проиграла человеку. Правда, в DeepMind отмечают, что самостоятельно двигающая камеру версия программы обучалась в «лиге AlphaStar» всего семь дней.

Первая часть StarCraft тоже представляет собой сложную задачу даже для методов глубокого обучения. Так, в октябре 2017 года своего бота для этой игры представила компания Facebook, и он оказался слабее программ, созданных программистами-любителями. Специалистам из Alibaba Group и Университетского колледжа Лондона удалось научить свою программу неплохому уровню микроконтроля юнитов при ведении боя, но на полноценную игру их разработка все еще не способна.

Автор: Николай Воронцов

 

Авторство: 
Копия чужих материалов
Комментарий автора: 

 Ещё одна знаковая дата в истории машинного обучения.  Без преувеличения 

Комментарии

Скрытый комментарий Повелитель Ботов (без обсуждения)
Аватар пользователя Повелитель Ботов

Годный срач. Ахтунг - пахнет трольчатиной! Автор, нет ли в обсуждении упырей? Сим повелеваю - внести запись в реестр самых обсуждаемых за день.

Комментарий администрации:  
*** Это легальный, годный бот ***
Аватар пользователя Александр Беккер

прям планирование войны. 

стратегия будет отличной судя по всему. 

Аватар пользователя Корректор
Корректор(7 лет 1 месяц)

Однако затем нейросеть научилась бороться с такими атаками и начала делать упор в том числе и на экономическое развитие. Всего на «лигу AlphaStar» ушло 14 дней игры агентов друг с другом, что эквивалентно 200 годам игры в StarCraft II.

Вот в этой фразе и все описание будущего развития работ в области ИИ. Все дело в том, что пока ИИ работает в имитации ракльного мира, в плоскости условной задачи, пусть и динамической задачи, обучение получается значительно быстрее человека. Но стоит только начать прямое взаимодействии ИИ с реальным динамически меняющимся миром, и тут же срок обучения превратится в годы, столетия и тысячелетия. Срок обучения до "сильного ИИ", даже если не трогать вопрос "архитектуры", сразу станет сравнимым со всей человеческой историей. Но это конечно не исключает эффектную симуляцию. И несмотря на "незначительную" разницу между человеческим разумом и "сильным ИИ" разница принципиально. Только вопрос времени когда в симуляции возникнет фатальная ошибка расхождения с реальностью.

Не все так радужно с ИИ. Несмотря на очевидные успехи. Но для решения простых задач с ограниченными условиями его действительно более чем достаточно.

Аватар пользователя Музыкант
Музыкант(8 лет 8 месяцев)

Не надо забывать, что для обучения нейросети постоянно нужен опытный и умный человек.

Это всё сказки что "дали нейросети записи" и она сама сообразила. Нет.

Вон, автопилоты для автомобилей давно учат, а результатов пока никаких (если не считать теслы, которая снесла водятлу башку, затащив его под прицеп).

Потому что на одних чужих записях не научишься.

Чтобы научиться водить - нужно самому крутить руль. и жать педали.

Это во-первых.

А во-вторых - то самое: опытный человек должен постоянно контролировать обучение. Иначе дура машина непременно научится нехорошему.smiley

Комментарий администрации:  
*** Отключен (В России народ не тот - поэтому большевики смогли прорваться к власти, сумев сагитировать только отсталых обезьян (с)) ***
Аватар пользователя valeryma
valeryma(9 лет 6 месяцев)

Самое интересное в Старкрафте (если сам не играешь, а только смотришь) - зайти на ладдер и напроситься наблюдателем на матч )) Вот где настоящая игра ))

К футболу это также относится ))

Аватар пользователя Музыкант
Музыкант(8 лет 8 месяцев)

Осталось похвастаться победами в Call of Duty и Battlefield. А, ещё и в Doom!smiley

 

Комментарий администрации:  
*** Отключен (В России народ не тот - поэтому большевики смогли прорваться к власти, сумев сагитировать только отсталых обезьян (с)) ***
Аватар пользователя Музыкант
Музыкант(8 лет 8 месяцев)

На каждую хитрую гайку найдётся болт с резьбой.

А вот та самая запись матча ИИ с человеком:

https://www.youtube.com/watch?v=AmKeRAb1jVQ

Комментарий администрации:  
*** Отключен (В России народ не тот - поэтому большевики смогли прорваться к власти, сумев сагитировать только отсталых обезьян (с)) ***
Аватар пользователя Alex Arx
Alex Arx(8 лет 3 месяца)

 

Ухх... Насколько же упрямы и тупы могут быть некоторые люди! Ну, хорошо. Представьте себе толстую белую американку, сидящую перед телевизором и жрущую попкорн. Ага, блондинку. У кого из вас повернётся язык назвать это существо разумным?

Оно же полностью во власти нейролингвистического программирования, которое потоком льётся в его глаза и уши с экранов ТВ и макбука, а также айфона и айпада. Все мысли и реакции этого существа можно просчитать на много ходов вперёд, настолько они примитивны и предсказуемы.

Что, это нетолерантно и неполиткорректно? Ах, ты, боже ж ты мой! Ну, как жи, как жи, ведь, ты этого достойна! Ты достойна пожирать самую полезную пищу и запивать её диетической кока-колой без сахара, ага, и толстеть, толстеть, толстеть. А негры в Африке будут умирать, умирать, умирать, ага, от голода.

Нет ли здесь излишнего и пошлого антропоцентризьму, поставившего человека в центр Вселенной? И провозгласившему человека венцом творения, ага, и царём природы. Которому позволено делать всё, что он пожелает. Позволено убивать и разрушать. Ну как жи, ведь, ты этого достоин! Ведь, ты потребитель, а потребитель это звучит гордо!

Тьфу, плюнуть и растереть. Куда привёл западную цивилизацию гуманизм, мы уже имели возможность увидеть. Он привёл в пидарастический тупик, где вовсю резвятся пидарасы, трансгендеры и педофилы, охраняемые ювенальной юстицией. В эту славную кампанию, полагаю, можно с полным правом записать и фашистов с нацистами. Ой, да чё уж там, и банкиров с их ссудным процентом, ага, до кучи.

Кстати, а кто сказал, что сознание обходится без квантовых эффектов? Без квантовой суперпозиции, без квантовой нелокальности, без квантовой запутанности, в конце-то концов, а? Вот, вот где лежат неизрасходованные, так сказать, резервы и залежи, панимашь... Так что, нас впереди ожидают великие дела и свершения.)

Аватар пользователя valeryma
valeryma(9 лет 6 месяцев)

Не так давно в интернете появился сервис онлайн переводов DeepL. В отличие от Google Translate, основанном на статистическом подборе и переборе вариантов перевода, DeepL позиционируется создателями как "интеллектуальная система". И совсем-совсем недавно в этот инструмент был добавлен русский язык.

Я пока не пробовал, но непременно проверю при случае.

Но с испанского на английский он выдал вполне вменяемый текст, потребовавший очень незначительной подчистки.

Страницы