ИИ делает открытия пропущенные учёными

Аватар пользователя GORA - Олег Ладогин

Как рассказывается в научной статье журнала Nature, исследователи из Национальной лаборатории Лоуренса в Беркли, обучили искусственный интеллект используя способ векторного представления слов -  Word2Vec, находить в научных статьях открытия, которые не заметили учёные, паралельно этому ИИ выстроил собственную периодическую систему химических элементов.  

Количество научных публикаций в интернете растёт гиганским образом. По оценкам пятилетней давности, в Интернете было доступно 114 миллионов научных публикаций на английском языке. Ознакомиться со всеми человеку не под силу, на помощь приходит искусственный интеллект.

Исследователи разработали лингвистический алгоритм для оценки слов в 3,3 миллионов научных работ по материаловедению, и ИИ смог построить словарный запас в 500 тысяч слов. Word2Vec использовал машинное обучение для анализа отношений между словами.

Каждое слово представляется в виде набора n чисел (координат). Другими словами, оно становится точкой в n-мерном пространстве. Компьютер вычисляет, как часто те или иные слова встречаются поблизости друг от друга. На этом основании он присваивает им значения координат. Предполагается, что слова с близкими координатами имеют похожий смысл.

Авторы особо подчёркивают, что в программу не было заложено никаких сведений по химии или физике. Все свои "познания" система почерпнула из научных статей.

Используя только слова, найденные в научных работах, алгоритм смог сформулировать такие понятия, как периодическая таблица и химическая структура молекул. Исследователи выяснили, какие координаты в 200-мерном пространстве получило название каждого химического элемента. Спроецировав эту картину на плоскость, они получили некое подобие таблицы Менделеева. Элементы оказались сгруппированы по своей природе: отдельно инертные газы, отдельно щелочные металлы, отдельно двухатомные неметаллы и так далее.

Алгоритм связал слова, которые были найдены близко друг к другу, создавая векторы связанных слов, они помогли ему определить научные понятия. В некоторых случаях слова были связаны с термоэлектрическими понятиями, но никогда не были описаны как термоэлектрические в любой научной работе, которая исследовалась. Этот пробел в знаниях трудно уловить человеческим глазом, но легко обнаружил алгоритм.

Задав поиск названий веществ, по своим координатам максимально близких к слову "термоэлектрик", программа сформировала топ-10 материалов. Оказалось, что у всех отобранных веществ эффективность была выше, чем в средняя по всем известным термоэлектрическим соединениям. У материалов из топ-3 она была больше, чем у 95% известных термоэлектриков. Прав ли ИИ на счёт этих материалов покажет время.

Продемонстрировав свою способность предсказывать будущие материалы, исследователи фактически перенесли свою работу в прошлое. Они отбросили последние данные и проверили алгоритм на старых работах, проверяя, сможет ли он предсказать научные открытия до того, как они произошли и снова алгоритм снова сработал.

Исследователи дали для обработки ИИ публикации только до 2009 года и алгоритм смог предсказать один из самых эффективных современных термоэлектрических материалов за четыре года до того, как он был фактически обнаружен в 2012 году.

Это новое применение машинного обучения выходит за рамки материаловедения. Поскольку он не привязан к конкретному научному набору данных, вы можете легко применить его к другим дисциплинам, перепрошив его под литературу любого предмета, которую вам бы хотелось, говорит Ваге Цхитоян, ведущий автор исследования. Другие исследователи уже заинтересовались, желая узнать больше о работе ИИ.

"Этот алгоритм является неконтролируемым и строит собственные связи”, - сказал Цхитоян. "Вы можете использовать это для таких вещей, как медицинские исследования или открытие лекарств “.

Авторство: 
Авторская работа / переводика
Комментарий автора: 

Оцените потенциал междисциплинарных открытий.

И ещё по теме ИИ:

Искусственный интеллект начал понимать языки лучше человека. (та же лингвистическая работа ИИ по формированию понятий)

Искусственный разум обыграл всех лучших игроков в покер.

Комментарии

Аватар пользователя Александр П.
Александр П.(8 лет 3 месяца)

У Менделеева инертные газы были в отдельном нулевом столбике, а после его смерти их тупо совместили с металлами 8 столбца. Получилась чепуха. Первоначальная таблица была логичнее. 

Аватар пользователя vlad02
vlad02(8 лет 5 месяцев)

У Менделеева первые три версии содержали ЭФИР-межвакуумное вещество-вот это было логичноcheeky

Аватар пользователя Gray
Gray(9 лет 8 месяцев)

Как и ожидалось - поиск многомерных корелляций в естественно-языковом тексте - офигенно перспективная вещь. Это за пределами человеческих возможностей и это определённо приносит результаты. 

https://habr.com/ru/post/408541/

Начиная с вот этой статьи было видно что направление выстрелит. 

Аватар пользователя Корректор
Корректор(6 лет 11 месяцев)

Наш язык это и есть многомерная корелляция понятий. :))) Но это совсем не сами понятия.

Аватар пользователя beck
beck(8 лет 8 месяцев)

Вопрос в том, как были сформированы исходные данные. И тут мы можем сильно удивиться... 

Аватар пользователя joho
joho(10 лет 5 месяцев)

и алгоритм смог предсказать один из самых эффективных современных термоэлектрических материалов

алгоритм не мог предсказать материал, поскольку он оперирует лишь с уже написанным текстом. Напротив, он обнаружил, что некоторое название муссируется в некотором контексте больше, чем другие. Не более того. Не обсуждали бы этот материал, и ничего бы "предсказано" не было

Аватар пользователя ВладиславЛ
ВладиславЛ(5 лет 5 месяцев)

Если так то вы правы

 

Комментарий администрации:  
***отключен (антигосударственная пропаганда, систематические набросы) ***
Аватар пользователя tgz
tgz(8 лет 4 месяца)

Интеллект человека тоже искусственный.

Аватар пользователя ИЮЛь Майский

ИИ делает открытия пропущенные учёными

Чудесно. Теперь не надо корпеть в лабораториях, достаточно набрать кучу текстов научных статей и запустить программу.

Что-то это мне напоминает. Ах да, "зачем учиться, всё найду в интернете".

И главное: сделал открытие "между строк", а со стороны авторов "исходников" не должно быть никаких претензий: "это не я, это он (ИИ)".   

Аватар пользователя яГеоргий
яГеоргий(6 лет 7 месяцев)

Автору респект за инфу.

Имхо кол-во информации становится действительно огромным. Часто полезные данные находятся в хламе из ерунды. Если програмно будет возможность искать зерна истины в куче инфы это будет шикарное подспорье. И конечно необходима работа по поиску "общих" междисциплинарных открытий в дисциплинарных. "Рынок" часто под финансовым давлением заставляет опережающими темпами развивать лишь несколько направлений. Остальные могут благодаря таким программам найти полезное и для себя, в своей отрасли. И применить.

Кроме этого думаю можно проследить и выделить наиболее быстрые шаблоны по поиску новых решений на основе ранее полученных данных. Не редко куча ученных идут не эффективными путями. Но часто имхо есть короткий и эффективный. Упорядочить всегда хорошо.

Для нашей страны, имхо конечно, нужна программа которая поможет оценить имеющиеся открытия прикладные. Очень часто прикладные открытия имевшиеся у нас, нашим руководством не оцениваются, а позднее мы закупаем лицензию уже на западе или востоке. В нефте газе так часто было ранее. 

Вообще работа со статданными считаю в сегодняшнем мире всё более нужна. Ибо лишь расчёты могут убедить политиков в глупости их многих затей. 

И этот ресурс - АШ -очень хорош. Но... таких ресурсов мало. И много не будет. Не найдётся много Алексов и Мамомотов и Счетоводов которые будут делать свой труд качественно, как тут, под давлением толпы, к коей себя отношу. 

А значит нужны программы. Безапелляционные. Безэмоциональные. Не позволяющие двойной трактовки. Автором описанная программа имхо хороший шаг в эту сторону.

Аватар пользователя start_p
start_p(5 лет 1 неделя)

А что вы умете по поводу информационного мусора, с какой целью он вносится как в реальный, так и в виртуальный мир ? Какие цели в этом случае преследуются ?

Аватар пользователя яГеоргий
яГеоргий(6 лет 7 месяцев)

В комменте Вашем слово - умете. Оно не ясно. "Имеете"? Это писали? 

Если да то отвечу. Инфо мусор вносят как те кто делает это с умыслом, так и без него, и я то же вношу. С теми кто вносит умышленно всё ведь ясно, прикрытие делают для своей игры, или просто уводят в сторону, нужную заказчику.

С такими как я сложнее. Первое - малая грамотность, но желание высказаться. Второе - малая грамотность и как следствие низкая проработка вопроса, скорые выводы. Третье - различные не верные убеждения. Мне лично второе ближе. Часто кажется, что вопрос понятен и проработан, и имею ответ. Но это не так, и лучший Учитель - Время - меня поправляет всегда. А моё знание о собственной безграмотности помогает мне ошибку найти и принять, и исправить иногда. Но... информация уже есть. И вклад в мусор внесён. 

Первые не страшны. 

Третьи самые сложные. В процессе выдвижения теоремы ими используется данные с ошибкой сразу. На основе выстраивается и доказывается алгоритм и цепь. Которая по сути верна. И докопатся до ошибки можно лишь дойдя до начала.

С другой стороны я к этому отношусь спокойно, к наличию мусора. Дело в том, что для дальнейших шагов Человечеству имхо понадобится разработать алгоритмы для рутинного отсеивания кучи мусора и поиска "форватера". Скажем так - это сдача экзамена Человеком, где экзаменатор задаёт каверзные вопросы.

   Имхо без яркой политизированности и огромных финансовых затратах мы бы уже в "пропасти" задумались об эффективности альтернативной энергетики в сравнении с традиционными. Маск бы стоял в виде памятника в каждом селе, селе без света и тепла. Имхо всё.

Аватар пользователя vlad02
vlad02(8 лет 5 месяцев)

Гоша а как вы смотрите на данные высосанные из пальца, ну или преднамеренно искаженные, для помех конкурентам? Только не надо о мире любви и дружбы вернитесь в реальность. Небольшое искажние данных и вот уже не раскрываются солнечные батареи, аппарат отрубает внешнее управление, ракета на старте сходит с трека - и это все мааааленькие ошибки программирования которые УЖЕ произошли. А в той клоаке которую некоторые  называют миром науки столько дерьма.Вам это британские ученые подтвердят своими исследованиями

 

Аватар пользователя gribulon
gribulon(10 лет 9 месяцев)

Исследователи дали для обработки ИИ публикации только до 2009 года и алгоритм смог предсказать один из самых эффективных современных термоэлектрических материалов за четыре года до того, как он был фактически обнаружен в 2012 году.

Материал - в числе прочих материалов - обсуждали, отрабатывали, и спустя три года его довели до ума. ИИ задним числом обнаружил, что долгая работа выдала результат ))) Круто! Что бы мы без ИИ делали...

UPD: Расшифрую на примере. Шлялись мы как-то по горам, и в непонятном месте три спеца дали три разных направления куда идти. После блуканий по двум направлениям пошли по третьему - и таки вышли. Что бы сказал ИИ выслушав историю? - Что правильный ответ был известен изначально, но его "не заметили". И это замечательно - но к сожалению у нас *тогда* не было абсолютно никаких критериев вычислить правильный путь.

А если коротко: если бы я вчера был таким умным, как моя жена ИИ сегодня.

Аватар пользователя start_p
start_p(5 лет 1 неделя)

Проблема в том, что у ИИ, как и у человека отсутствует Различение. Человеку оно даётся Вседержителем, а ИИ - человеком. Сам по себе ИИ не самодостаточен в получении первичной информации, то есть той, которой у него в обработке до момента её внесения извне не было.

Аватар пользователя 9229
9229(8 лет 1 месяц)

Исследование по большей части - шляпа.

Алгоритм исследовал связи часто встречающихся рядом слов.

Не надо быть гением, чтобы понять, что в статьях про инертные газы, например, гелий, аргон, неон, ксенон и криптон будут часто встречаться рядом, поэтому они и сгруппировались соответственно.

Если натравить такой алгоритм на статьи РЕН-ТВ, то связи будут примерно таковы: Путин - двойник - рептилоиды. Только открытие ли это?

Аватар пользователя Капельмейстер
Капельмейстер(4 года 9 месяцев)

Бессмысленная чепуха.

Комментарий администрации:  
*** Отключен (невменоз) ***
Аватар пользователя Mike1975
Mike1975(5 лет 4 месяца)

Британские ученые останутся без работы.

Аватар пользователя HolyBolt
HolyBolt(7 лет 2 месяца)

Мде, вот так читаешь и понимаешь, что на сайте есть и люди с профильным экономическим образованием, нелегко им.

Я, вот, 3-4 милиарда строк в сутки гружу, но ИИ, по какой-то причине, там не завелся. Сидит несколько человек и зарплату получает. Я им завтра расскажу, надеюсь, что все от смеха не помрут.

Аватар пользователя юрчён
юрчён(11 лет 4 месяца)

Вот будет хохма, когда этот лже ИИ начнёт обрабатывать речь простых незатейливых русских мужиков, где вся поллитра смыслов (в смысле не пол литра !) выражается несколькими словами. 

А это кстати идея, создать новый международный язык состоящий из нескольких слов для быстрого лайт общения на планете Земля, например все глаголы состоят из ну максимум пары слов, существительные тоже, и так далее. Каких то пару дней учёбы и можно разговаривать с такими же знатоками этого лайт языка.

Аватар пользователя givs
givs(11 лет 4 месяца)

Сразу скажу что с глубоким уважением отношусь к самому форуму и самое главное к глубокой смысловой нагрузкой тем которые здесь обсуждаются.

Внимательно прочитал переписку в этой теме и ....удивился...Уважаемые форумчане вопрос по ИИ прост как кусок хозяйственного мыла за рубь двадцать... Схема проста - надо понять как работает система обладающая интеллектом, а единственная на сегодня это мозг человека и некоторых высших животных, и потом повторить её.

Есть гигантский объём флуда в интернете на эту тему,от мозга дельфинов до разумных тараканов, и его нет смысла обсуждать.

Но есть и интересные данные, я подчёркиваю, объективные данные как работает единственная известная нам система обладающая интеллектом...

Хочу предложить интересующимся мнение одного известного в узких кругах специалиста...это доктор биологических наук С.В. Савельев и его лекция, достаточно обзорная, но очень понятная по вопросу ИИ и цифровизации

https://www.youtube.com/watch?v=6qAucF-MVXY

Аватар пользователя Doc_Mike
Doc_Mike(6 лет 2 месяца)

Железяка тупым перебором ищет корреляции "всё влияет на всё на всех уровнях всех систем". Очень интеллектуально.

Потом кожно-мясные тупо пялятся на кучу-малу, выданную железякой, и пытаются из нее вытащить что-нибудь осмысленное.

Ага, вот эта штуковина из кучи имеет некий смысл. Быстренько делаем статью об успехах ИИ, умолчав о горе бессмысленных корреляций, и имеем дальнейшие гранты.

Браво-браво, ИИ торжествует.

В качестве иллюстрации вышесказанного. Амерский банк отказал миллионеру в продлении кредитной карточки, потому что на страничке миллионера в соц. сети в качестве хобби был указан рэп, а рэп статистически достоверно коррелирует с низкой платежеспособностью сами знаете кого.

И это было за несколько лет до того, как Сбербанк попал на несколько ярдов из-за ошибки ИИ уже собственной разработки.

Ну чо, умные учатся на чужих ошибках, дураки на своих, а Греф не учится вообще.

Аватар пользователя Крякодил
Крякодил(9 лет 3 месяца)

Я примерно такую программу использую каждый день в своей профессиональной деятельности. И десятки или сотни тысяч моих коллег используют. Без этой программы современная научная деятельность невозможна. SciFinder Scholar наывается.

Аватар пользователя Rednec
Rednec(5 лет 11 месяцев)

А на егэ его испытывали? На уровне дагестана слабо?

Аватар пользователя Midshipman
Midshipman(5 лет 3 недели)

Мдя, прям секта ИИ какая-то.... Перебор слов -сравнение-выборка, как результат вывод на основе похожести. Выполнение программы по ранее заложенному программером алгоритму - где тут ИИ? И да, легко предсказать то что уже было открыто - алгоритм ведь писался после открытий и соответственно интерпретация полученных результатов вполне очевидна. Но сама прога нормуль для фильтрации научных работ и поиска плагиата в них 

Страницы