Как рассказывается в научной статье журнала Nature, исследователи из Национальной лаборатории Лоуренса в Беркли, обучили искусственный интеллект используя способ векторного представления слов - Word2Vec, находить в научных статьях открытия, которые не заметили учёные, паралельно этому ИИ выстроил собственную периодическую систему химических элементов.
Количество научных публикаций в интернете растёт гиганским образом. По оценкам пятилетней давности, в Интернете было доступно 114 миллионов научных публикаций на английском языке. Ознакомиться со всеми человеку не под силу, на помощь приходит искусственный интеллект.
Исследователи разработали лингвистический алгоритм для оценки слов в 3,3 миллионов научных работ по материаловедению, и ИИ смог построить словарный запас в 500 тысяч слов. Word2Vec использовал машинное обучение для анализа отношений между словами.
Каждое слово представляется в виде набора n чисел (координат). Другими словами, оно становится точкой в n-мерном пространстве. Компьютер вычисляет, как часто те или иные слова встречаются поблизости друг от друга. На этом основании он присваивает им значения координат. Предполагается, что слова с близкими координатами имеют похожий смысл.
Авторы особо подчёркивают, что в программу не было заложено никаких сведений по химии или физике. Все свои "познания" система почерпнула из научных статей.
Используя только слова, найденные в научных работах, алгоритм смог сформулировать такие понятия, как периодическая таблица и химическая структура молекул. Исследователи выяснили, какие координаты в 200-мерном пространстве получило название каждого химического элемента. Спроецировав эту картину на плоскость, они получили некое подобие таблицы Менделеева. Элементы оказались сгруппированы по своей природе: отдельно инертные газы, отдельно щелочные металлы, отдельно двухатомные неметаллы и так далее.
Алгоритм связал слова, которые были найдены близко друг к другу, создавая векторы связанных слов, они помогли ему определить научные понятия. В некоторых случаях слова были связаны с термоэлектрическими понятиями, но никогда не были описаны как термоэлектрические в любой научной работе, которая исследовалась. Этот пробел в знаниях трудно уловить человеческим глазом, но легко обнаружил алгоритм.
Задав поиск названий веществ, по своим координатам максимально близких к слову "термоэлектрик", программа сформировала топ-10 материалов. Оказалось, что у всех отобранных веществ эффективность была выше, чем в средняя по всем известным термоэлектрическим соединениям. У материалов из топ-3 она была больше, чем у 95% известных термоэлектриков. Прав ли ИИ на счёт этих материалов покажет время.
Продемонстрировав свою способность предсказывать будущие материалы, исследователи фактически перенесли свою работу в прошлое. Они отбросили последние данные и проверили алгоритм на старых работах, проверяя, сможет ли он предсказать научные открытия до того, как они произошли и снова алгоритм снова сработал.
Исследователи дали для обработки ИИ публикации только до 2009 года и алгоритм смог предсказать один из самых эффективных современных термоэлектрических материалов за четыре года до того, как он был фактически обнаружен в 2012 году.
Это новое применение машинного обучения выходит за рамки материаловедения. Поскольку он не привязан к конкретному научному набору данных, вы можете легко применить его к другим дисциплинам, перепрошив его под литературу любого предмета, которую вам бы хотелось, говорит Ваге Цхитоян, ведущий автор исследования. Другие исследователи уже заинтересовались, желая узнать больше о работе ИИ.
"Этот алгоритм является неконтролируемым и строит собственные связи”, - сказал Цхитоян. "Вы можете использовать это для таких вещей, как медицинские исследования или открытие лекарств “.
Комментарии
У Менделеева инертные газы были в отдельном нулевом столбике, а после его смерти их тупо совместили с металлами 8 столбца. Получилась чепуха. Первоначальная таблица была логичнее.
У Менделеева первые три версии содержали ЭФИР-межвакуумное вещество-вот это было логично
Как и ожидалось - поиск многомерных корелляций в естественно-языковом тексте - офигенно перспективная вещь. Это за пределами человеческих возможностей и это определённо приносит результаты.
https://habr.com/ru/post/408541/
Начиная с вот этой статьи было видно что направление выстрелит.
Наш язык это и есть многомерная корелляция понятий. :))) Но это совсем не сами понятия.
Вопрос в том, как были сформированы исходные данные. И тут мы можем сильно удивиться...
алгоритм не мог предсказать материал, поскольку он оперирует лишь с уже написанным текстом. Напротив, он обнаружил, что некоторое название муссируется в некотором контексте больше, чем другие. Не более того. Не обсуждали бы этот материал, и ничего бы "предсказано" не было
Если так то вы правы
Интеллект человека тоже искусственный.
Чудесно. Теперь не надо корпеть в лабораториях, достаточно набрать кучу текстов научных статей и запустить программу.
Что-то это мне напоминает. Ах да, "зачем учиться, всё найду в интернете".
И главное: сделал открытие "между строк", а со стороны авторов "исходников" не должно быть никаких претензий: "это не я, это он (ИИ)".
Автору респект за инфу.
Имхо кол-во информации становится действительно огромным. Часто полезные данные находятся в хламе из ерунды. Если програмно будет возможность искать зерна истины в куче инфы это будет шикарное подспорье. И конечно необходима работа по поиску "общих" междисциплинарных открытий в дисциплинарных. "Рынок" часто под финансовым давлением заставляет опережающими темпами развивать лишь несколько направлений. Остальные могут благодаря таким программам найти полезное и для себя, в своей отрасли. И применить.
Кроме этого думаю можно проследить и выделить наиболее быстрые шаблоны по поиску новых решений на основе ранее полученных данных. Не редко куча ученных идут не эффективными путями. Но часто имхо есть короткий и эффективный. Упорядочить всегда хорошо.
Для нашей страны, имхо конечно, нужна программа которая поможет оценить имеющиеся открытия прикладные. Очень часто прикладные открытия имевшиеся у нас, нашим руководством не оцениваются, а позднее мы закупаем лицензию уже на западе или востоке. В нефте газе так часто было ранее.
Вообще работа со статданными считаю в сегодняшнем мире всё более нужна. Ибо лишь расчёты могут убедить политиков в глупости их многих затей.
И этот ресурс - АШ -очень хорош. Но... таких ресурсов мало. И много не будет. Не найдётся много Алексов и Мамомотов и Счетоводов которые будут делать свой труд качественно, как тут, под давлением толпы, к коей себя отношу.
А значит нужны программы. Безапелляционные. Безэмоциональные. Не позволяющие двойной трактовки. Автором описанная программа имхо хороший шаг в эту сторону.
А что вы умете по поводу информационного мусора, с какой целью он вносится как в реальный, так и в виртуальный мир ? Какие цели в этом случае преследуются ?
В комменте Вашем слово - умете. Оно не ясно. "Имеете"? Это писали?
Если да то отвечу. Инфо мусор вносят как те кто делает это с умыслом, так и без него, и я то же вношу. С теми кто вносит умышленно всё ведь ясно, прикрытие делают для своей игры, или просто уводят в сторону, нужную заказчику.
С такими как я сложнее. Первое - малая грамотность, но желание высказаться. Второе - малая грамотность и как следствие низкая проработка вопроса, скорые выводы. Третье - различные не верные убеждения. Мне лично второе ближе. Часто кажется, что вопрос понятен и проработан, и имею ответ. Но это не так, и лучший Учитель - Время - меня поправляет всегда. А моё знание о собственной безграмотности помогает мне ошибку найти и принять, и исправить иногда. Но... информация уже есть. И вклад в мусор внесён.
Первые не страшны.
Третьи самые сложные. В процессе выдвижения теоремы ими используется данные с ошибкой сразу. На основе выстраивается и доказывается алгоритм и цепь. Которая по сути верна. И докопатся до ошибки можно лишь дойдя до начала.
С другой стороны я к этому отношусь спокойно, к наличию мусора. Дело в том, что для дальнейших шагов Человечеству имхо понадобится разработать алгоритмы для рутинного отсеивания кучи мусора и поиска "форватера". Скажем так - это сдача экзамена Человеком, где экзаменатор задаёт каверзные вопросы.
Имхо без яркой политизированности и огромных финансовых затратах мы бы уже в "пропасти" задумались об эффективности альтернативной энергетики в сравнении с традиционными. Маск бы стоял в виде памятника в каждом селе, селе без света и тепла. Имхо всё.
Гоша а как вы смотрите на данные высосанные из пальца, ну или преднамеренно искаженные, для помех конкурентам? Только не надо о мире любви и дружбы вернитесь в реальность. Небольшое искажние данных и вот уже не раскрываются солнечные батареи, аппарат отрубает внешнее управление, ракета на старте сходит с трека - и это все мааааленькие ошибки программирования которые УЖЕ произошли. А в той клоаке которую некоторые называют миром науки столько дерьма.Вам это британские ученые подтвердят своими исследованиями
Материал - в числе прочих материалов - обсуждали, отрабатывали, и спустя три года его довели до ума. ИИ задним числом обнаружил, что долгая работа выдала результат ))) Круто! Что бы мы без ИИ делали...
UPD: Расшифрую на примере. Шлялись мы как-то по горам, и в непонятном месте три спеца дали три разных направления куда идти. После блуканий по двум направлениям пошли по третьему - и таки вышли. Что бы сказал ИИ выслушав историю? - Что правильный ответ был известен изначально, но его "не заметили". И это замечательно - но к сожалению у нас *тогда* не было абсолютно никаких критериев вычислить правильный путь.
А если коротко: если бы я вчера был таким умным, как
моя женаИИ сегодня.Проблема в том, что у ИИ, как и у человека отсутствует Различение. Человеку оно даётся Вседержителем, а ИИ - человеком. Сам по себе ИИ не самодостаточен в получении первичной информации, то есть той, которой у него в обработке до момента её внесения извне не было.
Исследование по большей части - шляпа.
Алгоритм исследовал связи часто встречающихся рядом слов.
Не надо быть гением, чтобы понять, что в статьях про инертные газы, например, гелий, аргон, неон, ксенон и криптон будут часто встречаться рядом, поэтому они и сгруппировались соответственно.
Если натравить такой алгоритм на статьи РЕН-ТВ, то связи будут примерно таковы: Путин - двойник - рептилоиды. Только открытие ли это?
Бессмысленная чепуха.
Британские ученые останутся без работы.
Мде, вот так читаешь и понимаешь, что на сайте есть и люди с профильным экономическим образованием, нелегко им.
Я, вот, 3-4 милиарда строк в сутки гружу, но ИИ, по какой-то причине, там не завелся. Сидит несколько человек и зарплату получает. Я им завтра расскажу, надеюсь, что все от смеха не помрут.
Вот будет хохма, когда этот лже ИИ начнёт обрабатывать речь простых незатейливых русских мужиков, где вся поллитра смыслов (в смысле не пол литра !) выражается несколькими словами.
А это кстати идея, создать новый международный язык состоящий из нескольких слов для быстрого лайт общения на планете Земля, например все глаголы состоят из ну максимум пары слов, существительные тоже, и так далее. Каких то пару дней учёбы и можно разговаривать с такими же знатоками этого лайт языка.
Сразу скажу что с глубоким уважением отношусь к самому форуму и самое главное к глубокой смысловой нагрузкой тем которые здесь обсуждаются.
Внимательно прочитал переписку в этой теме и ....удивился...Уважаемые форумчане вопрос по ИИ прост как кусок хозяйственного мыла за рубь двадцать... Схема проста - надо понять как работает система обладающая интеллектом, а единственная на сегодня это мозг человека и некоторых высших животных, и потом повторить её.
Есть гигантский объём флуда в интернете на эту тему,от мозга дельфинов до разумных тараканов, и его нет смысла обсуждать.
Но есть и интересные данные, я подчёркиваю, объективные данные как работает единственная известная нам система обладающая интеллектом...
Хочу предложить интересующимся мнение одного известного в узких кругах специалиста...это доктор биологических наук С.В. Савельев и его лекция, достаточно обзорная, но очень понятная по вопросу ИИ и цифровизации
https://www.youtube.com/watch?v=6qAucF-MVXY
Железяка тупым перебором ищет корреляции "всё влияет на всё на всех уровнях всех систем". Очень интеллектуально.
Потом кожно-мясные тупо пялятся на кучу-малу, выданную железякой, и пытаются из нее вытащить что-нибудь осмысленное.
Ага, вот эта штуковина из кучи имеет некий смысл. Быстренько делаем статью об успехах ИИ, умолчав о горе бессмысленных корреляций, и имеем дальнейшие гранты.
Браво-браво, ИИ торжествует.
В качестве иллюстрации вышесказанного. Амерский банк отказал миллионеру в продлении кредитной карточки, потому что на страничке миллионера в соц. сети в качестве хобби был указан рэп, а рэп статистически достоверно коррелирует с низкой платежеспособностью сами знаете кого.
И это было за несколько лет до того, как Сбербанк попал на несколько ярдов из-за ошибки ИИ уже собственной разработки.
Ну чо, умные учатся на чужих ошибках, дураки на своих, а Греф не учится вообще.
Я примерно такую программу использую каждый день в своей профессиональной деятельности. И десятки или сотни тысяч моих коллег используют. Без этой программы современная научная деятельность невозможна. SciFinder Scholar наывается.
А на егэ его испытывали? На уровне дагестана слабо?
Мдя, прям секта ИИ какая-то.... Перебор слов -сравнение-выборка, как результат вывод на основе похожести. Выполнение программы по ранее заложенному программером алгоритму - где тут ИИ? И да, легко предсказать то что уже было открыто - алгоритм ведь писался после открытий и соответственно интерпретация полученных результатов вполне очевидна. Но сама прога нормуль для фильтрации научных работ и поиска плагиата в них
Страницы