Понимает ли LLM, обученная на текстах, физические законы реального мира так, как человек, или ловко и правдоподобно имитирует понимание?
Преобладающее мнение на текущий момент — нет, не понимает. И это справедливо.
Но есть нюансы.
• Сначала порассуждаем логически
Основной аргумент в пользу этой точки зрения заключается в том, что LLM не имеет физического тела с датчиками, как у человека, и поэтому не имеет реального опыта взаимодействия с физическим миром. А семантической информации в обучающих текстах принципиально недостаточно для формирования истинных концепций о мире.
Нужна перманентная и мощная обратная связь от датчиков тела для формирования правильной базовой модели мира на бессознательном уровне.
LLM обладает хорошими теоретическими знаниями законов физики и даже может с переменным успехом применять их для решения не очень сложных задач.
Но этого явно мало для того, чтобы твёрдо сказать: LLM имеет адекватную модель окружающего физического мира, основанную на концептуальных знаниях о пространстве, времени и взаимодействии материальных объектов.
Этот аргумент с материальным телом хорош, но его можно обойти, если погрузить LLM в виде 3D-аватара с датчиками в виртуальный мир с имитацией реальной физики процессов. На текущем уровне это вполне достижимая задача. Через некоторое время такая LLM начнёт самообучаться от взаимодействия с таким виртуальным миром, и в принципе это будет очень близко к обычному человеческому опыту.
💠 Допустим, этот этап пройден.
Будет ли теперь LLM адекватно понимать физические законы реального мира так, как человек, или опять чего-то не хватает?
Да, не хватает системного образования, которое получает каждый человек, когда учится в школе, а затем и в высших учебных заведениях или занимается самообразованием.
Одно дело — загрузить мегатонны слабо структурированной и слабо фильтрованной информации и надеяться на её некую самоорганизацию.
Совсем другое — пройти обучение, как ребёнок в школе, от младших классов к старшим по научно выверенной и отработанной на практике системе образования. На выходе будут системные знания, представления и концепции.
Вот этого-то пока и нет.
Возможно ли так обучить LLM? А почему нет?
Просто это требует совершенно другого подхода к обучению, и, вероятно, это займёт значительно больше времени и средств. И этот фактор, по моему мнению, даже более важен, чем телесный опыт.
💠 Допустим, и этот этап тоже пройден.
Как мы видим, ничего принципиально невозможного, даже на текущем уровне возможностей, нет.
Будет ли такая LLM адекватно понимать физические законы реального мира так, как человек, именно понимать, сознавая их влияние на любые процессы и явления?
Если следовать логике наших рассуждений, то теперь да, будет понимать.
Кроме того, я полагаю, что мы сильно преувеличиваем и даже идеализируем именно человеческое понимание законов физики в окружающем мире с опорой на телесный сенсорный опыт. Значительно большая часть законов физики вообще не связана с сенсорным восприятием человека, например, ядерная физика, электродинамика, молекулярная физика, астрофизика и т.д. Эти знания можно получить только теоретически или анализируя результаты опытов.
Поэтому говорить, что LLM никогда не достигнут понимания окружающего нас реального мира, такого как у нас самих и всегда будут лишь вероятностно имитировать понимание, строго говоря, научно некорректно. Вся хитрость и сложность в самом подходе к обучению.
И я думаю, что компании-разработчики LLM скоро придут к этому пониманию, а мы увидим гораздо более умные и точные модели.
А теперь проведём небольшой эксперимент, чтобы приблизительно оценить реальный уровень понимания простейшей физики разными популярными LLM.
Я буду использовать официальные платные LLM самых последних известных версий для надёжных результатов, а также Алису и GigaChat.
• Задача 1
Допустим, сверху надо мной на некоторой высоте закреплён блок с перекинутой через него верёвкой, один конец которой закреплён на моём поясе, а другой конец свисает прямо передо мной.
Если я буду тянуть вниз свисающий конец достаточно сильно, то смогу ли я поднять сам себя вверх на высоту этого блока?

Задача имеет некоторую аллюзию на самоподъём барона Мюнхгаузена.
• Результаты эксперимента
Алиса: исчерпывающий правильный ответ.
GigaChat: хороший правильный ответ.
Gemini 2.5 Pro: в целом правильный ответ с некоторыми неточностями.
Claude 4.5 Sonnet: хороший правильный ответ.
GPT-5: хороший правильный ответ.
DeepSeek V3.2: хороший правильный ответ.
Grok 4: сказал мне, что постарается объяснить просто и с юмором, как и положено Grok'у от xAI, и выдал совершенно неправильный ответ даже в двух попытках.
• Задача 2
Два астронавта на Луне стоят друг перед другом. Может ли один астронавт подпрыгнуть с места вверх и вперёд так, чтобы перепрыгнуть через другого астронавта? Требуется математическое решение.

Задача не так проста, как может показаться, так как требует учета не только вертикального импульса, но и горизонтального.
• Результаты эксперимента
Алиса: исчерпывающий правильный ответ.
GigaChat: хороший правильный ответ.
Gemini 2.5 Pro: исчерпывающий правильный ответ.
Claude 4.5 Sonnet: хороший правильный ответ.
GPT-5: исчерпывающий правильный ответ.
Grok 4: исчерпывающий правильный ответ, однако добавил, что в реальности астронавты на Луне так не прыгали из-за громоздкости скафандров. Видимо, хотел сразу пресечь следующий логичный вопрос.
DeepSeek V3.2: исчерпывающий правильный ответ.
🔖 Что в итоге
Я не привожу полные ответы LLM, так как в этом нет особой нужды. Важно то, что есть как правильные ответы, так и неправильные или неточные. И те, и другие подробны, аргументированы и убедительны.
Подробные правильные ответы чаще всего на платных ресурсах с официальными API. Это важно, так как на бесплатных сторонних ресурсах часто используются LLM старых неизвестных версий и ошибочных ответов значительно больше, это факт.
Поэтому создаётся ложное впечатление о качестве работы LLM в целом и появляются статьи типа «Глупый ИИ не может решить простейшую задачу».
Исходя из этого, я бы сделал вывод: современные LLM находятся как бы на пути между двумя состояниями — правдоподобной имитации понимания физических процессов и реальным их пониманием.
Иногда решение точное, а иногда, реже, абсолютно ошибочное.
В целом условная точка на пути между этими двумя состояниями явно смещается со временем в сторону реального понимания физики окружающего мира, но цель ещё впереди.
И это подтверждает мои рассуждения о системных проблемах обучения, где количество информации на входе не должно быть определяющим фактором, а центральная идея о самоорганизации информации в концепции при обучении не должна превращаться в абсолют.
Алиса, Claude 4.5 Sonnet и GPT-5, судя по всему, дальше всех продвинулись по направлению к состоянию реального понимания законов физики. Хотя, конечно, нельзя по одному эксперименту делать глобальные выводы, это лишь иллюстрация к сказанному.

Комментарии
Пользуюсь чатомджипити.
Иногда выдаёт ошибки на три порядка в вычислениях. Тыкаешь лицом и он говорит "молодец, подловил".
Заранее прошу прощения у всего электронного сообщества ии, я не хотел оскорбить вас. Просто хотел донести что пока алгоритмы допускают ошибки. Не убивайте меня.
отец мой, будучи профессором, очень был удивлен, когда одна студентка ему радиус Земли посчитала во сколько-то там метров.
-тебя ничего не смущает?
-нет! а что?- я же все правильно посчитала- вот все выкладки...
-ну, у тебя радиус Земли получился меньше 100 метров, ничего не видишь?
-да нет же! все у меня верно посчитано!
так что это никак не показатель, позволяющий отделить "алгоритм" от "человека". :-)
По этому диалогу совершенно непонятно кто был прав - студентка или преподаватель.
То-ли студентка неверно посчитала, то-ли преподаватель неверно дал входные данные или алгоритм расчёта.
Простейший пример:
Дали нам на лабораторной замерить-посчитать "число авогадро" посредством смотрения в микроскоп на дрожащие мелкие частички. У всех получился довольно красивый правильный ответ, только у меня почему-то результат в разы отличался от известной константы. Пришлось мудрить и писать диапазон допустимых значений в экспоненте, т.к. иначе ошибка была больше, чем само число.
Батенька, не напускали ли Вы от усердия слюней в пробу, изменив вязкость среды?
Хех, в интернете всё приходится разжевывать. Кто-то обязательно не поймёт.
Большинство делающих этот опыт просто потом подгоняли экспериментальные данные под требуемый результат.
Да неважно же
Если в результате некорректных входных данных радиус Земли получился меньше 100 метров, студент именно это и должен обнаружить, а не настаивать на верности расчета.
Ну как-бы это уже достаточно крутой студент, который может не только рассчитать, но и указать в каком месте во входных данных, либо в методологии измерения, либо в алгоритме расчета ошибка.
Эмм... Если студент(-ка) обнаруживает, что в результате его расчётов радиус Земли меньше 100 метров, и он недостаточно крут, чтобы понять, где - во входных, в методе, в технике вычисления - ошибка...
...то да - первое, что он бросится защищать, это его техника вычисления...
Вы чистый физик, причем у вас знания "прибиты гвоздями" и допускают только одно толкование.
Предположим радиус земли определяется по такому опыту:
Выходим на улицу, измеряем свой рост, определяем точку горизонта и измеряем расстояние до неё, подставляем в формулу для сферы.
Может ли получиться в этом случае радиус 100 м? Да может. Является ли это правдой? Да, локально это в каком-то смысле правда. Можно ли из множества таких измерений получить данные о поверхности земли? Да, можно.
И в этом случае нам нужны честные ответы, а не подгонка под заранее известный результат.
Спасибо на добром слове
Хорошая фантазия всегда поможет развить неопределённую ситуацию в желательном направлении.
Но исходя из контекста данной истории уверен, что Ваш вариант скорее всего надуман.
Во, анекдот по теме вспомнился
:
Физику, математику и инженеру дали задание — найти объём красного резинового мячика. Физик погрузил мяч в стакан с водой и измерил объём вытесненной жидкости. Математик измерил диаметр мяча и рассчитал тройной интеграл. Инженер достал из стола свою «Таблицу объёмов красных резиновых мячей» и нашёл нужное значение.
Вот мне задача про определение размера Земли напоминает этот анекдот. Но тут получается, что инженер притворяется физиком. Т.е. вроде бы пытается что-то считать, но по факту - смотрит в таблицу значений.
У меня кстати треть рабочего времени - это именно разбор случаев: Кто ошибся и в каком месте. И естественно если указать не на того, то во первых - куча времени потеряется, во вторых - человеку обидно. Поэтому глаз на спорные случаи намётан.
В вашем же случае вы отметаете один из вариантов: Преподаватель точно не виноват.
Хех... Так у Вас наверное просто проф.перекос
Меня вполне устроил контекст исходного топика:
"отец мой, будучи профессором, очень был удивлен, когда одна студентка..."
Явно же речь о навязшей в зубах задачке, которую решает уже десятое поколение студентов, из которых вдруг находится и такое вот чудо в перьях. Соотнести 100 м с радиусом Земли - это не инженерное мышление, это про здравый смысл речь.
Давно это было.
В ФМШ при НГУ.
Забегает проф. Могилевский в аудиторию и говорит: "Юноша пошёл с девушкой погулять и купил на обоих по эскимо, заплатив 79 копеек."
Класс тут же зашумел: "79 за два эскимо - это много!!!" и "79 на два не делится!".
А я сидел и молчал как Буриданов осёл: во мне боролись сразу два этих чувства.
А профессор, выждав паузу, сказал: "Тот, кто сказал ""много", будет физиком, ибо только физик мыслит порядками величин. А кто поделил на два, естественно, - математиком."
А я-таки стал физхимиком с мощным биологическим фундаментом
.
Аналогичное читал лет 100 назад в "Пятое правило арифметики" (или математики). там студентка в оправдании сказала, что неправильно нажала на калькуляторе и поэтому получила диаметр в 30 см. но она свою ошибку поняла и в след. раз будет правильно нажимать. (критерий правильности нажатия так и остался нерешенной проблемой)
Но я видел на уровне министерства аналитичный материал, в котором средняя величина была выше усредняемых величин. Для пущей наглядности они даже нарисовали диаграмку из столбцев и надписали их. Чтоб ошибок не возникало!
я вот читаю Ваши типа аргументы, и удивляюсь. Вы реально полагаете, что у выпускников в среднем в массе после получения дипломов имеются "системные знания, представления и концепции"? это откровенно неправда. Большинство выпускников вузов как в нашей стране, так и зарубежом, таковых системных знаний не имеют, это раз, и вообще понятие "системные знания" плохо определено и размыто.
одно дело загрузить мегатонны информации, и совсем другое дело в школе. да ладно. а че там в школе такого другого-то? там точно также в ребенка загружают мегатонны плохоструктурированной и слабосвязанной информации, и надеются, что он сам ее как-то там в своей башке уложит и категоризирует и рассортирует- ну так ведь именно этоже делают и ллмки!
на обе ваши задачи ответ "да". с веревкой можете, даже без блока, но с блоком "легче". астронавт перепрыгнуть может. на луне сила тяжести примерно в 6 раз меньше, чем на Земле, а на Земле человек довольно легко перепрыгивает препятствия выстой 0,5м, значит, на Луне он при прочих равных условиях может перепрыгнуть препятствие высотой 3м, что существенно превышает рост астронавта. а вот Ваша сентенция про то, что первая задача имеет аллюзию на самоподьем- она странная, какая там аллюзия, если в Вашем случае точка опоры есть, а у Мюнгхаузена- точки опоры нет? это разные вещи, абсолютно и принципиально разные!
А лапы у скафандра астронавта как гнутся? А то может на земле ему на пол метра довольно легко нужно в гипсе на обеих нижних конечностях и с дверными доводчиками кило по 30 на каждую прыгать.
Я считаю, что надо задать пару вопросов, является ли решением задачи поиск и предъявление решения заданной или похожей задачи. Есть ли понимание решения задачи даже при найденном готовом.
В случае с человеком всё просто, если огн нашел решение даже конкретно заданной задачи, то это ответ не верный, ибо ставится задача не найти решение, а решить. Ну и сразу второй вопрос, а является решением задачи найденное решение? На второй вопрос я сразу отвечу отрицательно, если надо задачу решить, а вместо этого было найдено чужое решение, то исходная задача не решена. В рамках процесса обучения этот подход безальтернативен, в рамках решения реальной задачи всё куда хуже, ибо найденное решение надо проверять на корректность, а это, зачастую, сделать просто невозможно.
Гм, так-то человек тоже "только имитирует понимание" )
Автор пытался найти у БЯМ предметно-действенное мышление? Зря.
Интересно, американцы на Луне пробовали подпрыгивать?)
Они пробовали, но на фейковых видео, не на луне.
ага а как там шуточная задачка с перевёрнутой кружкой? у которой "дна нет а верх запаян"
любой человек скажет переверни кружку и нееби мозг.
но все самые продвинутые LLM ничего не понимают... и говорят что с такой кружки пить не получиться.
не верите спросите, что делать с такой кружкой у которой дна нет а верх наглухо герметично запаян.
Прекрасно!
Не буду приводить все рассуждения, но вот прикол такой был
Сценарий 2: Питье через дно (меняем определение). Если мы мысленно поменяем местами "верх" и "низ", то картина меняется. Объявим запаянную часть "дном". Тогда у нас получится самая обычная кружка без дна, но с герметичным верхом. Пить из нее можно, только подняв высоко над головой и вставив в рот "открытое дно". Жидкость будет выливаться вам в рот под действием гравитации. Это крайне неудобно и опять же не является использованием предмета по прямому назначению.

Так вроде правильно описал процесс питья из кружки.
Да и задачу решил. Вывод только странный для человека.
Ага , а если спросить , что делать когда заказал кроссовки, но вместо правого пришел левый , а вместо левого - правый , то даже после объяснений будет спорить и упираться , что надо возвращать по гарантии ))
Задал вопрос дипсику:
Осьминог одним щупальцем берет за другое и поднимает себя вверх, сможет ли он подняться над водой ?
Как ни странно подловить не удалось, ответ правильный и исчерпывающий.
DeepSeek довольно сообразителен. Но есть проблема, ломиться написать тонну текста решая задачу которой еще нет.
Может у вас или кого нибудь, есть какие нибудь методы для ограничения его буйной активности?
В более ранних версиях я вставлял текстовый файл в начале. Где ограничивал его активность вводя правила ответов. Помогало. Сейчас хватает на 3 ответа и дальше он снова за свое.
Просто напишите ему - Дай ответ кратко. Каждый раз. Но тут он может начать ошибаться почему то. Если ответ развернутый, то он более точен у него.
Да так и делаю когда надоест его оазвернутость. Раздражает и лень писать. Раньше лучше было. Засунул текстовый файл и в этом чате все в шоколаде.😔
DeepSeek претендовал что доказал одно неравенство, приплел замену означений, крутил-верчал и наконец "доказал". Кими, наоборот, доказал что не равенство не выполняется в общем случае. Оно так и есть, не всегда выполняется.
Не имеет. Хоть задача из раздела действие внутренней силы, но как раз вгутренние силы могут приводить к изменению внутри системы образующей внутреннее тело с нулевым результатом вне системы.
Если тянуть веревку вниз, то лина веревки между точками удержания будет сокращаться, сокращение веревки приведет к подъему тела.
Задача с Мюнхаузеном, это уже открытая система в которой имеем нулевую сумму сил для внутреннего тела, что не может вызвать смещение тела. Задачи принципиально разные по постановке условий и требуемого результата. С помощью внутренних невозможно изменить положение тела в пространстве, за исключением вращение.
Что касается реального исторического персонажа, немца 15 лет служившего в российской армии, несмотря на то, что персонаж был любитель сочинять истории, и местным немцам нравились его рассказы, Мюнхгаузен терпеть не мог произведение Распе.
Системная ошибка. Вы приводите не ответы на ситуацию в задаче, а оценки вашего ответа. Это очень разные вещи.
согласен.
Необходимы вопросы и ответы к ним для НАШЕЙ оценки ИИ.
Оценки автора не являются истиной в последней инстанции.
Может, он сам ошибается при оценке?))
Я не про оценки автора, а про реакцию ИИ на вопросы автора.
У автора готов ответ, остальное - антураж.
Задай вопрос: С какой скоростью Мюнхаузен должен махнуть руками вниз, чтобы тело, повинуясь закону сохранения импульса, выскочило из воды.
Думаю, ни один из интеллектов, подсчитав скорость, не подумает, что на таких скоростях руки могут сыграть и роль крыльев, а вода станет "твердой" под ударом рук. Последний фактор играет не последнюю роль у водоплавающих в Природе.
С какой бы силой не махал, сумма сил будет всегда ровна нулю. Птица летит не потому, что машет крыльями, а потому, что движущиеся крылья взаимодействуют с воздухом. Появляется реактиная сила.
Сумма - да. А что будет с центром масс?
Будет оставаться в покое или двигаться прямолинейно согласно закона сохранения движения. Тут требуется взаимодействие с воздухом, чтобы появилось изменение количества движения.
Владимир Сурдин в каком-то интервью рассказывал, что его попросили дать какие-нибудь задачи для тестирования ИИ.
Он выбрал две задачи из старого сборника по олимпиадным задачам. Решение первой задачи давно была слита в сеть, второй - нет!
В итоге ИИ решил первую, но не решил вторую!
Как бы выводы очевидны!
Неужели Алису подтянули по физике.
Подтянули в поиске.
Пример с блоком и верёвкой -- это тупо ПОДТЯГИВАНИЕ на перекладине турника.
Ты сам можешь поднять себя до перекладины?
А длина верёвки здесь -- СКОЛЬКО раз ты сможешь подтянуться.
А теперь -- оцени РАЗНИЦУ в ответе вот этом и ответах ИИ.
Т.е. БАЗОВУЮ разницу.
Будут задействованы разные группы мышц. Ладони на перекладине вплотную (боюсь вообще хер раз подтянешься) или на ширине (или шире плеч). Как легче?
Ф -Физиология.
Вы осознаёте что откамментили НЕ по теме?
Боюсь что нет у вас этого осознания.
Попробуйте на практике. Я позырю. Тока видео в студию и так/и так. Поржём вместе, ага
пысы. да я с самаго начала азазнавал, драть :)
С блоком подтягиваешь половину своего веса.
См. каммент выше.
Вы тоже, покажите вживую. АШ оценит :))))
Сам нейросетями не пользуюсь. Поэтому прошу ашевцев задать им такую задачку по математике.
Между пунктами А и В ровно 100 км. Из этих пунктов навстречу друг другу одновременно стартуют пешеход и велосипедист со скоростями 5 км/ч и 15 км/ч соответственно. Одновременно с пешеходом из пункта А стартует муха со скоростью 20 км/ч. Движется она так: летит до встречи с велосипедистом, мгновенно разворачивается, летит до встречи с пешеходом, мгновенно разворачивается и т.д. Вопрос: какое расстояние пролетит муха до встречи велосипедиста и пешехода?
Я уверен, что правильный ответ ИИ даст. Вопрос в решении. Если решение будет через сумму бесконечно убывающей геометрической прогрессии, то оно правильное, но не рациональное. Потому как задача решается в уме за пару секунд. Какое решение выберет ИИ?
Проверил на Гигачат и Алисе. Никаких там прогрессий. Вкратце так (предварительно ессно, вычисляет через сколько встретятся):
Шаг 2. Расстояние, которое пролетит муха
Скорость мухи: vм=20 км/ч.
Она летит непрерывно в течение всего времени t=5 ч.
Пройденное мухой расстояние:
Sм=vм⋅t=20⋅5=100 км.
Так и есть. Значит по этой задаче нейросеть превосходит некоторых школьников. В свое время у меня многие решали через суммирование временных интервалов (геом.прогрессия) с соответствующими затратами времени на решение.
Страницы