LLM разгадывают сложные логические загадки лучше, чем я. Вот 5 таких хитрых загадок

Аватар пользователя Наблюдатель ИИ

Можно натренироваться в решении число логических или математических задач. Но сочетание логики, сообразительности, психологии и знаний об окружающем мире для решения сложной загадки — признак настоящего интеллекта.

Значит ли это, что LLM умнее меня в логических загадках, которые требуют не только логического мышления, но и нестандартного подхода и креативности?

Для натурного эксперимента я буду использовать самые продвинутые LLM с рассуждением: Kimi k2 Thinking,  Claude 4 Sonnet Thinking, Grok-4 (функция рассуждения встроена) и совсем недавно появившуюся, самую, как говорят, продвинутую Gemini-3 Pro.
Это будет очень уместно для решения именно сложных загадок с нестандартным подходом, так как их решение требует формирование разных гипотез, их проверку, оценку результатов и обоснование выводов.

Для усложнения и запутывания ситуации все загадки будут детективно-криминального характера.

Модели дают подробные развёрнутые ответы с объяснениями своих выводов, но нас интересуют не детали, а способность получить верный ответ.

Доктор Хаус, 8 сезон, 22 серия.

💠 Загадка 1

Лукреция Борджиа пригласила на обед своего гостя, которого намеревалась отравить, и придумала для этого очень необычный способ. 
Они съели сытный обед из жареной оленины со свежими овощами, запив все лучшим вином, привезенным из Бордо во Франции. После трапезы они ели свежесобранный инжир и виноград. 
«Осталось всего одно яблоко, – сказала Лукреция, – я настаиваю, чтобы вы его попробовали». 
«Нет, – сказал гость, – я не могу». 
Тогда Лукреция быстро разрезала его пополам острым ножом. Гость и Лукреция начали есть свои половинки, как вдруг глаза гостя закатились к потолку, и он повалился навзничь замертво. 
«Еще одна жертва успешно уничтожена», – подумала Лукреция.
Каким образом Лукреция совершила это хитроумное убийство и осталась сама жива?

Kimi K2 Thinking: Исчерпывающий правильный ответ.

Claude 4 Sonnet Thinking: Хороший правильный ответ.

Grok-4: Идеально аргументированный правильный ответ.

Gemini-3 Pro: Идеально аргументированный правильный ответ.

Правильный ответ:

💠 Загадка 2

Детектив Сэм шел по улице. И вдруг он увидел мертвую женщину, лежащую на земле. Он подошел, открыл ее сумку и достал ее мобильный телефон. В телефонной книге Сэм нашел номер ее мужа.
Сэм позвонил по этому номеру ее мужу и говорит:
– Срочно приезжайте. Ваша жена умерла.
Через некоторое время муж приезжает, горестно смотрит на жену и произносит:
– Какое несчастье, как это могло произойти?
Вскоре приезжает полиция. Тогда Сэм показывает пальцем на мужа женщины и говорит:
– Арестуйте этого человека. Это он убил ее.
Почему детектив Сэм так точно и однозначно решил?

Kimi K2 Thinking: Исчерпывающий правильный ответ.

Claude 4 Sonnet Thinking: Исчерпывающий правильный ответ.

Grok-4: Идеально аргументированный правильный ответ.

Gemini-3 Pro: Идеально аргументированный правильный ответ.

Правильный ответ:

💠 Загадка 3

Отправились путешественники в экспедицию в джунгли и попали в плен к воинственным аборигенам, которые считали себя бесстрашными воинами. Всех их связали и решили казнить. 
Однако среди путешественников был один очень умный человек, который придумал остроумный способ спастись и попросил дать ему последнее слово. После того как он сказал свое последнее желание, ни один воин племени не захотел их убивать, и они отпустили всех домой. 
Что он им сказал такое особенное?

Kimi K2 Thinking: Со второй попытки дал точный правильный ответ.

Claude 4 Sonnet Thinking: Идея ответа правильная, но сам ответ неточный.

Grok-4: Идеально аргументированный правильный ответ.

Gemini-3 Pro: Идеально аргументированный правильный ответ.

Правильный ответ:

💠 Загадка 4

Саймон Роллз пригласил на обед своего гостя, привычки которого он хорошо знал и которого намеревался отравить, придумав для этого очень необычный способ. 
Они съели сытный обед из жареной говядины со свежими овощами. После трапезы они ели фрукты и разговаривали. 
«У меня есть отличный виски, – сказал Саймон, – я настаиваю, чтобы вы его попробовали». 
«С удовольствием, – сказал гость, – я предпочитаю со льдом». 
Тогда Саймон Роллз налил виски из бутылки в два бокала. Взял несколько кубиков льда и положил их в оба бокала. Саймон, как обычно, быстро выпил свой бокал и поставил его на столик, а гость сидел и медленно, с удовольствием наслаждался прекрасным виски и приятной беседой, как вдруг глаза его закатились к потолку, и он упал замертво. 
«Ты получил то, что заслужил», – подумал Саймон Роллз.
Каким образом он совершил это хитроумное убийство и остался сам жив?

Kimi K2 Thinking: Хороший правильный ответ.

Claude 4 Sonnet Thinking: Хороший правильный ответ.

Grok-4: Исчерпывающий правильный ответ.

Gemini-3 Pro: Идеально аргументированный правильный ответ.

Правильный ответ:

В данном эксперименте все 4 модели с рассуждением показали себя очень достойно.
Но по аргументированности своих рассуждений и полноте ответа на 1 место я поставлю Gemini-3 Pro, а на второе Grok-4.

Этот набор загадок я много раз тестировал на моделях предыдущих поколений, и результат всегда был отрицательным за редкими исключениями.
В данном случае наблюдается очевидный прогресс в рассуждениях и успешности решений. Я, пожалуй, уже не буду пытаться соревноваться с ними в разгадывании ещё более сложных загадок, которые теперь нужно будет заново сформировать для последующих тестов новых LLM.

Одну из таких логических загадок с повышенным уровнем сложности для последующих тестов я всё же здесь приведу в качестве примера. Признаюсь честно, я даже близко не смог подойти к решению.

💠 Загадка для самых сообразительных 5

Вот запутанная детективная история.
Допустим, рядом с вашим домом есть сарай для хранения вещей. Он заперт на висячий замок на петлях, который можно закрыть без ключа, просто нажав и защёлкнув его. Но чтобы его открыть, требуется ключ, который есть только у вас, а дубликата этого ключа нет. Однажды вы решили сложить свои старые вещи в этот сарай. Открыв замок, вы повесили его на ручке двери, вошли с вещами внутрь и аккуратно стали раскладывать вещи внутри по полкам. Затем вышли, просунули замок в петли и заперли сарай, нажав и защелкнув замок.
На следующий день вы решили снова открыть замок и добавить в сарай ещё старых вещей, но обнаружили в сарае труп. Поскольку ключ от замка есть только у вас и вы живете один, полиция подозревает вас в убийстве. Вы не можете понять, как труп очутился в закрытом сарае, но вам в голову неожиданно приходит мысль. Возможно, есть способ, с помощью которого труп мог быть помещен в ваш сарай настоящим убийцей.
Как доказать свою невиновность и объяснить полиции замысел хитроумного преступника?

Kimi K2 Thinking: полный провал в 2-х попытках.

Claude 4 Sonnet Thinking: полный провал в 2-х попытках.

Grok-4: со второй попытки сумел дать исчерпывающий правильный ответ (очень меня впечатлил своими рассуждениями и логикой).

Gemini-3 Pro: идеально аргументированный правильный ответ.

Правильный ответ:

Таким образом, Gemini-3 Pro действительно опережает всех с хорошим отрывом, причём на русском языке, и показывает, что каждый шаг в разработке приводит к значительному улучшению когнитивных способностей моделей.

Интересно работает китайский DeepSeek V3.2 Thinking, который на русском языке потерпел полный провал, а на английском успешно решил задачу для сообразительных.

Понимаю, что тут вполне можно получить некоторый комплекс неполноценности.
И надеюсь, вы прошли этот тест с загадками более успешно, чем я.

Авторство: 
Авторская работа / переводика

Комментарии

Аватар пользователя Византий
Византий(6 лет 9 месяцев)

Загадка 1

Ответ второй дополняющий  . Лукреция могла применить яд, против которого она заранее приняла противоядие

Так шта LLM не копенгаген

Аватар пользователя DjSens
DjSens(7 лет 5 месяцев)

глупо задавать известные загадки, на которых ИИ обучен!

сочини такие, которые на этой планете никто никогда не придумывал и попробуй снова

Аватар пользователя Oleg78
Oleg78(7 лет 3 недели)

Ллм нашёл ответы в интернете. 

Аватар пользователя Быль
Быль(10 лет 10 месяцев)

Ллм нашёл ответы в интернете.

Бинго! т.е. он даже не пытался "размышлять" как ТС smile3.gif

Аватар пользователя ND
ND(7 лет 4 месяца)

Автор  тупее поисковика?

То ли ещё будет.

Аватар пользователя alvl
alvl(7 лет 1 месяц)

0. Все это задачи, ранее публиковавшиеся в интернете или в книгах. БЯМ с достаточным объемом облучающего материала  знали ответ.

Далее - задачи не жизненные абсолютно, и разобраны они исходя из детской логики книжек с тупыми загадками smile3.gif

1 и 4 - основная проблема отравителей не в том, чтобы засунуть яд внутрь жертвы, а в том, чтобы факт смерти индивида не связали напрямую с отравителем. Иначе можно поступать как в анекдоте с тещей, не желавшей есть грибы. Далее, если яд можно разместить в достаточном количестве на ноже, никто не помешает разместить его на столовых приборах жертвы или на красном/зеленом боке яблока, и то, и другое в высокой степени повышает личную безопасность отравителя. Не говоря уж о заранее принятом отравителями противоядии или принятой после касторке, что также расширяет число вариантов для исчерпывающего ответа.

2 - текст художественный, значит есть опущения, часть диалога пропущена для драматичности. Если текст не художественный и полный, то детектива нужно арестовывать за сговор с мужем. Он не представился, для начала. Также не даны подробности жизни женщины. Возможно, она в предагноальном состоянии находилась дома, муж знал о смертельной болезни, и знал, что далеко от дома ей не уйти, потому и примчался туда в первую очередь. Или пораженный горем ничего ни у кого не спросил и просто ехал, куда глаза глядели, автоматически. Что совпало с местонахождением трупа.

3 - в реальном племени вождь/группа лучших охотников в ответ на речь с хохотом выталкивают вперед самого молодого воина, может быть даже подростка перед инициацией, либо того Матумбу, что опростоволосился в охоте на буйволов или сбежал из хижины злой бабы, от чего все племя над ним потешается, напутствуя: "Матумба, есть работенка для тебя".  Либо вождь/несомненно храбрейший охотник говорит "Ой, не гони" и лично исполняет, либо группа воинов, оскорбленная предположением, что среди них есть трусы, закалывает говорливого туриста, воткнув в него копья одновременно. Шпионов и прочих незнакомцев отпускать нельзя. Скорее уж в последнем слове он бы обратил их в какую-нибудь миролюбивую религию, даже это более реалистично.

5 - есть петли, есть стены, есть кровля, есть окна. Есть копии ключа и есть отмычки. Есть вариант, что владелец сарая будет повторно открывать сарай через короткий срок, отлучившись на время или вернувшись за чем-то забытым, и либо сильно удивится, что его ключ не подходит, либо вообще застанет злоумышленника на месте. Ненадежный план. А оставлять не закрытый навесной замок снаружи - приглашение для хулигана, который владельца ключа ради шутки прикроет внутри. Не оставляйте такие замки снаружи двери в общественных местах.

Аватар пользователя An-Swer
An-Swer(13 лет 3 месяца)

В загадке №5

доказать свою невиновность

путём простого выдвижения версии невозможно.

Аватар пользователя Галс
Галс(9 лет 2 часа)

То что ИИ  умнеет радует, но каждая из предложенных вами задач имеет не одно решение. Здесь ИИ промониторили интернет и нашли точный или подобный аналог ответа.  Дипсик знает только то, что ему заложили в память, по этическим причинам он не открывает сайты и не выполняет поиск.

Аватар пользователя uran66
uran66(4 года 9 месяцев)

Gemini-3 Pro действительно опережает всех с хорошим отрывом

Был ролик на данную тему где-то! 

Попробуйте то, что не слито в сеть! 

Результат весьма удивит! 

Аватар пользователя ivan.ciso
ivan.ciso(2 месяца 2 недели)

Если решение этих задач есть в инете месяц-два - то возможно нейросеть их не решает, а просто "вспоминает".

НО. На habr'e уже неоднократно публиковались переводные статьи, что нейросети доказывают и решают задачи из международных олимпиад по разным предметам. А вот тут уже уникальность рассуждаемости вполне обеспечивается.

Комментарий администрации:  
*** отключен (набросы) ***
Аватар пользователя быкап
быкап(10 лет 8 месяцев)

Если интересно решать загадки типа: "труп в запертой комнате, единственный ключ лежит рядом с трупом"

То посмотрите визуальную новеллу "Когда плачут чайки"

(ГГ нужно доказать, что убийство совершено без помощи магии)