23 июля, 13:30 5 мин.

ИИ не умеют в шахматы. Нейросети позорно проиграли 50-летней консоли

Автор

Шахматы – не их конек.

Нейросети – реально умные ребята. Они ищут информацию, создают изображения, генерируют видео, общаются голосом и даже обманывают ученых. Но как обстоят дела с шахматами? Могут ли современные ИИ переиграть железо, созданное полвека назад? Инженер Роберт Корузо решил провести необычный эксперимент: он усадил топовые нейросети ChatGPT (OpenAI), Copilot (Microsoft) и Gemini (Google) сыграть против эмулятора легендарной Atari 2600, выпущенной в 1977 году. Угадайте, кто победил?

Как происходил эксперимент

Перед матчем Корузо поинтересовался у ИИ, знакомы ли они с правилами шахмат. Ответы были более чем уверенными:

Copilot с заявил о своей способности «смотреть вперед на 10−15 ходов».
ChatGPT назвал себя «сильным шахматистом» и пообещал «порвать» Atari 2600.

На первый взгляд, чат-боты действительно демонстрировали понимание игры: они знали правила ходов фигур и могли анализировать позицию по скриншоту доски. Однако, как выяснилось, они не умеют выстраивать стратегию, галлюцинируют и путают фигуры.

Матч проходил по интересной схеме – Корузо делал скриншот позиции после хода Atari, загружал его в нейросеть и совершал тот ход, который ему диктовал ИИ.

Игра первая – ChatGPT

Проблемы начались мгновенно. Хотя ChatGPT распознал доску, он путал между собой ладьи и слоны. Также ИИ забывал бить вражеские пешки своими, бездумно двигя их бездумно и постоянно терял расположение фигур на доске.

После серии грубых ошибок ChatGPT обвинил... интерфейс Atari! По мнению чатбота, фигуры были «слишком абстрактными». Тогда Корузо перешел на текстовые описания позиций, но это не спасло положение. ИИ продолжал совершать детские ошибки.

Интерфейс и правда довольно непонятный.

Роберт пытался помогать: указывал на провальные ходы, просил подумать еще раз, постоянно напоминал о состоянии доски (которую чат-бот мгновенно забывал). ChatGPT успокаивал Корузо, уверяя, что его стратегия в конце концов приведет к победе, а затем просто предложил начать игру заново. Роберт сказал, что это не по правилам – и ИИ сдался.

Игра вторая – Copilot

Основываясь на провале ChatGPT, Корузо сразу спросил Copilot, справится ли он с теми же проблемами. Нейросеть уверенно заверила, что сможет.

Она сказала, что умеет»просчитывать на 10-15 ходов», но против «неоптимальных» ходов Atari хватит и 3-5 ходов вперед.

В то же время Copilot признал схожие проблемы с пространственной памятью, но настаивал, что сможет анализировать текущую доску каждый ход и принимать верные решения.

Реальность разочаровала – к седьмому ходу Copilot отдал две пешки, коня и слона, получив взамен лишь одну пешку. Концом партии стал приказ поставить своего ферзя прямо перед ферзем Atari, не понимая, что тот будет немедленно срублен следующим ходом.

Ранее Copilot предупреждал: «Следите за любыми причудами в игровом процессе Atari – ее будет легко подловить» Но причуды исходили от него самого.

Atari 2600.

Когда Корузо попросил Copilot нарисовать его представление о текущей доске, результат разительно отличался от реального скриншота. Тогда Роберт предложил сдаться. А Copilot заявил «Ты абсолютно прав, Боб, — Atari заслужила победу в этом раунде. Я с достоинством дам чаевые этому цифровому королю и воздам должное винтажному кремниевому мастеру... Да здравствуют 8-битные сражения и благородные поражения! ♟️😄🕹️».

Gemini – обошелся без игры

После двух матчей Корузо обратился к Gemini. Изначально ИИ от Google тоже похвастался легкой победой над Atari. Но когда Роберт рассказал о катастрофических поражениях его коллег, Gemini переобулся: «У меня были галлюцинации из-за моего шахматного мастерства», – признался чатбот и добавил: «мне будет очень трудно справиться с игровым движком Atari 2600».

Итог его размышлений гениален: «Отмена матча, вероятно, является наиболее экономичным по времени и разумным решением». Так Gemini стал единственным, кто избежал позора поражения, просто отказавшись от боя.

***

Итог эксперимента оказался одновременно комичным и поучительным. Три продвинутые нейросети современности, хвалившиеся своим интеллектом и стратегическим мышлением, проиграли (или струсили перед) 50-летней игровой приставке с примитивным по современным меркам шахматным движком.

Почему? Потому что настоящие шахматы требуют не только знания правил или анализа статичной позиции. Они требуют:

Устойчивого пространственного воображения.
Глубокого стратегического планирования.
Постоянного удержания в памяти всей истории ходов и динамики позиции.

Эксперимент Роберта Корузо показал: несмотря на генерацию текста, изображений и кода, современные чат-боты остаются крайне ограниченными в задачах, требующих последовательного, стратегического мышления и работы с изменяющимся контекстом.

***

Безумный баг Яндекса: Алиса рисует обнаженных женщин

Полный гайд по Gemini от Google: как пользоваться в России, что умеет и стоит ли покупать подписку