10 мин.

Chat GPT-5 – самая умная нейросеть в мире. Если верить словам

Пока без пруфов.

7 августа OpenAI представила следующее поколение языковой модели – GPT-5. Разработчики высоко оценивают возможности нового чат-бота. Сэм Альтман даже заявил: «GPT-3 был школьником, GPT-4 – студентом, а GPT-5 стал экспертом». Альтман пообещал, что пользователи получат «эксперта в кармане буквально в каждой области».

Ажиотаж вокруг анонса был невероятным: стрим на YouTube собрал более 120 тысяч зрителей – цифры, близкие к показателям презентаций от Apple.

Но главный вопрос остается открытым: насколько правдивы утверждения о прорыве? Реальную картину превосходства GPT-5 над конкурентами покажут только независимые бенчмарки и массовые отзывы пользователей. Пока же приходится опираться преимущественно на данные, представленные самой OpenAI.

Пять разных GPT-5

OpenAI отказалась от единой универсальной модели в пользу линейки, оптимизированной под различные сценарии. GPT-5 самостоятельно решает, дать ли пользователю быстрый ответ или перейти в режим глубоких рассуждений. 

Ранее многие рядовые пользователи путались между множеством версий. Теперь по умолчанию функция выбора отключена, однако вернуть ее можно в настройках.

Какие есть версии GPT-5:

  • GPT-5: базовая, наиболее сбалансированная модель для повседневных задач. Предполагается как модель по умолчанию для большинства пользователей.

  • GPT-5 Mini: упрощенная и еще более быстрая версия. Предназначена для задач, где важна скорость ответа, а не глубина проработки и рассуждений.

  • GPT-5 Thinking: специализированная модель, сфокусированная на решении сложных задач, требующих глубоких цепочек рассуждений, анализа и пошагового мышления.

  • GPT-5 Pro: продвинутая размышляющая модель, которая автоматически примеряет на себя роль эксперта в той области, к которой относится вопрос пользователя. Подбирает оптимальный стиль, глубину и терминологию ответа, эмулируя знания и подход специалиста.

  • GPT-5 Nano: быстрая версия, но с сохраненными способностями к рассуждениям. Представляет собой баланс между скоростью отклика модели Mini и возможностями Thinking/Pro.

Все модели обучены на данных до октября 2024 года. Это означает, что GPT-5 уже обладает знанием о современных технологиях, включая принципы работы LLM-агентов, методы эффективного промптинга к API крупных провайдеров (Anthropic, Google, xAI). По утверждению OpenAI, подобные новшества делают GPT-5 исключительно эффективным инструментом для быстрой разработки современного AI-софта.

Кстати, голосовой режим теперь тоже работает на базе GPT-5.

Насколько GPT-5 превосходит другие нейросети?

В вопросе превосходства приходится опираться только на информацию, раскрытую OpenAI в ходе анонса.

Программирование (SWE-bench Verified)

Тест использует реальные задачи с GitHub. GPT-5 достигла 74,9% успешных решений с первой попытки. Это чуть выше показателя Claude Opus 4.1 от Anthropic – 74,5% и значительно выше Gemini 2.5 Pro от Google – 59,6%.

Глубокие Экспертные Знания (GPQA Diamond)

Экзамен оценивает способность отвечать на сложные вопросы уровня доктора наук по широкому спектру дисциплин. Версия GPT-5 Pro показала результат 89,4% против 88,9% у Grok 4 Heavy и 80,9% у Claude Opus 4.1.

📌Правда, что Grok 4 теперь умнее ChatGPT? Все про новые версии

Снижение галлюцинаций и ошибок

  • У GPT-5 Thinking зафиксировано на 65% меньше галлюцинаций, чем у предыдущей топовой модели GPT-o3.

  • Обычная GPT-5 демонстрирует на 44% меньше ошибок по сравнению с GPT-4o.

  • В задачах с медицинским риском ошибки снижены в 10 раз – всего 1,6%. Для сравнения: GPT-4o – 12,9%

  • Общий уровень галлюцинаций GPT-5 составляет лишь 4,8%. У GPT-o3 и GPT-4o аналогичные показатели были 22% и 20,6% соответственно.

Ключевым нововведением стал модуль Universal Verifier, который использовался во время обучения нейросети. Это отдельный мини-ИИ, который проверял каждый сгенерированный GPT-5 ответ на достоверность и отправлял сомнительные и выдуманные ответы на доработку. 

📌Почему ИИ неумышленно врут с серьезным «лицом»? Все дело в галлюцинациях нейросетей

Улучшение безопасности:

  • Отказ от простой логики «разрешено/запрещено». Вместо этого модель оценивает потенциальный вред и полезность результата, стремясь предоставить безопасный, но полезный ответ. Особенно подходит для двусмысленных запросов (те, которые могут иметь как обычное, так и вредное применение – биология, химия, кибербезопасность).

  • Устойчивость к обходу правил: 99,9% у GPT-5 Thinking против 95,5% у GPT-4o.

  • Отказ от генерации самоповреждающего контента: 95,5% у GPT-5 Thinking против 84,9% у GPT-4o.

  • Снижение избыточной угодливости пользователю на 75%.

На тестирование ушло более 9000 часов при участии свыше 400 независимых специалистов, моделировавших вредоносные сценарии. После модель GPT-5 Thinking была признана обладающей потенциальным риском при злоупотреблении, особенно в областях био- и химической безопасности.

Для борьбы с неправильным применением модели разработчики:

  • Ввели фильтрацию вредоносных токенов, распознавание опасных цепочек рассуждений, запрет на вывод опасных инструкций.

  • Дают доступ к мощному API (GPT-5 Pro/Thinking) только через закрытую программу Trusted Access Program.

  • Ограничили модели физически в генерации информации, касающейся синтеза ядов, вирусов, опасных веществ.

  • Добавили реакцию на «небезопасные» запросы – модель не просто отказывается отвечать, а обоснованно объясняет пользователю, что не так с его запросом.

Эффективность генерации

GPT-5 Thinking работает лучше, чем OpenAI o3, сокращая количество выходных токенов на 50-80% при сохранении или улучшении качества ответа. Это значит, что модель будет дешевле.

Единственная независимая оценка

GPT-5 занял первое место во всех категориях на платформе LM Arena – открытой исследовательской платформе для оценки и сравнения нейросетей на основе голосов реальных людей.

📌ИИ не умеют в шахматы. Нейросети позорно проиграли 50-летней консоли

GPT-5 на практике

Помимо сухих цифр OpenAI и ранние пользователи демонстрируют впечатляющие практические результаты. По отзывам, GPT-5 позиционируется как «лучший ИИ-программист». Он умеет:

  • По идее или документу собирать готовую веб-страницу.

  • Автоматически прописывать стили (CSS), реализовывать состояния кнопок и интерактивных элементов, может добавить анимации.

  • Создавать полноценные приложения и игры.

Еще модель специально обучена не просто генерировать код, а анализировать стиль существующего и создавать новый в том же стиле для удобства тестирования и отладки написанного.

Решена проблема оверинженеринга

Пользователи отмечают, что GPT-5 все еще может «оверинженерить» (чрезмерно усложнять решение) простых задач, особенно при плохо сформулированных промптах. Однако отличие от моделей вроде Claude Opus 4 в том, что оверинженеринг GPT-5 работает с первого раза. 

При длительной работе с ней можно быть более уверенным, что она не наделала «призрачных функций» – неиспользуемых частей кода, что было давней проблемой при вайбкодинге с ИИ.

Реальные проекты

Сотрудник OpenAI попросил GPT-5 сделать приложение для изучения французского языка с требованиями к дизайну, анимациям, мини-играми и озвучкой. GPT-5 написала 700 строчек кода за 2 минуты и выдала готовое приложение.

Интерактивная диаграмма, доступная по ссылке, была создана GPT-5 по одному промпту.

Сайт по ссылке был создан всего за 3 запроса к GPT-5.

А мне удалось создать рабочую и довольно симпатичную змейку, всего лишь написав «сделай видеоигру змейка».

📌Нейросеть обманула пожилую пару: пенсионеры проехали 370 км ради несуществующей канатной дороги

Сколько стоит GPT-5?

GPT-5 будет доступен всем пользователям ChatGPT в качестве модели по умолчанию. Но на разных уровнях подписки разное количество бесплатных запросов в день, а пользователи с подпиской получат доступ раньше. Сейчас доступ зависит от типа учетной записи:

ChatGPT Free:

  • Доступ к GPT-5 появится позже всех.

  • Будет предоставлено ограниченное число бесплатных запросов к GPT-5 в день.

  • После исчерпания дневного лимита пользователя автоматически переключит на GPT-5 Mini.

ChatGPT Plus ($20 в месяц/1600 рублей):

  • Увеличены лимиты на использование GPT-5.

  • Доступ к GPT-5 раньше, чем у Free-пользователей.

ChatGPT Pro ($200 в месяц/16 000 рублей):

  • Уже получили неограниченный доступ к основной GPT-5.

  • Имеют доступ к эксклюзивной GPT-5 Pro с повышенной производительностью.

В корпоративных тарифах (Team, Edu, Enterprise) GPT-5 станет основной моделью уже на следующей неделе.

Как воспользоваться GPT-5 бесплатно

Microsoft Copilot

Готово – бесплатный и рабочий GPT-5. Но никто точно не знает, какая именно версия GPT-5 используется в Copilot, а Microsoft обычно настраивает модели OpenAI немного иначе, чем разработчики, поэтому поведение может отличаться от чистого GPT-5.

GPT5.Space

  • Перейдите на сайт

  • Зарегистрируйтесь.

  • В разное время доступен разный пул моделей: GPT-5 Mini, GPT-5 Nano и стандартная GPT-5.

Платить не нужно, но есть лимиты на количество запросов. Сайт неофициальный, поэтому используйте его с осторожностью, не вводите приватную информацию.

Телеграм-бот

  • Перейдите в бота по ссылке или найдите его по имени @gpt_chat_chatgpt_bot.

  • Дает бесплатный доступ, но только к GPT-5 Mini.

Ждем независимые тесты

Анонс GPT-5 – важнейшее событие на рынке ИИ. Практические примеры и первые пользовательские отзывы рисуют картину мощного инструмента. 

Однако главный вопрос остается прежним: насколько универсально, стабильно и значительно превосходство GPT-5 над флагманами конкурентов на всем спектре задач, а не только на выбранных OpenAI бенчмарках? Ведь в некоторых из них, например SWE-bench и GPQA, разрыв с Claude Opus или Grok минимален.

Пока что это заявленный OpenAI огромный шаг вперед, реальный масштаб которого еще предстоит подтвердить.

***

Что такое агентский режим работы нейросети и как он поможет вам заказать роллы

ИИ-группа притворялась настоящей и была в топе Spotify! Как раскрыли сгенерированный коллектив