
OpenAI анонсировала GPT-5.6 — семейство из трёх моделей с принципиально новым режимом работы через субагентов и заявленной скоростью генерации 750 токенов в секунду. Разбираем, что это означает на практике: где пересчитывать бюджеты, где перестраивать архитектуру, а где просто переключить модель и получить вдвое дешевле.
Семейство GPT-5.6 строится по принципу цена/мощность:
Главная техническая заявка релиза — 750 токенов в секунду для Sol на чипах Cerebras. Текущий хороший показатель — 100–150 т/с. Разница в 5 раз.
Практические следствия:
Пока доступ к Cerebras-инфраструктуре только у партнёров. Широкий запуск — после наращивания мощностей. Следите за API-документацией.
Одно конкретное изменение, которое влияет на unit-экономику:
Кого это касается в первую очередь: продукты с тяжёлыми системными промптами (>2000 токенов), RAG-архитектуры с частыми обновлениями индекса, чат-боты с длинным контекстом истории диалога.
Что делать: рассчитайте долю кэш-записи в общем объёме токенов за последний месяц. Если она выше 15–20% — изменение заметно скажется на счёте. Возможная оптимизация: реже обновлять кэш (реже менять системный промпт), сжимать контекст до кэширования.
Режим ultra — не просто «больше рассуждений». Sol в этом режиме может порождать и координировать субагентов для выполнения подзадач. Это означает:
Практически это означает, что воркфлоу уровня «проанализируй 50 документов и сделай сводный отчёт» или «найди уязвимости в кодовой базе и предложи патчи» становятся нативными задачами для одного вызова API, а не самописной оркестрацией.
OpenAI разворачивает модель поэтапно — по запросу Администрации США. Партнёры первой волны тестируют модель и применяют её для обнаружения уязвимостей. OpenAI прямо обозначила, что не считает такой порядок постоянной нормой.
Отдельный акцент в анонсе — кибербезопасность. Sol позиционируется как инструмент для защитников: помогает находить слабые места и генерировать патчи, с несколькими слоями ограничений на офенсивное применение.
Если вы используете OpenAI API:
Если строите агентные продукты:
Открытый вопрос: OpenAI не подтвердила, является ли GPT-5.6 новым претрейном или итерацией поверх существующей базы. Косвенные признаки — в пользу второго. Если это так — прирост эффективности впечатляет. Но рынок ждёт принципиально новой большой модели, и этот вопрос GPT-5.6 не закрывает.
---
*Разбираем ИИ-инструменты и автоматизацию в ContentRun Club.*
Понравился материал?
В ContentRun Premium - 500+ гайдов, промптов и инструментов для маркетологов
Получить Premium →5 бесплатных AI-инструментов для бизнеса
Аудит бизнеса, готовая AI-воронка, 50 инструментов и генератор описания проекта - забирай бесплатно, без регистрации.
Открыть AI-набор →