Claude Sonnet 5 против Sonnet 4.6
Замена model-id проходит без изменений кода — но три несовместимых изменения и новый токенизатор могут застать вас врасплох. Вот что именно нужно поменять в ваших интеграциях API и релея, прежде чем переключаться.
Вердикт: простая замена model-id — но сначала протестируйте
Claude Sonnet 5 (выпущен 2026-06-30) — рекомендуемый преемник Sonnet 4.6, который приближается к качеству класса Opus 4.8 по более низкой цене. Заменить model-id тривиально; подвох кроется в окружающем контракте запроса.
Тот же Messages API, тот же эндпоинт, та же аутентификация. Измените model-id с claude-sonnet-4-6 на claude-sonnet-5 (Bedrock: anthropic.claude-sonnet-5), и большинство запросов просто заработают. Контекстное окно по умолчанию увеличивается до 1M токенов — меньшего варианта выбирать не нужно — а максимальный вывод составляет 128K (до 300K через beta-заголовок пакетов output-300k-2026-03-24).
Адаптивное мышление теперь включено по умолчанию, поэтому задержка и форма вывода меняются; ручная настройка расширенного мышления и любые нестандартные temperature/top_p/top_k теперь возвращают HTTP 400; а новый токенизатор меняет ваши подсчёты токенов. Направьте небольшой процент трафика на Sonnet 5, прогоните свои проверки, затем наращивайте. Никакого крайнего срока принудительной миграции, который бы вас торопил, нет.
Различия спецификаций: Sonnet 4.6 против Sonnet 5
Сопоставление полей, которые реально влияют на вашу интеграцию.
| Спецификация | Claude Sonnet 4.6 | Claude Sonnet 5 |
|---|---|---|
| Model id | claude-sonnet-4-6 | claude-sonnet-5 (снимок без даты) |
| Контекстное окно | Стандартное окно Sonnet 4.6 | 1M токенов (по умолчанию = максимум) |
| Максимальный вывод | Лимит вывода Sonnet 4.6 | 128K (300K через beta-заголовок пакетов) |
| Мышление | Расширенное мышление настраивается явно | Адаптивное мышление включено по умолчанию; уровень усилий low→max (по умолчанию high) |
| Параметры сэмплирования | temperature / top_p / top_k принимаются | Нестандартные значения возвращают HTTP 400 — опускайте их |
| Цена (ввод / вывод) | $3 / $15 за MTok | $2 / $10 вводная до 31 августа 2026, затем $3 / $15 |
| Статус жизненного цикла | Активна (предварительное снятие с эксплуатации не ранее 17 февраля 2027) | Новый рекомендуемый вариант по умолчанию |
Цены и спецификации согласно anthropic.com/news/claude-sonnet-5 и документации platform.claude.com. Обучающие данные до января 2026. Вводная цена ограничена по времени, а не постоянна.
3 несовместимых изменения, которые нужно учесть
Это различия контракта запроса, способные превратить успешный деплой в стену из ошибок HTTP 400 или неожиданного поведения. Исправьте все три, прежде чем менять model-id в продакшене.
Sonnet 5 рассуждает адаптивно из коробки, поэтому ответы могут включать фазу мышления, которую вы не включали на 4.6. Это меняет задержку, форму потоковой передачи и расход токенов. Управляйте этим через уровни усилий — low, medium, high, xhigh, max (по умолчанию high) — вместо ручного включения и выключения мышления.
Поскольку мышление адаптивно по умолчанию, явная настройка ручных блоков или блоков расширенного мышления, как вы могли делать на более ранних моделях, теперь возвращает HTTP 400. Удалите любую явную конфигурацию мышления из построителя запросов и полагайтесь на параметр effort.
Точно как Opus 4.7 и более поздние, Sonnet 5 отклоняет нестандартные temperature, top_p и top_k с HTTP 400. Уберите эти поля из полезной нагрузки (или оставьте их значениями по умолчанию, просто опустив их). Проверьте обёртки SDK и промежуточное ПО релея, которые автоматически подставляют temperature по умолчанию.
Новый токенизатор: ~30% больше токенов на тот же текст
Это наименее очевидное изменение и то, которое с наибольшей вероятностью разрушит ваши бюджеты и логику усечения.
Sonnet 5 поставляется с новым токенизатором. Идентичная входная строка кодируется примерно на 30% большим числом токенов, чем производил Sonnet 4.6. В вашем тексте ничего не меняется — меняется подсчёт. Это переоценивает каждый запрос и переформирует каждый бюджет max_tokens, поэтому вводную цену $2/$10 лучше воспринимать как примерно нейтральную по стоимости по сравнению с $3/$15 у Sonnet 4.6 на том же тексте, а не как ровную скидку 33%.
Поскольку выходные токены плотнее, фиксированное значение max_tokens теперь покрывает меньше символов сгенерированного текста. Если вы ограничиваете max_tokens для структурированного вывода, поднимите потолок, иначе ответы могут усекаться на полуслове там, где 4.6 завершал.
Подсчёты входных и выходных токенов оба растут на ~30% для того же содержимого, поэтому фактические расходы за запрос выше, чем предполагает разница в номинальной цене. Пересчитайте свою модель стоимости на реальном трафике, а не считайте снижение цены чистой экономией.
Не переиспользуйте оценки токенов Sonnet 4.6. Используйте эндпоинт count_tokens против Sonnet 5, чтобы заново измерить промпты, запас контекстного окна и бюджеты лимитов скорости, прежде чем фиксировать продакшен-ограничения.
Миграция в одном diff
Вся миграция обычно сводится к: смените model-id и удалите поля сэмплирования и ручного мышления. Вот минимальный пример до/после.
{
"model": "claude-sonnet-4-6",
"max_tokens": 4096,
"temperature": 0.7,
"top_p": 0.9,
"messages": [...]
}
{
"model": "claude-sonnet-5",
"max_tokens": 4096,
// omit temperature / top_p / top_k
// adaptive thinking is on by default
"messages": [...]
}
Сохраните тот же эндпоинт, заголовки и токен аутентификации. Удалите temperature, top_p и top_k (нестандартные значения дают 400). Уберите любую явную конфигурацию расширенного мышления; используйте вместо неё параметр effort. Перепроверьте max_tokens против нового токенизатора, чтобы длинные ответы не усекались. На релее примените те же правки в промежуточном ПО, чтобы оно не подставляло temperature по умолчанию заново.
Sonnet 4.6 НЕ снят с эксплуатации — принудительной миграции нет
Claude Sonnet 4.6 (claude-sonnet-4-6) остаётся активной. Anthropic указывает предварительное снятие с эксплуатации не ранее 17 февраля 2027, и эта дата может измениться. Sonnet 5 — рекомендуемый новый вариант по умолчанию, но у вас нет крайнего срока: держите 4.6 в продакшене, пока проверяете 5 в своём темпе, а затем переключайтесь, когда ваши проверки станут зелёными.
FAQ по миграции
Стоит ли обновляться с Sonnet 4.6 до Sonnet 5?
Для большинства рабочих нагрузок — да: Sonnet 5 приближается к качеству класса Opus 4.8 по более низкой номинальной цене и является рекомендуемым преемником. Но относитесь к этому как к изменению кода, а не к переключению конфигурации: замена model-id проходит без изменений, однако адаптивное мышление теперь включено по умолчанию, а ручное расширенное мышление или нестандартные temperature/top_p/top_k теперь возвращают HTTP 400. Сначала мигрируйте небольшой процент трафика, прогоните свои проверки, затем наращивайте. Крайнего срока принудительной миграции нет, так что можно не спешить.
Почему Sonnet 5 считает больше токенов на тот же текст?
Sonnet 5 поставляется с новым токенизатором. Идентичная входная строка кодируется примерно на 30% большим числом токенов, чем производил Sonnet 4.6. Подсчёты входных и выходных токенов за запрос растут, ваш бюджет max_tokens покрывает меньше символов, а фактическая стоимость кредитов за запрос выше, чем предполагает сырая разница цены за токен. Именно поэтому вводную цену $2/$10 лучше воспринимать как примерно нейтральную по стоимости по сравнению с $3/$15 у Sonnet 4.6 на том же тексте — а не как ровную скидку 33%.
Работают ли ещё мои параметры temperature, top_p и top_k?
Нет. Как и Opus 4.7 и более поздние, Sonnet 5 отклоняет нестандартные temperature, top_p и top_k с HTTP 400 — просто опустите эти поля. Явная или ручная конфигурация расширенного мышления также возвращает HTTP 400, поскольку адаптивное мышление включено по умолчанию; управляйте рассуждением через уровни усилий low / medium / high / xhigh / max (по умолчанию high). Проверьте свой построитель запросов и промежуточное ПО релея на предмет захардкоженных параметров сэмплирования, прежде чем менять model-id.
Исчезнет ли Sonnet 4.6?
Нет. Claude Sonnet 4.6 остаётся активной, с предварительным снятием с эксплуатации не ранее 17 февраля 2027, что может измениться. Sonnet 5 — рекомендуемый новый вариант по умолчанию, но крайнего срока принудительной миграции нет — вы можете продолжать работать на 4.6 в продакшене, пока проверяете 5.
Перейдите на Claude Sonnet 5 в QCode
Запускайте Sonnet 5 и Sonnet 4.6 бок о бок через один эндпоинт API и Claude Code — меняйте model-id, сравнивайте проверки и наращивайте, когда будете готовы.
Связанные руководства
Обзор Claude Sonnet 5
Спецификации, позиционирование и доступность новой модели среднего уровня по умолчанию от Anthropic.
Sonnet 5 против Opus 4.8
Когда среднего уровня достаточно и когда для самых сложных задач всё же нужен Opus 4.8.
Claude Sonnet 5 API
Эндпоинты, уровни усилий, потоковая передача и изменения контракта запроса в деталях.
Цены Claude Sonnet 5
Вводные и стандартные тарифы, цены на кэш и реальное влияние токенизатора на стоимость.