Технологии и ИИ

Илья Бердыш
19 дек. 2025 г.
·
Обновлено
19 дек. 2025 г.
29 сентября 2025 года компания Anthropic выпустила Claude Sonnet 4.5 — модель, которая на момент релиза стала лучшей в мире для программирования, создания автономных агентов и управления компьютером. Это сбалансированная модель, которая сочетает высокую производительность с разумной ценой.

Sonnet 4.5 показала 77.2% на тесте SWE-bench Verified и 61.4% на OSWorld (тест управления компьютером). Цена осталась прежней — $3 за миллион входных токенов и $15 за миллион выходных, как у Sonnet 4.
Что такое Claude Sonnet 4.5

Claude Sonnet 4.5 — это большая языковая модель от Anthropic, оптимизированная для сложных задач программирования, создания автономных агентов и долгосрочных проектов. Это "рабочая лошадка" линейки Claude — не такая мощная, как Opus 4.5, но значительно быстрее и дешевле.
Модель способна поддерживать фокус на задаче более 30 часов без потери качества. Это критично для сложных многоступенчатых проектов — рефакторинга больших кодовых баз, миграций между технологиями, долгосрочных исследований.
Sonnet 4.5 доступна через API Anthropic (идентификатор claude-sonnet-4-5), веб-приложение claude.ai, мобильные приложения для iOS и Android, а также через облачные платформы Amazon Bedrock, Google Vertex AI и Azure. Контекстное окно составляет 200,000 токенов (доступна бета-версия с 1,000,000 токенов), максимальный вывод — до 64,000 токенов, база знаний актуальна до января 2025 года.
Главные достижения Sonnet 4.5
На момент релиза 29 сентября 2025 года Sonnet 4.5 была лучшей моделью для программирования в мире с результатом 77.2% на SWE-bench Verified. С использованием high compute (параллельные попытки и отбор лучших решений) модель достигает 82.0% — это был абсолютный рекорд до выхода Opus 4.5.
На тесте OSWorld, который проверяет способность управлять реальными компьютерными задачами, Sonnet 4.5 показала 61.4%. Это огромный скачок по сравнению с Sonnet 4, которая достигала 42.2% всего четыре месяца назад. Рост составил 45% за короткий период.
Модель также показала значительные улучшения в специализированных областях. Эксперты в финансах, праве, медицине и точных науках отметили драматически лучшие знания и рассуждения по сравнению с предыдущими моделями, включая Opus 4.1.
Extended thinking и длинный контекст
Sonnet 4.5 поддерживает extended thinking — режим, когда модель "думает" перед ответом, что улучшает качество решения сложных задач. Доступны два режима вывода: summarized (краткое резюме мыслей) и interleaved (мысли вперемешку с основным ответом).
Для организаций доступна бета-версия с контекстным окном в 1 миллион токенов — это в 5 раз больше стандартных 200,000. Такой объём критичен для анализа огромных кодовых баз, обработки множества документов одновременно или работы с очень длинными транскриптами встреч.
Безопасность и выравнивание
Anthropic утверждает, что Sonnet 4.5 — самая выровненная frontier-модель на момент релиза. Компания значительно снизила проблемное поведение: угодничество (sycophancy), обман, стремление к власти и поощрение заблуждений.
Модель также получила улучшенную защиту от prompt injection — атак, когда злоумышленники внедряют вредоносные инструкции в обычные запросы. Это критично для агентов, которые работают с внешними данными.
Сравнение с конкурентами
В конце сентября 2025 года рынок больших языковых моделей был очень конкурентным. Claude Sonnet 4.5 вышла вместе с другими сильными моделями от OpenAI и Google. Каждая компания заявляла о прорывных результатах, но реальные показатели различались в зависимости от теста.
Ключевые параметры для сравнения — производительность на стандартных тестах, цена, размер контекста, скорость работы и дополнительные возможности. Для автономных агентов особенно важны результаты на OSWorld и способность поддерживать долгосрочные задачи.
Характеристика | Claude Sonnet 4.5 | Claude Opus 4.5 | GPT-5.2 | GPT-5.1 | Gemini 3 Pro |
Дата выхода | 29 сентября 2025 | 24 ноября 2025 | 12 декабря 2025 | Ноябрь 2025 | Ноябрь 2025 |
Разработчик | Anthropic | Anthropic | OpenAI | OpenAI | Google DeepMind |
Контекст | 200K / 1M (бета) | 200K токенов | 128K токенов | ~200K токенов | 2M токенов |
Макс. вывод | 64K токенов | 64K токенов | 64K токенов | ~16K токенов | 64K токенов |
Цена вход/выход | $3 / $15 за 1M | $5 / $25 за 1M | $2 / $10 за 1M | $1.25 / $10 за 1M | $2 / $12 за 1M |
SWE-bench Verified | 77.2% (82.0% high compute) | 80.9% 🥇 | ~78% | 77.9% | 76.2% |
OSWorld | 61.4% 🥇 (на момент релиза) | Отличная | Средняя | Хорошая | Хорошая |
Программирование | Отличная | Лучшая | Отличная | Отличная | Отличная |
Агенты | Отличная | Лучшая | Хорошая | Хорошая | Хорошая |
Математика | Отличная | Отличная | Отличная | Отличная | Отличная |
Скорость | Быстрая | Средняя | Быстрая | Средняя | Быстрая |
Extended thinking | ✅ Есть | ✅ Есть | ✅ Есть (o1) | ✅ Есть (o1) | ❌ Нет |
Память | ✅ Бета | ✅ Бета | ✅ Есть | ✅ Есть | ❌ Нет |
Долгосрочные задачи | 30+ часов | 30+ часов | Средние | Средние | Средние |
Мультимодальность | Текст + изображения | Текст + изображения | Текст + изображения + аудио | Текст + изображения + аудио | Текст + изображения + видео |
Выводы из сравнения:
Claude Sonnet 4.5 предлагает лучшее соотношение цены и качества для программирования и создания агентов. За $3/$15 вы получаете 77.2% на SWE-bench (82.0% с high compute) и лучший результат на OSWorld (61.4%). Способность работать 30+ часов на одной задаче делает её идеальной для долгосрочных проектов.
mymeet.ai для автоматизации любых встреч

mymeet.ai — это AI-платформа для автоматической записи, транскрибации и анализа онлайн-встреч в Zoom, Google Meet, Microsoft Teams и других сервисах видеосвязи.
Платформа использует продвинутые языковые модели для обработки встреч. Модели уровня Claude Sonnet 4.5 обеспечивают баланс скорости и качества — встречи обрабатываются за минуты, при этом точность анализа остаётся высокой.

Как работает AI-обработка встреч:
Запись происходит автоматически. Достаточно подключить mymeet.ai к календарю — бот будет присоединяться к встречам и записывать их без участия пользователя.
Транскрибация в реальном времени. AI распознаёт речь участников на 50+ языках с точностью 95-98%, правильно определяя спикеров и расставляя тайм-коды.

Генерация протокола за 60 секунд. После окончания встречи AI анализирует транскрипт и создаёт структурированное саммари с ключевыми темами, решениями и задачами.
Автоматическое извлечение action items. Модель определяет, кто и что должен сделать, с какими сроками. Задачи можно отправить в Asana, Jira, Linear одним кликом.

Преимущества для бизнеса:
Экономия времени менеджеров. Вместо 15-20 минут на составление протокола вручную — готовый документ через минуту.
Повышение продуктивности продаж. CRM автоматически обновляется после каждого звонка с клиентом — записываются боли, возражения, следующие шаги.
Улучшение процесса найма. Все интервью записываются и анализируются, команда может вернуться к любой встрече и пересмотреть ответы кандидата.
Знания не теряются. Все встречи индексируются и доступны через поиск. Можно найти любое обсуждение по ключевым словам.
Попробовать бесплатно: mymeet.ai

Цены и использование
Стоимость Claude Sonnet 4.5 осталась такой же, как у Sonnet 4 — $3 за миллион входных токенов и $15 за миллион выходных токенов. Это делает модель доступной для масштабных проектов при сохранении высокой производительности.
Дополнительную экономию можно получить через кэширование промптов (до 90% скидки) и пакетную обработку (50% скидки). При использовании кэширования повторяющихся частей промпта стоимость может снизиться до $0.30/$1.50 за миллион токенов.
Доступ через приложения
Sonnet 4.5 доступна всем платным пользователям Claude: Pro, Max, Team и Enterprise. В отличие от Opus 4.5, которая имеет лимиты для некоторых тарифов, Sonnet доступна с щедрыми лимитами для всех.
Модель работает в веб-приложении claude.ai, мобильных приложениях iOS и Android, а также через облачные платформы Amazon Bedrock, Google Vertex AI и Microsoft Azure.
Что нового в Sonnet 4.5
Вместе с релизом Sonnet 4.5 Anthropic выпустила Claude Agent SDK — инфраструктуру для создания автономных агентов. Это те же самые инструменты, которые компания использует для создания Claude Code.
SDK решает сложные проблемы: как агенты должны управлять памятью в долгосрочных задачах, как обрабатывать системы разрешений, балансируя автономность и контроль пользователя, и как координировать подагентов, работающих к общей цели.
Основной паттерн — Planner → Worker(s) → Evaluator. Один агент планирует задачу, несколько агентов выполняют части параллельно, один агент проверяет результаты и принимает решения о следующих шагах.
Claude Code обновления
Claude Code — автономный агент для программирования — получил важные обновления с релизом Sonnet 4.5. Главное нововведение — checkpoints, одна из самых запрашиваемых функций. Теперь можно сохранять прогресс и мгновенно откатываться к предыдущему состоянию, если что-то пошло не так.
Обновлён терминальный интерфейс, добавлено нативное расширение для VS Code. Теперь можно работать с Claude Code прямо из редактора кода, не переключаясь между приложениями.
Исполнение кода и создание файлов
В веб-приложении и мобильных приложениях Claude теперь может исполнять код и создавать файлы прямо в диалоге. Доступны таблицы (Excel), презентации (PowerPoint) и документы (Word).
Это означает, что можно попросить Claude проанализировать данные и создать таблицу с графиками, написать отчёт и оформить его в виде документа, или подготовить презентацию — всё без выхода из чата.
Claude for Chrome
Расширение Claude for Chrome, которое использует возможности computer use, стало доступно пользователям Max, которые присоединились к списку ожидания в августе. Расширение позволяет Claude управлять браузером: навигация по сайтам, заполнение форм, работа с таблицами, выполнение задач across tabs.
Для чего лучше всего подходит Sonnet 4.5 Sonnet
Повседневное программирование — написание нового кода, рефакторинг, написание тестов, исправление багов. Sonnet 4.5 показывает отличные результаты при разумной цене.
Создание автономных агентов для production. Способность работать 30+ часов и координировать подагентов делает Sonnet идеальной для сложных workflows.
Управление компьютером и автоматизация задач в браузере через Claude for Chrome. Лучший результат на OSWorld (61.4%) на момент релиза.
Финансовый анализ, юридические исследования, медицинские консультации. Эксперты отметили драматические улучшения в domain-specific знаниях.
Обработка больших объёмов документов с использованием 1M контекста (бета). Анализ целых кодовых баз, множества PDF, длинных транскриптов.
Заключение
Claude Sonnet 4.5 — это лучший баланс цены и качества для программирования и создания агентов на конец 2025 года. За $3/$15 вы получаете производительность, которая была топовой на момент релиза (77.2% на SWE-bench, 82.0% с high compute), и возможность работать над задачами 30+ часов.
Для большинства проектов Sonnet 4.5 предпочтительнее более дорогой Opus 4.5. Разница в производительности (3-4%) не оправдывает двукратный рост цены, если только вам не нужна максимальная точность для критически важных задач.
Sonnet 4.5 — это рабочая лошадка для разработчиков: быстрая, надёжная, доступная по цене и достаточно мощная для решения сложных задач.

Часто задаваемые вопросы (FAQ)
Когда вышла Claude Sonnet 4.5?
Claude Sonnet 4.5 была выпущена 29 сентября 2025 года (30 сентября по UTC) компанией Anthropic. На момент релиза это была лучшая модель в мире для программирования и создания агентов.
Сколько стоит Claude Sonnet 4.5?
Цена Claude Sonnet 4.5 составляет $3 за миллион входных токенов и $15 за миллион выходных токенов. Это та же цена, что была у Sonnet 4. С кэшированием промптов можно получить до 90% скидки, снизив стоимость до $0.30/$1.50 за миллион токенов.
Чем Claude Sonnet 4.5 отличается от Opus 4.5?
Главные отличия: Opus 4.5 мощнее (80.9% vs 77.2% на SWE-bench), имеет параметр effort и вышла на два месяца позже. Sonnet 4.5 быстрее, почти вдвое дешевле ($3/$15 vs $5/$25) и доступна с контекстом 1M токенов в бета-версии. Для большинства задач Sonnet — лучший выбор.
Какой результат Claude Sonnet 4.5 на SWE-bench?
Claude Sonnet 4.5 показала 77.2% на SWE-bench Verified в стандартном режиме. С использованием high compute (параллельные попытки и отбор лучших решений) модель достигает 82.0%. Это был лучший результат в мире до выхода Opus 4.5 в ноябре.
Что такое Claude Agent SDK?
Claude Agent SDK — это инфраструктура от Anthropic для создания автономных агентов. Это те же инструменты, которые компания использует для создания Claude Code. SDK включает решения для управления памятью, системы разрешений и координации подагентов.
Доступна ли Claude Sonnet 4.5 в GitHub Copilot?
Да, Claude Sonnet 4.5 доступна в GitHub Copilot с 2 октября 2025 года для всех пользователей. Модель можно выбрать в настройках Copilot в VS Code, Visual Studio, JetBrains IDEs, Xcode, Eclipse и GitHub Mobile.
Какой размер контекста у Claude Sonnet 4.5?
Стандартное контекстное окно — 200,000 токенов, максимальный вывод — 64,000 токенов. Для организаций в usage tier 4 или с custom rate limits доступна бета-версия с контекстом 1,000,000 токенов — это в 5 раз больше стандарта.
Что такое extended thinking в Sonnet 4.5?
Extended thinking — это режим, когда модель "думает" перед ответом, что улучшает качество на сложных задачах. Доступны два режима вывода: summarized (краткое резюме мыслей) и interleaved (мысли вперемешку с ответом). Можно установить бюджет токенов на размышления, например 64K.
Может ли Sonnet 4.5 работать над задачей 30 часов?
Да, Anthropic сообщает, что Sonnet 4.5 способна поддерживать фокус на сложных многоступенчатых задачах более 30 часов без потери качества. Это критично для рефакторинга больших кодовых баз, миграций и долгосрочных исследований.
Безопаснее ли Sonnet 4.5 чем предыдущие модели?
Да, Anthropic утверждает, что Sonnet 4.5 — самая выровненная frontier-модель на момент релиза. Компания значительно снизила проблемное поведение: угодничество, обман, стремление к власти. Также улучшена защита от prompt injection атак.
Илья Бердыш
19 дек. 2025 г.





