Skip to content

Языковые модели

Языковая модель — это «мозг» вашего бота. От выбора модели зависит качество ответов и стоимость.

Доступные модели

OpenAI

МодельОписаниеКонтекстInput Sol/1KOutput Sol/1K
GPT-4o miniБыстрая и экономичная. Лучший выбор для большинства задач128K0.0150.06
GPT-4oПроверенная временем. Стабильная и предсказуемая128K0.251.0
GPT-4.1Улучшенное следование инструкциям и работа с кодом1M0.20.8
GPT-4.1 MiniОблегчённая 4.1 с хорошим балансом цены и качества1M0.040.16
GPT-4.1 NanoСамая компактная и экономичная версия 4.11M0.010.04
GPT-5 NanoСамая экономичная модель 5-го поколения1M0.0050.04
GPT-5 MiniКомпактная GPT-5. Быстрая и точная1M0.0250.2
GPT-5Базовая модель 5-го поколения. Мощная и универсальная1M0.1251.0
GPT-5.1Улучшенная GPT-5 с повышенной точностью1M0.1251.0
GPT-5.2Продвинутая с расширенными возможностями рассуждения1M0.1751.4

Google

МодельОписаниеКонтекстInput Sol/1KOutput Sol/1K
Gemini FlashСверхбыстрая модель Google. Минимальная стоимость1M0.0080.03

Anthropic

МодельОписаниеКонтекстInput Sol/1KOutput Sol/1K
Claude Haiku 4.5Быстрая и экономичная для типовых задач200K0.080.4
Claude Sonnet 4Универсальная с балансом цены и качества200K0.31.5
Claude Sonnet 4.6Новейшая Sonnet. Улучшенное следование инструкциям1M0.31.5
Claude Opus 4.6Флагман Anthropic для сложных задач1M1.57.5

Как выбрать модель?

Для большинства задач → GPT-4o mini

Самый популярный выбор. Быстрая, дешёвая, хорошо справляется с типовыми вопросами-ответами, работой с базой знаний, Avito.

Для сложных промптов → GPT-4.1 или Claude Sonnet 4.6

Если бот должен строго следовать длинным инструкциям, работать со сложными сценариями, анализировать контекст — выбирайте модели помощнее.

Для максимальной экономии → GPT-5 Nano или Gemini Flash

Если важна каждая копейка — это самые дешёвые модели. Качество ниже, но для простых ботов достаточно.

Для максимального качества → Claude Opus 4.6

Самая умная модель на платформе. Но и самая дорогая — в 100 раз дороже GPT-4o mini. Используйте только для задач где качество критично.

Температура

Температура влияет на «креативность» ответов бота:

  • 0.0 — максимально точный и предсказуемый. Одни и те же ответы на одинаковые вопросы.
  • 0.2 (по умолчанию) — немного разнообразия, но в рамках инструкций.
  • 0.5 — заметно разнообразнее. Хорошо для творческих задач.
  • 1.0 — максимально креативный. Может выдавать неожиданные ответы.

Рекомендация: для бизнес-ботов оставляйте 0.1–0.3. Для творческих задач — 0.5–0.7.

Что влияет на расход Sol

  1. Выбранная модель — GPT-5 Nano в 50 раз дешевле Claude Opus
  2. Длина промпта — длинный промпт = больше входных токенов каждый запрос
  3. Количество функций — описание каждой функции всегда в контексте
  4. История диалога — чем длиннее диалог, тем больше контекст
  5. Длина ответов бота — output токены дороже input

Пример расчёта

Типичный диалог на GPT-4o mini:

  • 5000 входных токенов × 0.015 Sol/1K = 0.075 Sol
  • 300 выходных токенов × 0.06 Sol/1K = 0.018 Sol
  • Итого: 0.093 Sol за один диалог

При тарифе «Текст Бизнес» (310 Sol/мес) хватит на ~3 300 диалогов.

AI Business Platform