Тема
Языковые модели
Языковая модель — это «мозг» вашего бота. От выбора модели зависит качество ответов и стоимость.
Доступные модели
OpenAI
| Модель | Описание | Контекст | Input Sol/1K | Output Sol/1K |
|---|---|---|---|---|
| GPT-4o mini | Быстрая и экономичная. Лучший выбор для большинства задач | 128K | 0.015 | 0.06 |
| GPT-4o | Проверенная временем. Стабильная и предсказуемая | 128K | 0.25 | 1.0 |
| GPT-4.1 | Улучшенное следование инструкциям и работа с кодом | 1M | 0.2 | 0.8 |
| GPT-4.1 Mini | Облегчённая 4.1 с хорошим балансом цены и качества | 1M | 0.04 | 0.16 |
| GPT-4.1 Nano | Самая компактная и экономичная версия 4.1 | 1M | 0.01 | 0.04 |
| GPT-5 Nano | Самая экономичная модель 5-го поколения | 1M | 0.005 | 0.04 |
| GPT-5 Mini | Компактная GPT-5. Быстрая и точная | 1M | 0.025 | 0.2 |
| GPT-5 | Базовая модель 5-го поколения. Мощная и универсальная | 1M | 0.125 | 1.0 |
| GPT-5.1 | Улучшенная GPT-5 с повышенной точностью | 1M | 0.125 | 1.0 |
| GPT-5.2 | Продвинутая с расширенными возможностями рассуждения | 1M | 0.175 | 1.4 |
Google
| Модель | Описание | Контекст | Input Sol/1K | Output Sol/1K |
|---|---|---|---|---|
| Gemini Flash | Сверхбыстрая модель Google. Минимальная стоимость | 1M | 0.008 | 0.03 |
Anthropic
| Модель | Описание | Контекст | Input Sol/1K | Output Sol/1K |
|---|---|---|---|---|
| Claude Haiku 4.5 | Быстрая и экономичная для типовых задач | 200K | 0.08 | 0.4 |
| Claude Sonnet 4 | Универсальная с балансом цены и качества | 200K | 0.3 | 1.5 |
| Claude Sonnet 4.6 | Новейшая Sonnet. Улучшенное следование инструкциям | 1M | 0.3 | 1.5 |
| Claude Opus 4.6 | Флагман Anthropic для сложных задач | 1M | 1.5 | 7.5 |
Как выбрать модель?
Для большинства задач → GPT-4o mini
Самый популярный выбор. Быстрая, дешёвая, хорошо справляется с типовыми вопросами-ответами, работой с базой знаний, Avito.
Для сложных промптов → GPT-4.1 или Claude Sonnet 4.6
Если бот должен строго следовать длинным инструкциям, работать со сложными сценариями, анализировать контекст — выбирайте модели помощнее.
Для максимальной экономии → GPT-5 Nano или Gemini Flash
Если важна каждая копейка — это самые дешёвые модели. Качество ниже, но для простых ботов достаточно.
Для максимального качества → Claude Opus 4.6
Самая умная модель на платформе. Но и самая дорогая — в 100 раз дороже GPT-4o mini. Используйте только для задач где качество критично.
Температура
Температура влияет на «креативность» ответов бота:
- 0.0 — максимально точный и предсказуемый. Одни и те же ответы на одинаковые вопросы.
- 0.2 (по умолчанию) — немного разнообразия, но в рамках инструкций.
- 0.5 — заметно разнообразнее. Хорошо для творческих задач.
- 1.0 — максимально креативный. Может выдавать неожиданные ответы.
Рекомендация: для бизнес-ботов оставляйте 0.1–0.3. Для творческих задач — 0.5–0.7.
Что влияет на расход Sol
- Выбранная модель — GPT-5 Nano в 50 раз дешевле Claude Opus
- Длина промпта — длинный промпт = больше входных токенов каждый запрос
- Количество функций — описание каждой функции всегда в контексте
- История диалога — чем длиннее диалог, тем больше контекст
- Длина ответов бота — output токены дороже input
Пример расчёта
Типичный диалог на GPT-4o mini:
- 5000 входных токенов × 0.015 Sol/1K = 0.075 Sol
- 300 выходных токенов × 0.06 Sol/1K = 0.018 Sol
- Итого: 0.093 Sol за один диалог
При тарифе «Текст Бизнес» (310 Sol/мес) хватит на ~3 300 диалогов.