Языковые модели

Языковая модель — это «мозг» вашего бота. От выбора модели зависит качество ответов и стоимость.

Доступные модели

OpenAI

Модель	Описание	Контекст	Input Sol/1K	Output Sol/1K
GPT-4o mini	Быстрая и экономичная. Лучший выбор для большинства задач	128K	0.015	0.06
GPT-4o	Проверенная временем. Стабильная и предсказуемая	128K	0.25	1.0
GPT-4.1	Улучшенное следование инструкциям и работа с кодом	1M	0.2	0.8
GPT-4.1 Mini	Облегчённая 4.1 с хорошим балансом цены и качества	1M	0.04	0.16
GPT-4.1 Nano	Самая компактная и экономичная версия 4.1	1M	0.01	0.04
GPT-5 Nano	Самая экономичная модель 5-го поколения	1M	0.005	0.04
GPT-5 Mini	Компактная GPT-5. Быстрая и точная	1M	0.025	0.2
GPT-5	Базовая модель 5-го поколения. Мощная и универсальная	1M	0.125	1.0
GPT-5.1	Улучшенная GPT-5 с повышенной точностью	1M	0.125	1.0
GPT-5.2	Продвинутая с расширенными возможностями рассуждения	1M	0.175	1.4

Google

Модель	Описание	Контекст	Input Sol/1K	Output Sol/1K
Gemini Flash	Сверхбыстрая модель Google. Минимальная стоимость	1M	0.008	0.03

Anthropic

Модель	Описание	Контекст	Input Sol/1K	Output Sol/1K
Claude Haiku 4.5	Быстрая и экономичная для типовых задач	200K	0.08	0.4
Claude Sonnet 4	Универсальная с балансом цены и качества	200K	0.3	1.5
Claude Sonnet 4.6	Новейшая Sonnet. Улучшенное следование инструкциям	1M	0.3	1.5
Claude Opus 4.6	Флагман Anthropic для сложных задач	1M	1.5	7.5

Как выбрать модель?

Для большинства задач → GPT-4o mini

Самый популярный выбор. Быстрая, дешёвая, хорошо справляется с типовыми вопросами-ответами, работой с базой знаний, Avito.

Для сложных промптов → GPT-4.1 или Claude Sonnet 4.6

Если бот должен строго следовать длинным инструкциям, работать со сложными сценариями, анализировать контекст — выбирайте модели помощнее.

Для максимальной экономии → GPT-5 Nano или Gemini Flash

Если важна каждая копейка — это самые дешёвые модели. Качество ниже, но для простых ботов достаточно.

Для максимального качества → Claude Opus 4.6

Самая умная модель на платформе. Но и самая дорогая — в 100 раз дороже GPT-4o mini. Используйте только для задач где качество критично.

Температура

Температура влияет на «креативность» ответов бота:

0.0 — максимально точный и предсказуемый. Одни и те же ответы на одинаковые вопросы.
0.2 (по умолчанию) — немного разнообразия, но в рамках инструкций.
0.5 — заметно разнообразнее. Хорошо для творческих задач.
1.0 — максимально креативный. Может выдавать неожиданные ответы.

Рекомендация: для бизнес-ботов оставляйте 0.1–0.3. Для творческих задач — 0.5–0.7.

Что влияет на расход Sol

Выбранная модель — GPT-5 Nano в 50 раз дешевле Claude Opus
Длина промпта — длинный промпт = больше входных токенов каждый запрос
Количество функций — описание каждой функции всегда в контексте
История диалога — чем длиннее диалог, тем больше контекст
Длина ответов бота — output токены дороже input

Пример расчёта

Типичный диалог на GPT-4o mini:

5000 входных токенов × 0.015 Sol/1K = 0.075 Sol
300 выходных токенов × 0.06 Sol/1K = 0.018 Sol
Итого: 0.093 Sol за один диалог

При тарифе «Текст Бизнес» (310 Sol/мес) хватит на ~3 300 диалогов.

Языковые модели ​

Доступные модели ​

OpenAI ​

Google ​

Anthropic ​

Как выбрать модель? ​

Для большинства задач → GPT-4o mini ​

Для сложных промптов → GPT-4.1 или Claude Sonnet 4.6 ​

Для максимальной экономии → GPT-5 Nano или Gemini Flash ​

Для максимального качества → Claude Opus 4.6 ​

Температура ​

Что влияет на расход Sol ​

Пример расчёта ​