Температура (параметр генерации)

Искусственный интеллект LLM Промптинг Обновлено 11 мая 2026

Коротко

Температура — это число от 0 до примерно 2, которое управляет тем, насколько модель «креативит» в ответе. При температуре около 0 модель почти всегда выбирает самый вероятный следующий токен — ответы получаются предсказуемыми и стабильными. С ростом температуры она чаще выбирает менее вероятные варианты, и текст становится разнообразнее, но и менее точным. Для классификации и точных ответов берут низкую температуру, для творческих задач — выше.

Температура — один из главных параметров генерации в LLM. Технически она масштабирует «решительность» модели в выборе следующего токена.

Как выбирать температуру

0,0–0,3 — точные задачи: классификация, извлечение данных, JSON-форматы, генерация кода.
0,3–0,7 — содержательные ответы на вопросы, поддержка клиентов, аналитика.
0,7–1,2 — креативные задачи: тексты для маркетинга, идеи, генерация вариантов.
выше 1,2 — для экспериментов и нестандартных задач; обычные приложения здесь редко работают.

Что важно

Низкая температура не делает ответ «верным», только более стабильным. Если модель часто ошибается на этом запросе, при температуре 0 она будет ошибаться одинаково.
Температура взаимодействует с top-p и top-k — другими параметрами генерации; обычно меняют что-то одно.

Когда применять и когда нет

Применять

Когда настраиваете LLM-сервис под продакшн
Когда замечаете нестабильность ответов в одинаковых сценариях
Когда задача требует разнообразных вариантов (например, генерация заголовков)

Не применять

Не нужно для каждого запроса вручную крутить температуру в коде — обычно её задают на уровне продукта или роли модели

Примеры применения

В одном и том же приложении могут жить два режима: для классификации заявок поддержки — температура 0,1, чтобы один и тот же тикет всегда попадал в одну категорию; для «помоги придумать варианты ответа клиенту» — температура 0,7, чтобы каждый раз получать несколько разных формулировок.

Часто задаваемые вопросы

Что лучше: низкая или высокая температура?

Зависит от задачи. Для точных и повторяемых ответов — низкая, для творческих и разнообразных — высокая. Единого «правильного» значения нет: его подбирают экспериментально для каждой задачи в продукте.

Если поставить температуру 0, ответы станут одинаковыми?

В теории — да, в практике почти всегда одинаковыми, но идеальной повторяемости современные API не гарантируют. Некоторые провайдеры добавляют скрытый jitter, поэтому даже при температуре 0 ответы могут немного отличаться от запуска к запуску.

Помог ли вам этот материал?

Температура (параметр генерации)

Как выбирать температуру

Что важно

Когда применять и когда нет

✓ Применять

✗ Не применять

Примеры применения

Часто задаваемые вопросы

Связанные термины

Родительские понятия:

Также см.:

Готовы применить теорию на практике?

Применять

Не применять