Цепочка рассуждений (chain-of-thought)
Идея кажется простой, но эффект оказался серьёзным. Если модели позволено развернуть рассуждение, она реже срезает углы и реже ошибается там, где задача требует нескольких шагов.
Варианты
- Простой — добавить в промпт фразу «рассуждай шаг за шагом перед ответом».
- С примером — показать в few-shot примере, как именно нужно рассуждать.
- Самосогласование — попросить модель сгенерировать несколько вариантов рассуждения и выбрать наиболее частый ответ.
- Скрытое рассуждение — попросить рассуждать в отдельной служебной части, а пользователю показать только итоговый ответ.
Что важно помнить
- Цепочка рассуждений увеличивает длину ответа и его стоимость.
- Иногда модель «рассуждает» правдоподобно, но всё равно приходит к неверному ответу — это не серебряная пуля.
Когда применять и когда нет
Применять
- Логические и математические задачи
- Задачи с несколькими условиями и подзадачами
- Когда модель явно «срезает углы» и ошибается на простых вопросах
Не применять
- Простые классификации и короткие фактические ответы — рассуждение тут только увеличит стоимость
- Когда ответ нужен в чётком коротком формате (например, одно слово или JSON-структура)
Примеры применения
Если попросить модель «сколько грузовиков нужно, чтобы перевезти 12 тонн груза при грузоподъёмности 1,8 тонн», она может уверенно ответить «6». Добавляем «рассуждай шаг за шагом», и модель пишет: «1,8 × 6 = 10,8 — не хватает; 1,8 × 7 = 12,6 — достаточно; значит, нужно 7 грузовиков». Маленькое изменение промпта — заметно более надёжный ответ.
Часто задаваемые вопросы
Модель не думает в человеческом смысле — она просто генерирует более длинный текст, в котором каждый следующий шаг опирается на предыдущий. Это даёт ей возможность не «угадывать» ответ сразу, а постепенно прийти к нему. Но за самим текстом нет сознательного рассуждения, и иногда модель убедительно ошибается на каждом шаге.
Это специально обученные модели, которые рассуждают внутри себя по умолчанию и часто заметно дольше, чем обычные. Они лучше работают в логических и математических задачах, но стоят дороже и медленнее. Для простых задач классической модели обычно достаточно.