<div><img src="https://mc.yandex.ru/watch/56654995" style="position:absolute; left:-9999px;" alt="" /></div>
Попробовать бесплатно

Цепочка рассуждений (chain-of-thought)

Идея кажется простой, но эффект оказался серьёзным. Если модели позволено развернуть рассуждение, она реже срезает углы и реже ошибается там, где задача требует нескольких шагов.

Варианты

  • Простой — добавить в промпт фразу «рассуждай шаг за шагом перед ответом».
  • С примером — показать в few-shot примере, как именно нужно рассуждать.
  • Самосогласование — попросить модель сгенерировать несколько вариантов рассуждения и выбрать наиболее частый ответ.
  • Скрытое рассуждение — попросить рассуждать в отдельной служебной части, а пользователю показать только итоговый ответ.

Что важно помнить

  • Цепочка рассуждений увеличивает длину ответа и его стоимость.
  • Иногда модель «рассуждает» правдоподобно, но всё равно приходит к неверному ответу — это не серебряная пуля.

Когда применять и когда нет

Применять

  • Логические и математические задачи
  • Задачи с несколькими условиями и подзадачами
  • Когда модель явно «срезает углы» и ошибается на простых вопросах

Не применять

  • Простые классификации и короткие фактические ответы — рассуждение тут только увеличит стоимость
  • Когда ответ нужен в чётком коротком формате (например, одно слово или JSON-структура)

Примеры применения

Если попросить модель «сколько грузовиков нужно, чтобы перевезти 12 тонн груза при грузоподъёмности 1,8 тонн», она может уверенно ответить «6». Добавляем «рассуждай шаг за шагом», и модель пишет: «1,8 × 6 = 10,8 — не хватает; 1,8 × 7 = 12,6 — достаточно; значит, нужно 7 грузовиков». Маленькое изменение промпта — заметно более надёжный ответ.

Часто задаваемые вопросы

Модель не думает в человеческом смысле — она просто генерирует более длинный текст, в котором каждый следующий шаг опирается на предыдущий. Это даёт ей возможность не «угадывать» ответ сразу, а постепенно прийти к нему. Но за самим текстом нет сознательного рассуждения, и иногда модель убедительно ошибается на каждом шаге.

Это специально обученные модели, которые рассуждают внутри себя по умолчанию и часто заметно дольше, чем обычные. Они лучше работают в логических и математических задачах, но стоят дороже и медленнее. Для простых задач классической модели обычно достаточно.

Готовы применить теорию на практике?

Соберите команду в Shtab — единое пространство для проектов, целей и задач. Бесплатно до 5 человек.