<div><img src="https://mc.yandex.ru/watch/56654995" style="position:absolute; left:-9999px;" alt="" /></div>
Попробовать бесплатно
Фаза

Тег: Обучение моделей

Термины, отмеченные тегом «Обучение моделей» — 5 терминов.

Дистилляция модели

Метод, при котором маленькая «ученическая» модель обучается имитировать ответы большой «учительской» — получается дешёвая модель с близким качеством.

Обучение с подкреплением

Подход, в котором агент действует в среде, получает награды и штрафы и постепенно учится стратегии, максимизирующей суммарную награду.

Обучение с подкреплением на обратной связи человека (RLHF)

Метод, в котором модель улучшают, используя оценки людей: они сравнивают разные ответы и направляют обучение в сторону предпочтительных.

Предобучение модели

Этап тренировки большой нейросети на огромных объёмах общих данных перед последующей тонкой настройкой под конкретные задачи.

Тонкая настройка модели

Дообучение готовой модели на небольшом наборе своих данных, чтобы адаптировать её под конкретную задачу, домен или стиль.