Терминология ИИ и больших языковых моделей: машинное обучение, нейросети, LLM, эмбеддинги, промптинг, RAG, агенты, MLOps, безопасность и этика моделей.
Открытый протокол, по которому LLM и агенты могут единообразно подключаться к внешним инструментам, источникам данных и сервисам.
Практики и инструменты для разработки, выкатки и эксплуатации ML- и ИИ-моделей в продакшне — аналог DevOps для машинного обучения.
Подход, при котором перед ответом LLM ищет релевантные документы в своей базе знаний и использует их как контекст.
Нейросеть с миллиардами параметров, обученная предсказывать следующий токен в тексте и способная отвечать на вопросы, писать код и рассуждать.
Хранилище, оптимизированное под быстрый поиск ближайших векторов — основа RAG-систем и семантического поиска.
Возможность LLM возвращать структурированный запрос на вызов внешней функции вместо обычного текста и затем учитывать её результат.
Совокупность подходов и методов, направленных на то, чтобы поведение ИИ-модели соответствовало целям и ценностям людей.
Раздел машинного обучения, использующий многослойные нейросети для работы с изображениями, текстом, звуком и другими сложными данными.
Уверенно сформулированный ответ языковой модели, который при этом фактически неверен или выдуман.
Метод, при котором маленькая «ученическая» модель обучается имитировать ответы большой «учительской» — получается дешёвая модель с близким качеством.
Способы заставить языковую модель обойти свои защитные правила и выдать запрещённый или нежелательный ответ.
Раздел компьютерных наук о системах, которые решают задачи, обычно требующие человеческого разума: распознавание, перевод, рассуждение, принятие решений.
Программа на основе LLM, которая способна планировать действия, вызывать внешние инструменты и доводить задачу до результата без постоянного контроля человека.
ИИ-помощник внутри основной рабочей среды человека, который подсказывает, заполняет и выполняет рутинные операции, но финальное решение оставляет за человеком.
Максимальное количество токенов, которые языковая модель может видеть одновременно — её рабочая «оперативная память».
Подход, при котором программа не пишется вручную, а обучается решать задачу на размеченных или неразмеченных данных.
Математическая модель из связанных «нейронов», в которой каждое соединение имеет вес, подбираемый во время обучения.
Подход, в котором агент действует в среде, получает награды и штрафы и постепенно учится стратегии, максимизирующей суммарную награду.
Метод, в котором модель улучшают, используя оценки людей: они сравнивают разные ответы и направляют обучение в сторону предпочтительных.
Подход, при котором в промпт добавляют 2–10 примеров «запрос → правильный ответ», чтобы модель поняла нужный формат и стиль.
Этап тренировки большой нейросети на огромных объёмах общих данных перед последующей тонкой настройкой под конкретные задачи.
Входной текст, который пользователь или приложение подаёт большой языковой модели и на основании которого она генерирует ответ.
Инженерная дисциплина проектирования, тестирования и поддержки промптов как ключевого компонента ИИ-продукта.
Постоянная часть инструкции к модели, задающая её роль, стиль, ограничения и поведение в рамках продукта.