Термины, отмеченные тегом «Основы ИИ» — 10 терминов.
Нейросеть с миллиардами параметров, обученная предсказывать следующий токен в тексте и способная отвечать на вопросы, писать код и рассуждать.
Раздел машинного обучения, использующий многослойные нейросети для работы с изображениями, текстом, звуком и другими сложными данными.
Раздел компьютерных наук о системах, которые решают задачи, обычно требующие человеческого разума: распознавание, перевод, рассуждение, принятие решений.
Максимальное количество токенов, которые языковая модель может видеть одновременно — её рабочая «оперативная память».
Подход, при котором программа не пишется вручную, а обучается решать задачу на размеченных или неразмеченных данных.
Математическая модель из связанных «нейронов», в которой каждое соединение имеет вес, подбираемый во время обучения.
Подход, в котором агент действует в среде, получает награды и штрафы и постепенно учится стратегии, максимизирующей суммарную награду.
Архитектура нейросети из статьи «Attention Is All You Need» (2017), на которой построены почти все современные большие языковые модели.
Минимальный кусочек текста, с которым работает языковая модель: целое слово, его часть или знак препинания.
Числовой вектор, в который модель переводит слово, предложение или другой объект, сохраняя его смысл.