Попробовать бесплатно

Векторная база данных

Обычная база данных хорошо ищет по точным совпадениям и числовым диапазонам. Векторная база заточена под другой вопрос: «найди ближайшие точки к моему запросу в многомерном пространстве».

Что внутри

  • Векторы фиксированной размерности (например, 768 или 1536).
  • Метаданные: к какому документу относится вектор, какие у документа теги и атрибуты.
  • Специальный индекс для приближённого поиска ближайших соседей (ANN).
  • Фильтры по метаданным, чтобы сужать поиск (например, только документы своего отдела).

Что выбирают

  • Pinecone, Weaviate, Qdrant, Milvus, Chroma — самостоятельные векторные базы.
  • pgvector — расширение PostgreSQL, удобно если хочется одно решение для всех данных.
  • Elasticsearch, OpenSearch — поддерживают векторный поиск рядом с обычным.

Когда применять и когда нет

Применять

  • Строите RAG поверх своих документов
  • Нужен семантический поиск или сравнение объектов по смыслу
  • Хотите делать рекомендации «похожие на это»

Не применять

  • Маленький объём данных, который помещается в обычный массив в памяти
  • Задача чисто полнотекстового поиска без семантики

Примеры применения

Документация продукта на 10 000 страниц разбита на куски примерно по 500 токенов. Каждому куску посчитан эмбеддинг и записан в векторную базу вместе с ссылкой на исходный раздел. Когда сотрудник пишет в ассистент «как настроить уведомления», система за миллисекунды находит 5 наиболее близких кусков и отдаёт их большой модели для подготовки ответа.

Часто задаваемые вопросы

Готовы применить теорию на практике?

Соберите команду в Shtab — единое пространство для проектов, целей и задач. Бесплатно до 5 человек.