Categories: Ai

[Перевод] Использование ИИ и векторного поиска в Azure Cosmos DB для MongoDB vCore

Недавно Microsoft объявила о внедрении функциональности векторного поиска в Azure Cosmos DB для MongoDB vCore. Эта функция расширяет возможности Cosmos DB, позволяя разработчикам выполнять сложные поиски по сходству в многомерных данных, что особенно полезно в приложениях на основе RAG , системах рекомендаций, поиске изображений и документов и т. д.

В этой статье я рассмотрю детали этой новой функциональности, варианты ее использования и предоставим пример реализации с использованием Python .

Что такое векторный магазин?

Векторные хранилища (или векторные базы данных ) предназначены для хранения и управления векторными вложениями . Эти вложения являются математическими представлениями данных в многомерном пространстве. Каждое измерение соответствует свойству данных, и для представления сложных данных могут использоваться десятки тысяч измерений. Например, слова, фразы, целые документы, изображения, аудио и другие типы данных могут быть векторизованы. Проще говоря, векторные вложения — это список чисел, которые могут представлять внутри многомерного пространства любые сложные данные.

Пример

Pen: [0.6715,0.5562,0.3566,0.9787]

Теперь мы можем представить ручку внутри многомерного пространства, а затем использовать алгоритмы векторного поиска для выполнения поиска по сходству и извлечения наиболее совпадающих элементов.

Как работает векторный индекс?

В векторном хранилище алгоритмы векторного поиска используются для индексации и запроса вложений. Векторная индексация — это метод, используемый в машинном обучении и анализе данных для эффективного поиска и извлечения информации из больших наборов данных. Некоторые известные алгоритмы включают:

Читать далее

Share
Published by

Recent Posts

Магия CSS на практике: советы по вёрстке от гика. Часть 4

Хабр, привет! Я снова пришёл к вам со статьёй, где показываю мои любимые техники вёрстки.…

3 месяца ago

JavaScript: структуры данных и алгоритмы. Часть 5

Привет, друзья! В этой серии статей мы разбираем структуры данных и алгоритмы, представленные в этом…

3 месяца ago

Реализация событий через HTTP

Для некоторых задач, связанных с обновлением данных в реальном времени — например, новостные ленты, уведомления…

3 месяца ago

Каннибализм трафика. Нужно ли вести контекст по брендовым запросам?

Со времён появления контекстной рекламы маркетологов не перестаёт мучить вопрос:"А есть ли смысл вести контекст по…

3 месяца ago

Презентация Apple 2024: новая кнопка на iPhone 16, функция слухового аппарата у AirPods, кинокамера в iPhone Pro

Накануне в прямом эфире прошла большая презентация новой техники от компании Apple. Команда Тима Кука…

3 месяца ago

Сразу два аналога Notion, бесплатный сервис аналитики для продавцов на WB – эти и другие российские стартапы

10 новых российских сервисов для нарезки шортсов при помощи ИИ, публикации в цифровых СМИ, авто-ответов…

3 месяца ago