⚠️ Эта страница автоматически переведена, и перевод может быть несовершенным.
blog-post

Manticore Search 25.0.0

Manticore Search 25.0.0 был выпущен. Эта версия предлагает более простую модель упаковки вместе с основными улучшениями в гибридном поиске, векторной фильтрации, резервном копировании, обслуживании RT таблиц и интеграции приложений.


Примечания по обновлению

Пожалуйста, ознакомьтесь с ними перед обновлением:

  • MCL 13.0.0 требуется. Manticore Search 25.0.0 обновляет интерфейс daemon/MCL и добавляет API_URL и API_TIMEOUT для моделей авто‑встраивания. Если вы управляете MCL отдельно, обновляйте daemon и MCL одновременно. ( PR #123 )
  • Кластеры репликации требуют согласованных обновлений. Кластеры с разными версиями несовместимы с изменениями репликации в 24.0.0. Обновляйте кластерные узлы вместе. ( Issue #4343 )
  • Новые опции токенизации биграмм влияют на пути понижения версии. Если вы перестраиваете индексы с изменениями токенизации биграмм, введенными в 23.0.0, эти переписанные индексы несовместимы с более старыми версиями Manticore. ( Issue #4364 )
  • Отфильтрованные результаты KNN могут измениться. Поскольку предварительная фильтрация KNN была введена в 19.0.0, отфильтрованные векторные запросы теперь могут приоритизировать ближайших соседей, которые удовлетворяют фильтру во время поиска, а не только после выбора кандидатов. ( Issue #4103 )

Упаковка упрощена

Начиная с 25.0.0, manticore является пакетной упаковкой для deb и rpm. Он включает в себя демон, инструменты, конвертер, заголовки разработки, данные ICU, упакованные зависимые пакеты и встроенные языковые пакеты для немецкого, английского и русского языков, а также поддержку Jieba.

В большинстве случаев обновление теперь проще: установите manticore и позвольте пакету подтянуть необходимые компоненты. Если старые разделенные пакеты конфликтуют с новой компоновкой, сначала удалите их с помощью apt remove 'manticore*' или yum remove 'manticore*', а затем установите manticore. Ваши существующие данные останутся нетронутыми. В системах на базе yum менеджер пакетов может заменить конфигурационный файл, но автоматически сохраняет резервную копию предыдущего.

Это важное операционное изменение: оно снижает трение при упаковке и делает установку проще и предсказуемее.


Основные моменты

Гибридный поиск теперь является первоклассной опцией

Manticore теперь поддерживает гибридный поиск , позволяя вам комбинировать полнотекстовый и векторный поиск в одном запросе. Это значительно упрощает создание конвейеров поиска, которые балансируют лексическую точность с семантическим охватом.

Вы можете использовать гибридный поиск как через SQL, так и через JSON интерфейсы. В SQL вы можете комбинировать MATCH() с одной или несколькими подзапросами KNN(). Для команд, создающих современные поисковые решения, это одно из самых больших дополнений в этой версии.

Лучший векторный поиск с предварительной фильтрацией KNN

С помощью предварительной фильтрации KNN атрибутные фильтры могут применяться во время векторного поиска, а не только после выбора кандидатов. Это важно, когда вам нужны "ближайшие соседи среди документов, которые также соответствуют моему фильтру", а не просто "ближайшие соседи в целом, отфильтрованные позже".

Это улучшает как релевантность, так и предсказуемость для отфильтрованных векторных поисковых нагрузок, таких как поиск продуктов с ограничениями по категориям, поиск с учетом арендаторов и семантический поиск с фильтрацией по разрешениям.

Более быстрое обслуживание RT с параллельным объединением чанков

RT таблицы Manticore теперь гораздо лучше справляются с тяжелым обслуживанием благодаря N-ходовым объединениям и параллельным заданиям OPTIMIZE. Мы рассмотрели детали в Параллельном объединении чанков .

Результат проще объяснить, чем реализовать: когда таблица накапливает много дисковых чанков, очистка и компактация занимают меньше времени, поэтому RT таблицы работают лучше при постоянной нагрузке на запись.

Упрощенная интеграция приложений с подготовленными выражениями

Manticore теперь поддерживает подготовленные выражения, совместимые с MySQL, о которых мы говорили в Подготовленные выражения в Manticore Search . Это улучшает совместимость с клиентами MySQL, пулами соединений, ORM и фреймворками, которые ожидают поведения бинарного протокола prepare/execute.

Для разработчиков приложений это устраняет еще один крайний случай интеграции и делает Manticore проще для внедрения в существующие стеки.

Резервное копирование и восстановление, совместимые с S3

Операции резервного копирования теперь более гибкие благодаря резервному копированию и восстановлению, совместимому с S3 . Manticore Backup поддерживает AWS S3, MinIO, Wasabi и Cloudflare R2, что упрощает отправку резервных копий в объектное хранилище и создание более чистых рабочих процессов восстановления после сбоев.

Это особенно полезно для контейнеризованных и облачно-ориентированных развертываний, где локальный диск временный, но объектное хранилище является долговечным слоем.

Авто-встраивание продолжает улучшаться

25.0.0 также расширяет недавнюю работу Manticore над авто‑встраиваниями. Новая версия MCL добавляет элементы управления API_URL и API_TIMEOUT для моделей авто‑встраивания. Последние разработки также добавили поддержку локальных встраиваемых моделей GGUF с квантованием, кодировщиков T5, ограниченных загрузок Hugging Face и безопасной репликации обработки встраиваний для RT‑таблиц.

В совокупности эти изменения делают Manticore более практичным как для локальных конвейеров встраивания, так и для развертываний, которые полагаются на внешние конечные точки моделей.


Другие заметные улучшения

Этот релиз также включает 36 исправлений ошибок в выполнении запросов, репликации, упаковке для macOS, авто‑встраивании, RT‑таблицах и совместимости с SQL.

  • Ложные срабатывания полнотекстового поиска, вызванные прерываниями max_query_time в сложных запросах, исправлены, поэтому запросы, завершившиеся по тайм‑ауту, больше не возвращают строки, которые фактически не удовлетворяют запросу. ( Issue #4375 )
  • Репликация была исправлена для транзакций, содержащих дублирующиеся ID документов, поэтому реплики больше не теряют строки, пока донор корректно удаляет дубликаты. ( Issue #4388 )
  • Было исправлено несколько проблем стабильности авто‑встраивания, включая сбои при генерации встраиваний, некорректную обработку UTF-8 и отсутствие RT‑блокировок во время проверки. ( PR #4349 , PR #4370 , PR #4371 )
  • LEFT JOIN теперь возвращает корректные значения MySQL NULL вместо строки NULL, улучшая совместимость с клиентами и драйверами MySQL. ( Issue #4229 )
  • Исправлена гонка при сохранении RT‑дискового чанка, которая могла приводить к потере уничтоженных документов и появлению дублирующихся строк после слияний или сохранений. ( Issue #4207 )
  • Нечеткий поиск теперь работает в запросах, охватывающих несколько таблиц. ( PR #4372 )

Почему 25.0.0 важен

Manticore Search 25.0.0 объединяет изменения упаковки с несколькими важными возможностями, которые теперь доступны вместе:

  • гибридный лексический + векторный поиск
  • фильтрованный векторный поиск, который ведет себя так, как ожидают пользователи
  • более простая интеграция через подготовленные запросы
  • резервные копии, удобные для объектных хранилищ
  • более быстрая компактизация и обслуживание RT‑таблиц
  • более гибкие развертывания авто‑встраивания

Для получения полных технических деталей см. changelog .

Нужна помощь или хотите связаться?

  • Присоединяйтесь к нашему Slack
  • Посетите Форум
  • Сообщайте об ошибках или предлагайте функции на GitHub
  • Пишите нам на [email protected]

Установить Manticore Search

Установить Manticore Search