⚠️ Эта страница автоматически переведена, и перевод может быть несовершенным.
blog-post

How ClauseBase Uses Manticore Vector Search to Improve Contract Drafting

Взгляд на ClauseBase

ClauseBase

ClauseBase была основана тремя бывшими юристами, разочарованными в утомительном процессе составления контрактов. Они поняли, что юридические команды и юридические фирмы часто воссоздают контракты чрезвычайно трудоемким способом, что повышает стоимость юридических услуг. Обычно отправной точкой для составления является старый файл — очищенный от старых имен — после чего следует длительный процесс добавления, редактирования и перестановки пунктов. Копирование пунктов из старых контрактов тратит много времени, особенно потому, что релевантные пункты часто разбросаны по старым файлам и цепочкам электронных писем.

Для решения этой проблемы ClauseBase создала Clause9 , инструмент для автоматизации полных юридических документов. Вместо того чтобы тратить часы на ручное составление, юристы теперь могут создавать сложные документы всего в несколько кликов. ClauseBuddy , их второй продукт, позволяет пользователям создавать «библиотеку пунктов», собирая и повторно используя полезные элементы контрактов. Изначально эти пункты нужно было загружать вручную. Но недавно ClauseBase добавила функцию, автоматически извлекающую пункты из старых контрактов — организующую их в библиотеку, хранящуюся в Manticore Search.

Векторный поиск для юридических пунктов

ClauseBase хотела предоставить юристам простой способ находить альтернативные версии пунктов контрактов, как для составления, так и во время переговоров. Для любого пункта существует бесчисленное количество вариантов: разная длина, разные тона (нейтральный, агрессивный или отраслевой) и т.д. Юристам нужен был способ быстро просматривать эти варианты, чтобы не изобретать велосипед и находить вдохновение.

Хотя наличие вручную курируемой библиотеки пунктов с подробными метаданными является идеалом, её создание требует времени. Многие юристы только начинают работать с технологиями и ищут более простой способ находить похожие пункты. Векторный поиск предоставляет это решение, сохраняя текстовый вектор для каждого пункта в Manticore, позволяя юристам быстро искать пункты с похожим смыслом — без необходимости ручного тегирования. Это почти то же самое, что идеально аннотированные пункты.

Изначально ClauseBase хранила извлечённые пункты в PostgreSQL. Хотя PostgreSQL был способен до определённого уровня, у него были значительные ограничения в полнотекстовом поиске. Такие функции, как автодополнение, фасетный поиск и поиск по близости фраз, было сложно реализовать. В PostgreSQL также отсутствовали продвинутые функции ранжирования, такие как BM25, что критично для юридических текстов, где общие слова, такие как «obligation», «party» и «liability», необходимо правильно взвешивать для улучшения результатов поиска.

Кроме того, начали возникать проблемы с производительностью. ClauseBuddy предоставляет пользователям возможность извлекать собственные документы, а также предлагает публичную образцовую базу данных с миллионами пунктов, полученных из библиотеки US EDGAR. Сочетание PostgreSQL и Pgvector стало заметно медленным при таком объёме данных, занимая несколько секунд для возврата результатов. Именно в этот момент ClauseBase решила перейти на Manticore Search.

Ранее используя Manticore для поиска по полным юридическим документам, ClauseBase уже знала, что он быстрый и богатый функциями. Поэтому они перенесли библиотеку пунктов в Manticore, и это окупилось — пользователи теперь могут без проблем переключаться между пунктом и оригинальным документом.

Совместная работа над векторным поиском

Когда ClauseBase решила, что им нужен векторный поиск, он ещё не был доступен в Manticore. Они обратились к команде Manticore, и вместе совместно реализовали функциональность векторного поиска. Через несколько недель ClauseBase смогла начать экспериментировать с новой функцией векторного поиска от Manticore. Позже, когда ClauseBase столкнулась с проблемами, команда Manticore быстро их устранила, обеспечив плавный опыт.

Влияние векторного поиска

Интеграция векторного поиска в ClauseBase работает почти год, и результаты очень обнадеживают. ClauseBase стремилась найти решение, которое позволило бы избежать зависимости от коммерческих векторных сервисов, часто имеющих более медленное время отклика. После проведения обширных экспериментов они выбрали модели, сочетающие качество и производительность, специально адаптированные под их сценарий использования.

В дополнение к использованию векторного поиска в Manticore Search, ClauseBase внедрила процесс повторной оценки для дальнейшего уточнения результатов поиска. Повторная оценка обрабатывает лучшие совпадения из начального векторного поиска, эффективно "думая глубже" о меньшем наборе потенциальных ответов. Этот подход значительно улучшил релевантность результатов поиска, предоставляя пользователям результаты, которые не только быстры, но и контекстуально точны и крайне полезны.

Установить Manticore Search

Установить Manticore Search