blog-post

ClauseBase कैसे Manticore वेक्टर सर्च का उपयोग करके अनुबंध निर्माण में सुधार करता है

ClauseBase में एक झलक

ClauseBase

ClauseBase की स्थापना तीन पूर्व वकीलों द्वारा की गई थी जो थकाऊ अनुबंध निर्माण प्रक्रिया से निराश थे। उन्होंने महसूस किया कि कानूनी टीमें और कानून फर्म अनुबंधों को अत्यधिक मेहनत से पुन: बनाते हैं, जिससे कानूनी सेवाओं की लागत बढ़ जाती है। आमतौर पर, ड्राफ्टिंग का प्रारंभिक बिंदु एक पुराना फ़ाइल होता है — जिसमें पुराने नामों को हटाकर साफ किया गया होता है — उसके बाद धाराओं को जोड़ने, संपादित करने और पुनर्व्यवस्थित करने की लंबी प्रक्रिया होती है। पुराने अनुबंधों से धाराओं की यह कॉपी-पेस्ट करना बहुत सारा समय बर्बाद करता है, खासकर चूंकि प्रासंगिक धाराएँ अक्सर पुराने फ़ाइलों और ईमेल चेन में बिखरी होती हैं।

इससे निपटने के लिए, ClauseBase ने Clause9 बनाया, जो पूर्ण कानूनी दस्तावेज़ों के स्वचालित उपकरण के रूप में कार्य करता है। मैनुअल ड्राफ्टिंग में घंटे बिताने के बजाय, वकील अब केवल कुछ क्लिक में परिष्कृत दस्तावेज़ तैयार कर सकते हैं। ClauseBuddy , उनका दूसरा उत्पाद, उपयोगकर्ताओं को एक “धारा पुस्तकालय” बनाने की अनुमति देता है ताकि उपयोगी अनुबंध तत्वों को एकत्र और पुन: उपयोग किया जा सके। मूल रूप से, इन धाराओं को मैन्युअल रूप से अपलोड करना होता था। लेकिन हाल ही में, ClauseBase ने एक विशेषता जोड़ी है जो पुराने अनुबंधों से स्वचालित रूप से धाराओं को निकालती है — उन्हें Manticore Search के साथ संगठित करके एक पुस्तकालय में संग्रहीत करती है।

कानूनी धाराओं के लिए वेक्टर सर्च

ClauseBase चाहता था कि वकील अनुबंध धाराओं के वैकल्पिक संस्करणों को आसानी से खोज सकें, चाहे ड्राफ्टिंग के लिए हो या वार्तालाप के दौरान। किसी भी दिए गए धारा के लिए, अनगिनत विविधताएँ होती हैं: विभिन्न लंबाई, विभिन्न स्वर (तटस्थ, आक्रामक, या उद्योग-विशिष्ट), इत्यादि। वकील को इन विविधताओं को जल्दी से ब्राउज़ करने का एक तरीका चाहिए था ताकि वे पहिये का पुनः आविष्कार करने से बच सकें और प्रेरणा पा सकें।

जब एक मैनुअल रूप से बनाए गए धारा पुस्तकालय को विस्तृत मेटाडेटा के साथ रखना आदर्श है, इसे बनाना समय खाता है। कई वकील तकनीकी सफर की शुरुआत कर रहे हैं और समान धाराओं को खोजने का एक आसान तरीका ढूंढ रहे हैं। वेक्टर सर्च उस समाधान को प्रदान करता है क्योंकि यह Manticore में प्रत्येक धारा के लिए एक पाठ वेक्टर संग्रहीत करता है, जिससे वकील समान अर्थ वाली धाराओं की तेजी से खोज कर सकते हैं—बिना मैनुअल टैगिंग की आवश्यकता के। यह सही ढंग से अनुक्रमित धाराओं के होने के करीब का सबसे अच्छा विकल्प है।

Manticore Search क्यों?

प्रारंभ में, ClauseBase ने अपने निकाले गए धाराओं को PostgreSQL में स्टोर किया। जबकि PostgreSQL एक निश्चित बिंदु तक सक्षम था, इसमें पूर्ण-पाठ खोजों में महत्वपूर्ण सीमाएँ थीं। ऑटो-कम्प्लीट, फैसेटेड सर्च, और वाक्यांश निकटता खोज जैसी विशेषताएँ लागू करना मुश्किल था। PostgreSQL में बीएम25 जैसी उन्नत रैंकिंग सुविधाएँ भी कमी थीं, जो कानूनी पाठों के लिए महत्वपूर्ण हैं, जहाँ सामान्य शब्द जैसे “बाध्यता,” “पक्ष,” और “जिम्मेदारी” को खोज परिणामों में सुधार के लिए उपयुक्त वजन देने की आवश्यकता होती है।

इस पर, प्रदर्शन समस्याएँ उठने लगीं। ClauseBuddy उपयोगकर्ताओं को उनके अपने दस्तावेज़ निकालने की अनुमति देता है, और साथ ही यूएस ईडीजीएआर लाइब्रेरी से मिलीनों धाराओं के साथ एक सार्वजनिक नमूना डेटाबेस भी प्रदान करता है। PostgreSQL और Pgvector के संयोजन के साथ इस डेटा की मात्रा के कारण ध्यान देने योग्य रूप से धीमी हो गई, परिणाम लौटाने में कई सेकंड लगते थे। इसी बिंदु पर, ClauseBase ने Manticore Search पर स्विच करने का निर्णय लिया।

पहले से ही कानूनी दस्तावेजों की पूरी खोज के लिए Manticore का उपयोग करने के बाद, ClauseBase ने पहले ही इसे तेज और विशेषताओं के साथ समृद्ध माना था। इसलिए, उन्होंने धारा पुस्तकालय को Manticore में माइग्रेट किया, और यह फायदेमंद साबित हुआ — उपयोगकर्ता अब एक धारा और मूल दस्तावेज़ के बीच बिना किसी रुकावट के कूद सकते हैं।

वेक्टर सर्च पर एक साथ काम करना

जब ClauseBase ने निर्णय लिया कि उन्हें वेक्टर सर्च की आवश्यकता है, तो यह Manticore में अभी उपलब्ध नहीं था। उन्होंने Manticore टीम से संपर्क किया, और मिलकर वेक्टर सर्च कार्यक्षमता को लागू करने के लिए सहयोग किया। कुछ हफ्तों बाद, ClauseBase Manticore की नई वेक्टर सर्च कार्यक्षमता के साथ प्रयोग करने में सक्षम हो गया। बाद में, जब ClauseBase को समस्याएँ आईं, तो Manticore टीम ने उन्हें तुरंत संबोधित और ठीक किया, एक सहज अनुभव सुनिश्चित करते हुए।

वेक्टर सर्च का प्रभाव

ClauseBase में वेक्टर सर्च का एकीकरण लगभग एक साल से लागू है, और परिणाम बहुत आशाजनक हैं। ClauseBase ने एक ऐसा समाधान खोजने का लक्ष्य रखा जो वाणिज्यिक वेक्टर सेवाओं पर निर्भरता से बच जाए, जिनकी प्रतिक्रिया समय अक्सर धीमी होती है। व्यापक प्रयोगों के बाद, उन्होंने मॉडल चुने जो गुणवत्ता और प्रदर्शन के बीच संतुलन बनाए रखते थे, विशेष रूप से उनके उपयोग के मामले के लिए अनुकूलित।

मैन्टीकोर सर्च में वेक्टर सर्च का उपयोग करने के अलावा, क्लॉजबेस ने खोज परिणामों को और अधिक परिष्कृत करने के लिए एक पुनर्मूल्यांकन प्रक्रिया शुरू की। पुनर्मूल्यांकक प्रारंभिक वेक्टर खोज से शीर्ष मिलान को संसाधित करता है, जो एक छोटे सेट में संभावित उत्तरों पर “अधिक गहराई से सोचने” में प्रभावी होता है। यह दृष्टिकोण ने खोज परिणामों की प्रासंगिकता में महत्वपूर्ण सुधार किया है, जो उपयोगकर्ताओं को ऐसे परिणाम प्रदान करता है जो न केवल तेज हैं बल्कि संदर्भगत रूप से सटीक और अत्यधिक उपयोगी भी हैं।

मैंटीकोर सर्च इंस्टॉल करें

मैंटीकोर सर्च इंस्टॉल करें