blog-post

Manticore Search Re-indexing with mysqldump

यह ब्लॉग पोस्ट Marius Matilionis द्वारा लिखी गई है, जो Ivinco में Manticore Search के वरिष्ठ डेवलपर और विशेषज्ञ हैं। Ivinco नवीनतम खोज समाधान, डेटाबेस ऑप्टिमाइज़ेशन, घटनाओं का प्रबंधन और कारोबारों को तेज़, अधिक कुशल और स्केलेबल संचालन प्राप्त करने में मदद करने के लिए अवलोकन सेटअप प्रदान करने में विशेषज्ञता रखता है।


Understanding the Challenge

बड़े पैमाने पर Manticore Search तालिकाओं का पूर्ण पुनः अनुक्रमण एक समय लेने वाली और संसाधन-गहन कार्य हो सकता है। जब तालिका कॉन्फ़िगरेशन में महत्वपूर्ण परिवर्तन किए जाते हैं, जैसे अपवादों को संशोधित करना या डेटा संरचनाओं को बदलना, तो सटीक खोज परिणाम सुनिश्चित करने के लिए पूर्ण पुनः अनुक्रमण अक्सर आवश्यक होता है।

Traditional Approach: Script-Based Re-indexing

पारंपरिक विधि में दस्तावेजों पर पुनरावृत्त करने, उन्हें पार्स करने और उन्हें तालिका में भेजने के लिए कस्टम स्क्रिप्ट तैयार करना शामिल होता है। जबकि यह दृष्टिकोण लचीलापन प्रदान करता है, यह विशेष रूप से बड़े डेटा सेट के लिए धीमा हो सकता है। प्रदर्शन का निंदान अक्सर प्रक्रिया की पुनरावृत्त स्वभाव में होता है, जो महत्वपूर्ण ओवरहेड लाने का कारण बन सकता है।

A More Efficient Approach: Leveraging mysqldump

mysqldump, MySQL डेटाबेस का बैकअप और पुनर्स्थापना करने का एक शक्तिशाली उपकरण, पुनः अनुक्रमण प्रक्रिया को सरल बनाने के लिए प्रभावी ढंग से उपयोग किया जा सकता है। तालिका डेटा को सीधे डंप और पुनर्स्थापित करके, हम इस संचालन के लिए आवश्यक समय को काफी कम कर सकते हैं।

Key Steps:

  • Prepare the Table:

    • Store Text-Indexed Columns: सुनिश्चित करें कि सभी टेक्स्ट-इंडेक्स वाले कॉलम stored के रूप में टेक्स्ट के रूप में स्टोर किए गए हैं, ताकि डंप और पुनर्स्थापना प्रक्रिया को ऑप्टिमाइज़ किया जा सके। यह प्रारूप डेटा ट्रांसफर के लिए अधिक कुशल है और पुनः अनुक्रमण के दौरान संभावित समस्याओं को कम करता है।
    • Create a New Table: परिवर्तनों को समायोजित करने के लिए आवश्यक कॉन्फ़िगरेशन के साथ एक नई तालिका बनाएँ।
  • Perform the mysqldump:

    • तालिका डेटा को डंप करने के लिए निम्नलिखित mysqldump कमांड का उपयोग करें:
      mysqldump -etc --replace -P7103 -h0 manticore rt_index_2 | mysql -P7103 -h0
      
  • Optimize the Table (OPTIONAL. Not needed if auto_optimize is enabled which is a default):

    • Run Optimize (optimize table rt_index_2 option sync=1): पुनः अनुक्रमण प्रक्रिया के बाद, तालिका का आकार 8.9GB था। ऑप्टिमाइज प्रक्रिया डिस्क स्थान को पुनः प्राप्त करने में मदद करती है (ऑप्टिमाइज़ करने के बाद, तालिका का आकार 4.4GB था) और तालिका संरचना को ऑप्टिमाइज़ करती है। यह चरण सर्वोत्तम प्रदर्शन सुनिश्चित करने और भंडारण ओवरहेड को कम करने के लिए महत्वपूर्ण है।

Performance Analysis and Considerations

हमारी परीक्षणों ने mysqldump का उपयोग करते समय एक महत्वपूर्ण प्रदर्शन सुधार का खुलासा किया:

Table TypeInitial Size (GB)
Text Indexed3.5
Text Indexed Stored4.4
Re-index typeRe-indexation Time (minutes)
Script-Based Re-indexing94
mysqldump17

जैसा कि आप देख सकते हैं, जबकि टेक्स्ट-इंडेक्स वाले कॉलम को स्टोर किए जाने से प्रारंभिक तालिका का आकार 25% बढ़ जाता है (3.5GB से 4.4GB तक), यह पुनः अनुक्रमण समय को 94 मिनट से 17 मिनट तक काफी कम करता है, जिससे 6 गुना तेजी मिलती है।

Key Considerations:

  • Disk Space: जबकि mysqldump पुनः अनुक्रमण प्रक्रिया के दौरान अतिरिक्त डिस्क स्थान की आवश्यकता होती है, अंतिम तालिका का आकार ऑप्टिमाइजेशन के बाद वैसा ही रहता है। हमारे मामले में, प्रारंभिक तालिका का आकार 4.4GB था, और पुनः अनुक्रमण प्रक्रिया के बाद, तालिका का आकार 8.9GB हो गया। हालाँकि, डिबग संकुचन के बाद, आकार को फिर से 4.4GB में घटा दिया गया।
  • Table Structure: तालिका की विशिष्ट संरचना दोनों विधियों के प्रदर्शन को प्रभावित कर सकती है। आपके विशेष उपयोग के मामले के लिए अनुकूल दृष्टिकोण पहचानने के लिए प्रयोग आवश्यक हो सकता है।
  • Data Consistency: पुनः अनुक्रमण प्रक्रिया के दौरान डेटा स्थिरता सुनिश्चित करें और संघर्षों से बचें, विशेष रूप से यदि तालिका को सक्रिय रूप से अपडेट किया जा रहा है। इसमें लॉकिंग या असिंक्रोनस अपडेट जैसी तकनीकों का उपयोग करना शामिल हो सकता है।
  • Hardware and Software Configuration: पुनः अनुक्रमण प्रक्रिया का प्रदर्शन हार्डवेयर संसाधनों (CPU, मेमोरी, डिस्क I/O), डेटाबेस कॉन्फ़िगरेशन, और नेटवर्क लेटेंसी जैसे कारकों से प्रभावित हो सकता है।

Conclusion

पुनः अनुक्रमण के लिए mysqldump का उपयोग करके, हम इस महत्वपूर्ण कार्य से संबंधित समय और संसाधन आवश्यकताओं को काफी कम कर सकते हैं। यह ऑप्टिमाइजेशन विशेष रूप से बड़े पैमाने पर खोज तालिकाओं के लिए लाभकारी है जहाँ प्रदर्शन और दक्षता सर्वोपरि हैं। पुनः अनुक्रमण रणनीतियों पर विचार करते समय, अपने आवेदन और बुनियादी ढाँचे की विशिष्ट आवश्यकताओं का सावधानीपूर्वक मूल्यांकन करें ताकि सबसे उपयुक्त दृष्टिकोण निर्धारित किया जा सके।


मैरियस माटिलियोनिस एक वरिष्ठ डेवलपर और Ivinco में Manticore Search के विशेषज्ञ हैं, एक कंपनी जो खोज समाधानों, डेटाबेस ऑप्टिमाइज़ेशन, घटनाओं का प्रबंधन, और अवलोकन सेटअप में विशेषज्ञता रखती है। यह ब्लॉग पोस्ट बड़े पैमाने पर अनुप्रयोगों के लिए Manticore Search को ऑप्टिमाइज़ करने में उनके ज्ञान को दर्शाती है।

मैंटीकोर सर्च इंस्टॉल करें

मैंटीकोर सर्च इंस्टॉल करें