मिलते हैं Pubchem - दुनिया की सबसे बड़ी मुफ्त रासायनिक सूचना संबंधी वेबसाइट
वर्ष
2020
स्थान
संयुक्त राज्य अमेरिका
कंपनी का आकार
300+ सदस्य

कंपनी
PubChem समूह राष्ट्रीय जैव प्रौद्योगिकी जानकारी केंद्र (NCBI) में राष्ट्रीय चिकित्सा पुस्तकालय (NLM) का एक हिस्सा है, जो संयुक्त राज्य अमेरिका के राष्ट्रीय स्वास्थ्य संस्थान (NIH) की एक शाखा है। PubChem दुनिया की सबसे बड़ी मुफ्त रासायनिक सूचना संबंधी वेबसाइट है और इसमें 741 डेटा स्रोतों से 103M रासायनिक यौगिकों, 254M पदार्थों, 269M जैव गतिविधियों, 31M साहित्य, 3M पेटेंट, 1M जैव परीक्षणों और अधिक की विस्तृत जानकारी है।
चुनौती
Manticore सभी संग्रहों (रासायनिक यौगिक, रासायनिक पदार्थ, जैविक परीक्षण, पेटेंट, pubmed, प्रोटीन, जीन, वर्गीकरण, रोग, साहित्य, पथ, पथ प्रतिक्रिया, …) के बीच पूर्ण-भूमिका खोज करता था, कुल 10TB डेटा के आकार में। उन्होंने पहले Solr का प्रयास किया, लेकिन यह उनके डेटा वृद्धि के साथ स्केल नहीं हुआ। Sphinx/Manticore उनके आवश्यकताओं के लिए बिल्कुल उपयुक्त हल्का लेकिन शक्तिशाली खोज इंजन साबित हुआ।
Siqian He, US National Institutes of Health: “हम Sphinx/Manticore खोज इंजन के बिना ऐसी सफलता नहीं प्राप्त कर सकते! आप सभी का धन्यवाद कि आपने इतना शक्तिशाली खोज इंजन बनाया!”
समाधान और परिणाम
- खोज से संबंधित क्वेरी करने के लिए C++ sphinx क्लाइंट लाइब्रेरी का उपयोग करना।
- खोज स्वतः पूर्णता कार्यक्षमता का कार्यान्वयन - यह एक सुविधा है जब एक एप्लिकेशन टाइप न किए गए शब्द के शेष को पूर्वानुमानित करता है। इसलिए उपयोगकर्ता केवल 2 या 3 पहले अक्षरों को टाइप कर सकता है और विभिन्न सुझाव देखने में सक्षम होता है।
- तत्वों के विभिन्न गुणों द्वारा खोज परिणामों के फ़िल्टरिंग की क्षमता देने वाला फ़ैसेटिंग का कार्यान्वयन।
