⚠️ Эта страница автоматически переведена, и перевод может быть несовершенным.

Давайте встретимся Pubchem - крупнейший бесплатный веб-сайт химической информатики в мире

Год

2020

Местоположение

Соединенные Штаты

Размер компании

300+ участников

brand image

Компания

Группа PubChem в Национальном центре биотехнологической информации (NCBI) является частью Национальной медицинской библиотеки (NLM), подразделения Национальных институтов здравоохранения США (NIH). PubChem - это крупнейший бесплатный веб-сайт химической информатики в мире и содержит подробную информацию из 741 источника данных о более чем 103 миллионах химических соединений, 254 миллионах веществ, 269 миллионах биологической активности, 31 миллионе литературы, 3 миллионах патентов, 1 миллионе биологических тестов и многом другом.

Задача

Manticore раньше выполнял полнотекстовый поиск среди всех коллекций (химическое соединение, химическое вещество, биологический тест, патент, pubmed, белок, ген, таксономия, заболевание, литература, путь, реакция пути и т.д.), всего 10 ТБ данных. Сначала они попробовали Solr, но он не масштабировался с ростом их данных. Sphinx/Manticore оказался легковесным, но мощным поисковым движком, который идеально соответствует их потребностям.

Siqian He, Национальные институты здравоохранения США: "Мы не смогли бы достичь такого успеха без поискового движка Sphinx/Manticore! Спасибо всем за создание такого мощного поискового движка!"

Решения и результаты

  • Использование библиотеки клиента C++ sphinx для выполнения поисковых запросов.
  • Развертывание функции автозаполнения поиска - это функция, когда приложение предсказывает оставшуюся часть непечатного слова. Таким образом, пользователь может ввести только 2 или 3 первые буквы соединения и увидеть различные предложения.
  • Развертывание фасетирования - это дает возможность фильтровать результаты поиска по различным свойствам искомых элементов.
Manticore Search на Pubchem

Установить Manticore Search

Установить Manticore Search