Между запросом к Manticore и окончательным результатом для пользователя может быть дополнительная обработка. Поскольку в большинстве случаев интересует сортировка по оценке релевантности, важно не потерять эту сортировку.
Типичный рабочий процесс при использовании Manticore Search вместе с базой данных выглядит так:
- выполнить запрос к Manticore
- из набора результатов получить список идентификаторов документов
- выполнить запрос к базе данных, используя идентификаторы документов, чтобы получить окончательный результат для вывода
Получение соответствующих записей из базы данных можно выполнить в одном запросе, используя предикат IN(ids) .
mysql> SELECT * FROM mytable WHERE id IN(20,10,3,4,6)
Этот тип запроса очень быстр, но набор результатов может быть не в том порядке, который мы ожидали. Поскольку порядок не установлен, движок базы данных просто добавит записи в набор результатов по мере их нахождения во время поиска в таблице. Это означает, что нам нужно добавить явный порядок к запросу, чтобы сохранить тот же порядок, который мы получили из запроса к Manticore.
В MySQL мы можем использовать функцию FIELD() для сортировки набора так, как мы хотим:
mysql> SELECT * FROM mytable WHERE id IN(20,10,3,4,6) ORDER BY FIELD(id,20,10,3,4,6).
Аналогичные методы существуют и в других базах данных. В PostgreSQL это можно сделать несколькими способами, например, используя ORDER BY CASE, WITH ORDINALITY (9.4+) или array_position() (9.6+).
В качестве альтернативы, сохранение порядка из результата Manticore также может быть выполнено в коде приложения. Упрощённый код может выглядеть так:
$ids = [];
foreach($ms_conn($manticore_query as $row)
{
$ids[] = $row['id'];
}
$tmpdocs = [];
foreach($db_conn->query($database_query) as $row)
{
$tmpdocs[$row['id']] = $row
}
$final_result = [];
foreach($ids as $id)
{
$final_result[] = $tmpdocs[$id];
}
В заключение, если вы извлекаете данные из репозитория, используя идентификаторы из запроса Manticore, убедитесь, что вы не теряете порядок, предоставленный набором результатов запроса Manticore.