Мы рады объявить о выпуске Manticore Search 2.8.0 GA.
Предоставленные пакеты для Debian, Ubuntu, Red Hat/CentOS, Windows и OSX можно скачать здесь .
Новые функции и улучшения
- Основная функция, представленная в этом выпуске, — это поддержка кластеризации для перколяторных индексов.
- Для перколяторных индексов команда DESCRIBE теперь имеет расширение TABLE, которое позволяет просматривать схему перколяторных документов.
- Функции
ANY
/ALL
могут использоваться как для строковых атрибутов или выражений, так и для тегов PQ. SELECT по pq индексам имеет ту же функциональность, что и по обычным индексам, за исключением условия MATCH. - Новые опции
CALL PQ
:
skip_bad_json
- если включено, поврежденные JSON документы будут пропущены и не остановят текущий вызовmode
- для распределенных настройках. Значение по умолчанию - ‘sparsed’ - движок будет разбивать документы между перколяторными агентами. Альтернативный вариант - ‘sharded’, в этом случае все документы отправляются каждому перколяторному агентуshift
- смещение для идентификаторов документов, еслиdocs_id
не указано. Полезно для распределенного режима ‘sparsed’
- charset_table может использовать псевдоним ’non_cjk’, который предлагает коллекцию общих символов для большинства языков, не являющихся CJK. Набор вдохновлен токенизатором ICU.
- Подобный псевдоним для ngram_chars ‘cjk’ может быть использован для уже готовой коллекции символов CJK, используемых в несегментированных текстах.
- Manticore теперь предоставляет коллекцию из 50 стоп-слов на основе языков, которые можно объявить в директиве стоп-слов, используя короткий код языка.
- Поля JSON в выражении больше не требуют явного преобразования. Например, в случае GEODIST требовалось явное приведение типов для геокоординат, хранящихся как числа с плавающей запятой в JSON объекте:
GEODIST(DOUBLE(json.lat),DOUBLE(json.long),x,y)
. - RPM пакеты поставляются с генератором systemd, который обнаруживает, можно ли использовать jemalloc вместо стандартного malloc. jemalloc должен быть уже установлен в системе, а прозрачные большие страницы должны быть отключены. Использование jemalloc показало улучшения в использовании ОЗУ и производительности.
Исправления
В выпуск также входят 18 исправлений ошибок, среди которых выделим несколько:
- bf4e9ea исправлено сохранение пустой метаинформации для RT индекса
- 6b95d48 исправлено использование насыщения вместо переполнения для строковых атрибутов > 4 МБ
- 8868b20 исправлено обрезание сообщения об ошибке SphinxQL более 512 символов
- de9deda исправлен сбой при сохранении перколяторного индекса без binlog
Для полного отчета, пожалуйста, обратитесь к заметкам о выпуске .