Manticore Search 2.8.0 GA release

我们很高兴地宣布 Manticore Search 2.8.0 GA. 的发布。
预构建的包可用于 Debian、Ubuntu、Red Hat/CentOS、Windows 和 OSX,可以从 这里 下载。
新特性和改进 本次发布的主要特性是对 percolate 索引 的支持。 对于 percolate 索引,DESCRIBE 命令现在新增了 TABLE 扩展,可以查看 percolate 文档的模式。 ANY/ALL 函数可以在字符串属性或表达式以及 PQ 标签上使用。 …

默认字符集表和停用词文件

在本文中,我们将讨论字符集表和停用词的新添加,这些旨在简化配置索引时使用这些选项的过程。
在最初分析文档文本时,Manticore Search 需要知道文本中的哪些符号对于后续处理(将完整文本拆分为单独的单词、进行形态学处理等)是有意义的,哪些不是。要定义有效的文本字符,使用 charset_table 选项。通过该选项,您可以指定希望使用的符号集。
此外,为了提供更好的文本搜索质量,Manticore Search 执行所谓的字符折叠。例如,在分析您的搜索查询时,大写符号 …

Manticore搜索中的正则表达式

在本文中,我们将讨论正则表达式以及如何在Manticore搜索中使用它们
如果我们谈论文本匹配,最简单的方法就是字符串比较。搜索字符串和文档或字段必须完全相同。下一个文本搜索方法是执行简单的模式匹配,可以允许将搜索字符串作为字段的子部分匹配。这种简单的模式匹配可以使用基本运算符(如通配符),其中元字符如*或%表示"匹配任何字符"。在数据库中,这通常通过LIKE运算符实现,例如:
SELECT * FROM mytable WHERE title LIKE …

关于启动、mmap、mlock 和 --force-preread

正如在文章" 启动时加载索引 “中提到的,现在所有的索引(属性和词汇表文件)不再是物理加载到RAM中,而是通过内存映射的方式。这使得它们在启动时能够更快地加载,但也带来了一些我想要解释的副作用。
首先,由于我们进行了映射,索引可能不会永久锁定在物理RAM中,并且你不需要有足够的RAM让所有索引都适配。拥有合理数量的RAM在许多情况下已经可以为你提供快速的查询,因为当索引被缓存时,它们的工作速度会显著提高。
第二个后果 - 实际上内存映射只占用进程的一个“虚拟地址空 …

Manticore Search 2.7.5 GA 发布

我们很高兴地宣布发布 Manticore Search 2.7.5 GA. 可以从 这里 下载适用于 Debian、Ubuntu、Red Hat/CentOS、Windows 和 OSX 的预构建包。
改进 REGEX 函数用于字符串。它可以用于字符串属性、字符串 JSON 属性或字符串表达式 limit 和 offset 用于 JSON API 搜索 profiler 输出查询缓存阶段所花费的时间 修复 在此版本中修复了一些错误。
特别是,在带有 FACET 的查询中,通过 …

Relevance scoring in Manticore : part II

在关于相关性评分的第二部分中,我们讨论如何使用位置进行匹配和评分。
了解字段中单词的位置是重要的,可以提供更好的相关性。位置允许广泛的文本操作符,这些操作符可以通过单词相对于字段的位置执行匹配,或者通过计算在字段内找到的关键字与输入查询之间的距离。基于位置的最常用操作符之一是 短语 操作符 - "A B"。短语匹配 是限制性的,因为它强制关键字按照查询中指定的方式进行匹配。这意味着关键字必须是相邻的,并且与查询中的顺序相同。
知道单词的位置后,我们可以执行 …

安装Manticore Search

安装Manticore Search