⚠️ 此页面为自动翻译,翻译可能不完美。

Manticore Search 2.8.0 GA release

我们很高兴地宣布 Manticore Search 2.8.0 GA. 的发布。
可用于 Debian、Ubuntu、Red Hat/CentOS、Windows 和 OSX 的预构建包可以从 这里 下载。
新功能和改进 本次发布的主要功能是对 聚类 的支持,用于渗透索引。 对于渗透索引,DESCRIBE 命令现在扩展了 TABLE,可以查看渗透文档的模式。 ANY/ALL 函数可以用于字符串属性或表达式以及 PQ 标签。对 pq 索引的 SELECT 具有与常规索引相同的功 …

默认字符集表和停用词文件

在本文中,我们讨论了字符集表和停用词的新添加,这些添加旨在简化在配置索引时使用这些选项的过程。
在最初分析文档文本时,Manticore Search 需要知道文本中的哪些符号对进一步处理(将完整文本拆分为单独的单词、处理形态学等)是有意义的,哪些则不是。为了定义有效的文本字符,使用了 charset_table 选项。通过此选项,您可以指定要使用的符号集。
此外,为了提供更好的文本搜索质量,Manticore Search 执行所谓的字符折叠。例如,在分析您的搜索查询时,大 …

Manticore Search中的正则表达式

在这篇文章中,我们讨论正则表达式以及如何在Manticore Search中使用它
如果我们谈论文本匹配,最简单的就是字符串比较。搜索字符串和文档或字段必须完全相同。下一个文本搜索方法是通过执行简单的模式匹配,这可以允许将搜索字符串作为字段的子部分进行匹配。这种简单的模式匹配可以使用基本运算符,如通配符,其中像*或%这样的元字符表示“匹配任何字符”。在数据库中,这通常通过LIKE运算符来实现,例如:
SELECT * FROM mytable WHERE title LIKE …

关于启动时的 mmap、mlock 和 --force-preread

正如在文章 " Indexes load at startup " 中提到的,现在所有的索引(属性和词汇表文件)并不是物理加载到 RAM 中,而是使用内存映射。这使得它们在启动时能够更快地加载,但也带来了一些我想要解释的副作用。
首先,由于我们进行映射,索引可能不会永久锁定在物理 RAM 中,并且您不需要拥有足够的 RAM 以容纳所有索引。拥有合理数量的 RAM 在许多情况下可能已经为您提供了快速的搜索查询,因为当索引被缓存时,它们的工作速度显著更快。
第 …

Manticore Search 2.7.5 GA 发布

我们很高兴地宣布 Manticore Search 2.7.5 GA 的发布。
可从 这里 下载适用于 Debian、Ubuntu、Red Hat/CentOS、Windows 和 OSX 的预构建包。
改进 REGEX 函数用于字符串。它可以用于字符串属性、字符串 JSON 属性或字符串表达式 limit 和 offset 用于 JSON API 搜索 profiler 输出查询缓存阶段所花费的时间 修复 在此版本中修复了一些错误。
特别是,查询中使用 FACET 的隐式分 …

Relevance scoring in Manticore : part II

在关于相关性评分的第二部分中,我们讨论了如何使用位置进行匹配和评分。
了解字段中单词的位置很重要,可以提供更好的相关性。位置允许使用广泛的文本操作符,这些操作符可以通过单词相对于字段的位置或通过计算在字段内找到的关键字与输入查询之间的距离来执行匹配。基于位置的最常用操作符之一是 phrase 操作符 - "A B"。短语匹配是限制性的,因为它强制关键字按照查询中指定的方式进行匹配。这意味着关键字必须相邻并且顺序与查询中的相同。
知道单词的位置后,我们可以执 …

安装Manticore Search

安装Manticore Search