⚠️ 此页面为自动翻译,翻译可能不完美。

Default charset tables and stopwords files

在本文中,我们将讨论字符集表和停用词的新添加内容,这些内容旨在简化在配置索引时使用这些选项的过程。
当最初分析文档文本时,Manticore Search 需要知道文本中的哪些符号对后续处理(将全文拆分为单独的单词、处理词形变化等)是有意义的,哪些是没有意义的。为了定义有效的文本字符,使用 charset_table 选项。通过此选项,您可以指定想要使用的符号集。
此外,为了提供更好的文本搜索质量,Manticore Search 会执行所谓的字符折叠。例如,当分析您的搜索查 …

Manticore 2.7.5 vs Sphinx 3.1.1

这里 我们对 Sphinx 3.0.2 与 Manticore 2.6.2 进行了基准测试。这已经是 8 个月前的事了,自那以后 Manticore 和 Sphinx 都发生了变化。正如 Sphinx 3.0.3 宣布 中所说,Sphinx 3.0.3 相比 3.0.2 最多快了 2 倍,因此再次进行基准测试很有趣。这次让我们在真实数据集上进行测试 - Hacker News 评论。
基准测试是在以下条件下进行的:
Hacker News 精选评论数据集 2016 …

Manticore Search 2.8.0 GA release

我们很高兴宣布 Manticore Search 2.8.0 GA 的发布。
适用于 Debian、Ubuntu、Red Hat/CentOS、Windows 和 OSX 的预构建软件包可以从 这里 下载。
新功能和改进 本次发布引入的重大功能是支持 集群 的 percolate 索引。 对于 percolate 索引,DESCRIBE 命令现在扩展了 TABLE,允许查看 percolate 文档的模式。 ANY/ALL 函数现在也可以用于字符串属性或表达式以及 PQ 标 …

Regular expressions in Manticore Search

在本文中,我们将讨论正则表达式以及如何在 Manticore Search 中使用它们
如果我们谈论文本匹配,最简单的方式就是字符串比较。搜索字符串和文档或字段必须完全相同。下一种文本搜索方法是通过执行简单的模式匹配,这可以允许将搜索字符串作为字段的子部分进行匹配。这种简单的模式匹配可以使用基本操作符如通配符,其中元字符如 * 或 % 表示“匹配任何字符”。在数据库中,这通常通过 LIKE 操作符实现,例如:
SELECT * FROM mytable WHERE title …

About startup, mmap, mlock and --force-preread

如文章 " Indexes load at startup " 中所述,现在所有索引(属性和词表文件)不会被物理加载到 RAM 中,而是通过内存映射的方式。这使得在启动时能够更快地加载它们,但也带来了一些副作用,我想要解释一下。
首先,由于我们进行了映射,索引可能不会永久锁定在物理 RAM 中,因此您不需要拥有足够的 RAM 来容纳所有索引。拥有合理的 RAM 量在许多情况下已经可以为您提供快速的搜索查询,因为当索引被缓存时,它们的工作速度显著提高。
第二 …

Manticore Search 2.7.5 GA release

我们很高兴宣布 Manticore Search 2.7.5 GA 的发布。
适用于 Debian、Ubuntu、Red Hat/CentOS、Windows 和 OSX 的预构建软件包可以从 这里 下载。
改进 REGEX 字符串函数。可用于字符串属性、字符串 JSON 属性或字符串表达式 JSON API 搜索 的 limit 和 offset profiler 输出查询缓存阶段所花费的时间 修复 此版本修复了若干错误。
特别是,查询中使用 FACETs 时,隐式分组(通 …

安装Manticore Search

安装Manticore Search