Manticore搜索中的正则表达式

在本文中,我们将讨论正则表达式以及如何在Manticore搜索中使用它们
如果我们谈论文本匹配,最简单的方法就是字符串比较。搜索字符串和文档或字段必须完全相同。下一个文本搜索方法是执行简单的模式匹配,可以允许将搜索字符串作为字段的子部分匹配。这种简单的模式匹配可以使用基本运算符(如通配符),其中元字符如*或%表示"匹配任何字符"。在数据库中,这通常通过LIKE运算符实现,例如:
SELECT * FROM mytable WHERE title LIKE …

关于启动、mmap、mlock 和 --force-preread

正如在文章" 启动时加载索引 “中提到的,现在所有的索引(属性和词汇表文件)不再是物理加载到RAM中,而是通过内存映射的方式。这使得它们在启动时能够更快地加载,但也带来了一些我想要解释的副作用。
首先,由于我们进行了映射,索引可能不会永久锁定在物理RAM中,并且你不需要有足够的RAM让所有索引都适配。拥有合理数量的RAM在许多情况下已经可以为你提供快速的查询,因为当索引被缓存时,它们的工作速度会显著提高。
第二个后果 - 实际上内存映射只占用进程的一个“虚拟地址空 …

Manticore Search 2.7.5 GA 发布

我们很高兴地宣布发布 Manticore Search 2.7.5 GA. 可以从 这里 下载适用于 Debian、Ubuntu、Red Hat/CentOS、Windows 和 OSX 的预构建包。
改进 REGEX 函数用于字符串。它可以用于字符串属性、字符串 JSON 属性或字符串表达式 limit 和 offset 用于 JSON API 搜索 profiler 输出查询缓存阶段所花费的时间 修复 在此版本中修复了一些错误。
特别是,在带有 FACET 的查询中,通过 …

Relevance scoring in Manticore : part II

在关于相关性评分的第二部分中,我们讨论如何使用位置进行匹配和评分。
了解字段中单词的位置是重要的,可以提供更好的相关性。位置允许广泛的文本操作符,这些操作符可以通过单词相对于字段的位置执行匹配,或者通过计算在字段内找到的关键字与输入查询之间的距离。基于位置的最常用操作符之一是 短语 操作符 - "A B"。短语匹配 是限制性的,因为它强制关键字按照查询中指定的方式进行匹配。这意味着关键字必须是相邻的,并且与查询中的顺序相同。
知道单词的位置后,我们可以执行 …

Manticore Search中的线程

在本文中,我们讨论了Manticore Search中当前实现的工作线程以及如何调整工作线程的参数。
在Manticore Search中,目前有两种多处理模式,由指令 workers 控制。默认的多进程模式目前是 thread_pool,可选的模式是 threads。
线程 在多处理模式 ‘ threads ’ 中,为 每个 进入的网络 连接 创建一个新的专用线程。该线程在客户端断开连接之前处于活动状态 - 即,只要连接处于活动状态。在此期间,线程将执行来自该连接的传入查 …

Manticore Search 2.7.4 GA release

我们很高兴地宣布 Manticore Search 2.7.4 GA 的发布。
可供下载的预构建包适用于 Debian、Ubuntu、Red Hat/CentOS、Windows 和 OSX,下载地址 这里 。
改进 在远程分布式索引的情况下,SHOW THREADS 打印原始查询而不是 API 调用 SHOW THREADS 新选项 format=sphinxql 以 SphinxQL 格式打印所有查询 SHOW PROFILE 打印额外的 clone_attrs 阶段 修 …

安装Manticore Search

安装Manticore Search