使用 Manticore Search 处理中文、日文和韩文文档

警告:本文信息可能不够及时。有关最新信息,请 点击此链接。 关于 CJK 语言 CJK 语言拥有超过 40,000 个字符。这些字符大部分是中文。有时你会看到首字母缩写 CJKV。这里的 “V” 代表越南语。
CJK 字符包括:
中文:汉字 – 传统汉字;注音符号 – 汉语拼音字母;拼音 – 中文的罗马化(接近音译的概念)。 日文:平假名 – 日文音节;片假名 – 日文音节;阿拉伯数字。 韩文:韩文(韩文字母) 此外,每种语言都有一组象形关键(部首),作为在字典中搜索字符的分 …

Manticore Search 2.7.1 GA release

我们很高兴地宣布 Manticore Search 2.7.1 GA. 的发布
可以从 这里 下载适用于 Debian、Ubuntu、Red Hat/CentOS、Windows 和 OSX 的预构建包。有关 Docker 镜像,请查看官方 repository 。
Improvements 此版本对 Percolate Queries 进行了几个改进:
现在支持全扫描查询
MVA 属性可以在过滤器中使用
正则表达式过滤器和 RLP 形态处理与渗透索引一起工作。
在处理存储查 …

Percolate queries: Schemaless and expression filtering

在这篇文章中,我们讨论了如何在 Percolate Queries 中使用无模式文档。
Percolate Query 特性不仅允许存储全文匹配,还允许常规属性过滤。
直到 2.7.0,该功能仅限于单个数字属性条件。
现在过滤可以与 字符串 和 JSON 属性一起工作。JSON 过滤很有趣,因为您可以针对存储的查询测试无模式文档。过滤现在还支持多个属性过滤和 表达式 的使用,这允许更复杂的存储标准。
mysql> insert into pq …

Percolate Queries: docs_id option

在本文中,我们讨论 docs_id 选项,该选项提供了对 CALL PQ 结果集的更简单的操作。
让我们考虑以下 PQ 批量调用:
mysql> CALL PQ ('pq', ('{"title":"butter is good as", "id":3}', '{"title":"was butter","id":4}', …

使用ProxySQL路由分布式实时索引的插入操作

在本文中,我们将讨论如何使用ProxySQL在使用Sphinx/Manticore Search时路由插入到分布式实时索引。
Manticore的分布式索引允许在多个实时索引上进行UPDATE操作,UPDATE会发送到所有索引,但只在一个索引上发生更改(假设跨索引的ID是唯一的)。
对于插入操作,分布式索引不知道应该选择哪个索引,这意味着我们需要在应用程序代码中将插入发送到某个实时子索引。这的缺点是,对分布式索引进行更改(例如添加新的实时子索引)需要更改应用程序代码。 …

Manticore Search 2.7.0 GA release

我们很高兴地 announce Manticore Search 2.7.0 GA. 的发布。
预构建的包可用于 Debian、Ubuntu、Red Hat/CentOS、Windows 和 OSX,可以从 此处 下载。有关 Docker 镜像的信息,请查看官方 repository 。
内部改进 此版本对多个内部组件进行了重构,以现代化代码和流程。这些更改是透明的,并且不需要从旧版本或 Sphinx 2.x 升级。
为了应对 Spectre 和 Meltdown 补丁的性能 …

安装Manticore Search

安装Manticore Search