About me

A few words about Manticore
在我开始学习Manticore Search时,我发现它是一个强大的开源数据库。它可以使用SQL和JSON进行快速全文搜索,还有很多其他功能。它创建于2017年,自那时以来经过了大量测试和改进。得益于强大的社区,许多错误已被修复,它现在工作得非常好。
Manticore非常适合快速查找单词、短语和句子,并且拥有许多其他高级功能。这使得它非常适合在线商店和企业搜索系统等应用。凭借丰富的功能和来自社区及Manticore Software团队的支持,许多人选择Manticore作为他们的搜索解决方案。
在这篇文章中,我将向你展示如何开始使用Manticore。
Where to start
Minimal environment
- 互联网
- 不太旧的操作系统(Mac、Win或Lin - 都可以)
- Docker或Docker Desktop。
- 相对灵活的双手
- 强烈的愿望,通过创建高质量、易于使用的快速数据库和全文信息搜索系统来改善世界。
Tools
- 控制台(或者你可以使用Docker Desktop连接到容器)
- 文件管理器(可选,我喜欢 Midnight Commander )
- 控制台文本编辑器(例如,mcedit、nano、vim)。在示例中,我们将使用内置于Midnight Commander的编辑器mcedit,以避免查找vim的退出命令。
使用MC时,你不需要安装编辑器,因为内置的已经足够。如果安装了其他编辑器,第一次执行[F4编辑]命令时,MC会提示你选择所需的编辑器。示例将使用内置的MC编辑器,选中文件时按[F4]调用,或使用mcedit <文件名以创建/打开>命令。
更快捷的方法是通过命令行完成所有操作。 我想要快速!
Infrastructure deployment
我们将在Docker容器中进行Manticore实验,因为这是一种流行的跨平台解决方案,通常用于Manticore需求最大的环境中,尽管该数据库有适用于所有流行操作系统的版本。
那些已经知道如何使用docker的专家可以跳过,直到容器启动。好吧,新手和我将一起从零开始逐步进行。
首先,你必须完成以下步骤:
- 从网站
https://www.docker.com/
为我们的平台下载Docker Desktop:
- 安装后,我们需要获取官方的Manticore镜像。在应用程序的顶部栏中,有一个搜索框。只需在其中输入“ManticoreSearch”。
- 在输出中,我们有“manticoresearch/manticore”。
- 点击“pull”按钮,然后切换到镜像标签。
- 然后选择我们刚下载的新镜像,点击“play”。
在弹出的窗口中,你需要输入一些额外的设置:
- 容器名称:
manticore
。 - 对于端口,我们就使用与数据库相同的端口
9306
,以简化操作。 - 在环境变量中,设置变量
EXTRA
的值为1
。这对于运行非常有用的附加组件是必需的。了解更多 这里 。
然后点击“运行”。
接下来,返回容器标签。我们将在活动容器列表中找到我们的容器。在下拉菜单中,有一个“在终端中打开”选项。会弹出一个窗口,显示与您的容器直接连接的终端。
恭喜,你已经成功在你的计算机上安装了Manticore Search docker镜像。
在Docker Desktop接口中折腾了一会儿后,你会发现通过命令行完成操作是最快的方式。docker run --name manticore -p 9306:9306 -d manticoresearch/manticore
docker exec -it manticore /bin/sh
- 为了简化操作,我们将在容器内安装Midnight Commander文件管理器:
apt update
apt install mc
mc
所以,我们更新了“apt”包管理器,然后安装了“mc”文件管理器并启动它。
现在,您的终端应该看起来像这样:
第一步。第一个表。
好的,让我们连接到数据库并创建我们的第一个表。
mysql -h0 -P9306
这里是用于主机连接的 -h
标志,设置为 0
是因为我们正在尝试连接到本地主机。使用 -P
标志(注意大写 P)用于端口连接;我们使用的是内部端口号。
让我们创建一个包含“info”字段作为文本和“value”字段作为整数的表。同时,让我们为英语单词增强该表的词干提取器。
CREATE TABLE demo (info TEXT, value INT) morphology = 'stem_en';
Query OK, 0 rows affected (0.00 sec)
要查看在创建或更改表列时创建了哪些字段,请使用 desc
命令(就像“描述”)。
DESC demo
+-------+-----------+------------------+
| Field | Type | Properties |
+-------+-----------+------------------+
| id | bigint | |
| info | text | indexed stored |
| value | uint | |
+-------+-----------+------------------+
3 rows in set (0.00 sec)
此外,您还可以检查与该表关联的词干或词形还原算法:
SHOW TABLE demo SETTINGS;
+---------------+-----------------------+
| Variable_name | Value |
+---------------+-----------------------+
| settings | morphology = stem_en |
+---------------+-----------------------+
1 row in set (0.01 sec)
让我们向表中添加数据。下面是一次添加一条记录的选项:
INSERT INTO demo (info, value) VALUES ('Walking down the street', 1);
Query OK, 1 row affected (0.01 sec)
这是如何批量添加记录的方法:
INSERT INTO demo (info, value) VALUES ('Walking along the embankment', 2), ('Walking the dog', 3), ('Reading a book', 4), ('Book read ', 5);
Query OK, 3 rows affected (0.00 sec)
现在让我们检查一下我们在表中写入了什么:
SELECT * FROM demo;
+-----------------------+----------------------------------------------------+-------+
| id | info | value |
+-----------------------+----------------------------------------------------+-------+
| 8217204862853578790 | Walking down the street | 1 |
| 8217204862853578791 | Walking along the embankment | 2 |
| 8217204862853578792 | Walking the dog | 3 |
| 8217204862853578793 | Reading a book | 4 |
| 8217204862853578794 | Book read | 5 |
+-----------------------+----------------------------------------------------+-------+
5 rows in set (0.01 sec)
让我们搜索一个与添加的单词意义相近的单词:
SELECT * FROM demo WHERE match('read');
+---------------------+-----------------------------------+-------+
| id | info | value |
+---------------------+-----------------------------------+-------+
| 8217204862853578794 | Book read | 5 |
| 8217204862853578793 | Reading a book | 4 |
+---------------------+-----------------------------------+-------+
2 rows in set (0.01 sec)
您还可以查看找到记录的关键字、数量、文档等:
SHOW META;
+----------------+----------+
| Variable_name | Value |
+----------------+----------+
| total | 2 |
| total_found | 2 |
| total_relation | eq |
| time | 0.000 |
| keyword[0] | read |
| docs[0] | 2 |
| hits[0] | 2 |
+----------------+----------+
7 rows in set (0.01 sec)
要处理不涉及全文搜索的字段属性,您可以使用经典的 SQL 过滤语句:
SELECT * FROM demo WHERE value > 3;
+---------------------+-----------------------------------+-------+
| id | info | value |
+---------------------+-----------------------------------+-------+
| 8217204862853578794 | Book read | 5 |
| 8217204862853578793 | Reading a book | 4 |
+---------------------+-----------------------------------+-------+
2 rows in set (0.01 sec)
删除记录可以像选择查询一样进行:
DELETE FROM demo WHERE value = 5;
Query OK, 1 row affected (0.01 sec)
DELETE FROM demo WHERE match ('street');
Query OK, 1 row affected (0.01 sec)
DELETE FROM demo WHERE id = 8217204862853578791;
Query OK, 1 row affected (0.00 sec)
SELECT * FROM demo;
+---------------------+---------------------------------+-------+
| id | info | value |
+---------------------+---------------------------------+-------+
| 8217204862853578792 | Walking the dog | 3 |
| 8217204862853578793 | Reading a book | 4 |
+---------------------+---------------------------------+-------+
2 rows in set (0.00 sec)
你为什么不尝试添加和搜索一些记录呢?完成后,我们可以继续进行下一步。
不要忘记断开连接:
exit;
今天就到这里,下次我们将查看 如何在现有表中更改词形文件 以及如何更新我们的记录。