⚠️ 此页面为自动翻译,翻译可能不完美。
blog-post

Vector Search On GitHub

介绍 GitHub 的搜索功能有时会遇到困难,尤其是在您尝试通过直接提问的方式进行搜索时。这种方法通常会导致不相关的结果,这可能会让人感到沮丧。在搜索问题或拉取请求时,这种问题更为明显,因为细节非常重要。
让我们看一个例子:
GitHub 的搜索功能有一些限制,但搜索技术领域正在迅速进步。语义搜索,它理解词语背后的上下文和含义,而不仅仅是词语本身,正变得越来越流行。尽管 GitHub 尚未添加此功能,但它确实可以帮助使搜索更加准确和相关。
考虑到这一点, …

blog-post

Replication: cluster creation, joining, updating table settings

关于我 大家好,我是迈克。
我最近开始在Manticore担任开发倡导者。我并不是完全远离IT的人,但正在追赶现代技术。在这篇博客中,我将分享我的经验和学习Manticore的体会。我计划以日记的形式记录我的旅程,解释Manticore是什么以及如何使用它。让我们一起发现事物如何协同工作,识别问题,并实时与开发者互动。
这是我的第一篇博客文章。如果您有兴趣与我一起学习Manticore,我会通过以下方式保持更新: 推特 电报: EN / RU Slack 复制 复制的一般目的 …

blog-post

About Columnar storage in Manticore Search

引言 在本文中,我们将探讨 Manticore 列存储的目的,它与行式存储有何不同,以及在哪些情况下使用它是有意义的。我们还将了解存储格式的基本结构及其在搜索守护进程查询处理工作流程中的集成细节。
默认属性存储(行式存储) 在 Manticore 中,存在两种不同的实体:仅支持全文查询的全文字段,以及可用于分组、排序和过滤的各种类型的属性。默认存储引擎(engine='rowwise')将所有文档的所有属性存储在内存中。
为了将属性加载到内存中,使用了 mmap,这可以通过选 …

blog-post

Full-text Search vs Vector Search

全文搜索与向量搜索:有何不同以及何时使用它们? 在寻找信息方面,搜索技术已经取得了长足进步。过去,我们只有关键词搜索,但现在,得益于机器学习,我们有了向量搜索,它帮助我们根据含义而非仅仅精确的词语来查找信息。在本文中,我们将剖析全文搜索与向量搜索之间的差异,讨论它们的优势,并探讨每种方法在什么情况下表现最佳。
什么是全文搜索? 全文搜索是一种经典的通过匹配您输入的词语来查找信息的方法。它不仅查找精确匹配,还支持前缀和中缀搜索、形态学处理(如词干提取和词形还原)以及模糊搜索方 …

blog-post

Full-Text Search vs. Semantic Search: Exploring Advanced Search Technologies

在当今的数字环境中,两种关键的搜索方法已成为变革者:全文搜索和语义搜索。虽然两者都旨在提高搜索准确性和用户体验,但它们的工作方式本质上不同。本文深入探讨它们的主要差异,展示它们的优势和局限性,并指导您何时使用每种方法。
什么是全文搜索? 全文搜索是一种技术,它检查所有存储文档中的每个单词以匹配搜索条件。它使用多种方法来实现高效和准确的结果:
倒排索引 单词处理和词根提取 相关性评分(例如TF-IDF和BM25) 逻辑运算符和短语匹配 当处理大型文档集合或用户寻求特定术语或短语 …

blog-post

Lexical Search vs. Vector Search: Exploring the Differences and Key Aspects

在信息检索领域,两种主要的搜索方法脱颖而出:词法搜索和向量搜索。虽然两者都旨在帮助用户找到相关信息,但它们的工作方式本质上不同。本文将分解主要差异,突出它们的优势和劣势,并帮助您了解何时使用每种方法。
什么是词法搜索? 词法搜索,也称为关键词搜索,是一种在文档或数据库中查找特定单词或短语精确匹配的简单方法。当处理结构化数据或精确术语非常重要时,它特别有用。词法搜索通常包括:
精确关键词匹配 布尔运算符(AND,OR,NOT) 短语匹配 通配符搜索 这种方法对于用户明确知道自己 …

安装Manticore Search

安装Manticore Search