Default charset tables and stopwords files
在本文中,我们将讨论字符集表和停用词的新添加内容,这些内容旨在简化在配置索引时使用这些选项的过程。
当最初分析文档文本时,Manticore Search 需要知道文本中的哪些符号对后续处理(将全文拆分为单独的单词、处理词形变化等)是有意义的,哪些是没有意义的。为了定义有效的文本字符,使用 charset_table 选项。通过此选项,您可以指定想要使用的符号集。
此外,为了提供更好的文本搜索质量,Manticore Search 会执行所谓的字符折叠。例如,当分析您的搜索查 …