迁移到 Manticore 3：文档 ID

已发布: Jul 04, 2019
自动翻译: Migrating to Manticore 3: document ids

在本文中，我们将讨论 Manticore Search 3.0 中文档 ID 数据类型的变化。

在之前的版本中，文档 ID 是无符号大整数。在 3.0 中，这一点发生了变化，因为我们切换到了有符号大整数。做出这一决定的原因是为了使文档 ID 与 bigint 属性保持一致，因为这些属性是有符号的，在大多数情况下，即使是有符号的大整数也应该足够，并且无论如何我们正在朝着自动生成 ID 的方向发展。

然而，在一些少见的情况下，这一变化可能会成为一个问题，在本文中，我们将更详细地了解这种差异以及如何克服可能出现的问题。

无符号大整数支持的值范围在 0 到 18,446,744,073,709,551,615（2⁶⁴-1）之间，而有符号大整数可以取值范围在 −9,223,372,036,854,775,808 到 9,223,372,036,854,775,807（−2⁶³ 到 2⁶³−1）。有符号的正范围足够大，可以容纳大型数据集（至少没有已知的 Manticore 集合超过令人难以置信的 9+ 千万亿文档）。问题只会在文档 ID 不是递增值，而是使用无符号大整数的哈希时发生。对于这种情况，如果无法切换到可以适应有符号类型的哈希，可以使用简单的转换来存储和检索哈希，具体如下所述。

在实时索引的情况下，支持自动生成 ID 的功能将很快添加。在 RT 文档 ID 不是来自数据库的 ID，而只是生成的（通过哈希或其他方法）时，当 Manticore 端进行自动生成时，事情将变得更简单。

为什么不同时支持这两种数据类型？

在 Manticore 中同时支持有符号和无符号 ID 目前会带来更多麻烦而不是帮助。例如，一些客户端对响应中预期的数据类型非常严格。发送无符号的响应会造成很多混淆，因为客户端被指示期望一个有符号的大整数。

如何处理这一变化？

为了与 Manticore Search 中的变化保持一致，文档 ID 类型可能需要在您的应用程序和数据源中进行更改。如果 ID 存储在数据库中，但它们从未达到正有符号范围（2⁶³ -1），那么事情就简单了：只需将列转换为有符号。如果您的 ID 超过该值，则需要将数字转换为有符号范围。

超出有符号正范围（2⁶³ -1）的值可以通过从中减去 2⁶⁴ 来表示为负数：这将把 2⁶³（超出有符号正范围的第一个数字）转换为 -2⁶³，并将 2⁶⁴-1（最大的无符号大整数）转换为 -1。如果您基于返回无符号大整数的哈希函数生成 ID，也可以使用此方法。

例如，在 MySQL 中，将无符号大整数转换为适应有符号大整数可以使用 IF (id>>63, -(~id) - 1,id)。要将“映射”的有符号数字转换回无符号，可以使用 IF(signed_id<0, ~0^~signed_id,signed_id)。使用位函数的原因是因为 MySQL 仅支持大于 9223372036854775807（63 位）的数字的位函数。

SELECT id,if (id>>63, -(~id) - 1,id) AS mapped_to_signed,
signed_id, if (signed_id<0, ~0^~signed_id,signed_id)  AS unsigned_from_mapped
FROM test ORDER BY id

id	unsigned_to_mapped	signed_id	unsigned_from_mapped
0	0	0	0
1	1	1	1
9223372036854775807	9223372036854775807	9223372036854775807	9223372036854775807
9223372036854775808	-9223372036854775808	-9223372036854775808	9223372036854775808
9223372036854775809	-9223372036854775807	-9223372036854775807	9223372036854775809
18446744073709551613	-3	-3	18446744073709551613
18446744073709551614	-2	-2	18446744073709551614
18446744073709551615	-1	-1	18446744073709551615

如果您使用强类型语言（如 .NET），您需要检查代码以确保它会期望搜索响应中的文档 ID 是有符号的，而不是无符号的。

我们知道这一变化可能会带来一些麻烦，但这是必须进行的一次性更改，以享受最新的 Manticore Search。

迁移到 Manticore 3：文档 ID

Read also

安装Manticore Search