Annoy 针对内存使用优化的C++/Python中的近似最近邻 开源
Annoy(Approximate Nearest Neighbors Oh Yeah)是一个C++库,带有Python绑定,用于搜索空间中靠近给定查询点的点。它还创建了大型只读基于文件的数据结构,这些数据结构被映射到内存中,以便许多进程可以共享相同的数据。还有一些其他图书馆可以进行最近邻搜索。 Annoy几乎和最快的库一样快(见下文),但实际上还有另一个特性让Annoy与众不同:它能够使用静态文件作为索引。特别是,这意味着您可以跨进程共享索引。 Annoy还将创建索引与加载它们分离开来,因此您可以将索引作为文件传递并快速将它们映射到内存中。 Annoy的另一个好处是它试图最小化内存占用,因此索引非常小。
用户评论