向量检索算法有哪些

NN最近邻搜索广泛应用在各类搜索、分类任务中,在超大的数据集上因为效率原因转化为ANN,常见的算法有KD树、LSH、IVFPQ和HNSW。

KNN 和 ANN

  • k-Nearest Neighbor, KNN

    • K最近邻算法,可用作聚类、回归等。
  • Approximate nearest neighbor, ANN

    • 目前在高维度度量空间中没有有效精确 NNS 的方法。这背后的原因在于维度的“诅咒” 。为了避免维数的诅咒,减少对 kNN 问题解决方案的要求,使其近似(ANN),精度允许的条件下通过牺牲准确率来换取比暴力搜索要快的多的搜索速度。
    • ANN 应用:推荐系统。

ANN 方法分类

  1. 树方法,如 KD-tree
  2. 哈希方法,如 Local Sensitive Hashing (LSH)
  3. 矢量量化方法,如 Product Quantization (PQ)
  4. 近邻图方法,如 Hierarchical Navigable Small World (HNSW)


参考:HNSW学习笔记

近似最近邻算法 HNSW 学习笔记(一)介绍


标签: ann、hnsw、knn、诅咒、lsh、面试
  • 回复
隐藏