算法笔记 近似最近邻查找(Approximate Nearest Neighbor Search,ANN)
1 介绍
- 精准最近邻搜索中数据维度一般较低,所以会采用穷举搜索,即在数据库中依次计算其中样本与所查询数据之间的距离,抽取出所计算出来的距离最小的样本即为所要查找的最近邻。
- 当数据量非常大的时候,搜索效率急剧下降。
- ——>近似最近邻查找(Approximate Nearest Neighbor Search,简称 ANN)是一种在大规模数据集中查找与给定查询点最相似(或“最近”)的数据点的优化算法。
- 与精确最近邻查找不同,近似最近邻查找不保证找到绝对最近的邻居,但它通常比精确方法更快,尤其是在高维数据空间中。
- 在牺牲可接受范围内的精度的情况下提高检索效率
- 近似最近邻检索利用数据量增大后数据之间会形成簇状聚集分布的特性,通过对数据分析聚类的方法对数据库中的数据进行分类或编码,对于目标数据根据其数据特征预测其所属的数据类别,返回类别中的部分或全部作为检索结果。
2 KD 树
算法笔记:KD树_UQI-LIUWJ的博客-CSDN博客
3 球树
算法笔记:球树_UQI-LIUWJ的博客-CSDN博客
- KD树和球树通常用于精确最近邻查找,但也可以用于近似最近邻查找
-
限制搜索深度
- 在构建KD树/球树的过程中,每个节点都会分割其包含的数据点。在查找最近邻时,通常会遍历这些节点以找到最近的点
- 通过限制搜索深度,可以减少搜索时间,但这可能会导致找到的点不是真正的最近邻
-
早停准则
-
在搜索过程中,一旦找到一个与查询点距离在某个阈值范围内的点,就停止搜索。
-
这样可以加速查找过程,但可能会错过更近的点。
-
-
4 LSH 局部敏感哈希(locality-sensitive hashing)
- LSH的基本思想是将相近的点映射到相同或相近的“桶”(bucket)中,以便能快速地检索这些点。
4.1 几个概念
-
哈希函数族:
- 选择一个局部敏感的哈希函数族,该函数族具有一个重要的性质:距离近的点被哈希到相同桶的概率高,而距离远的点被哈希到相同桶的概率低。
-
局部敏感
- 一个局部敏感的哈希函数族 H 对于任意两个点 p 和 q,以及任意两个距离阈值 R 和 r(R>r),具有以下性质
-
正性质: 如果 distance(p,q)≤r,则 h(p)=h(q) 的概率较高。
-
也就是说,如果两个点 p 和 q 距离很近,那么它们被哈希到同一个桶的概率应该很高。
-
-
负性质: 如果distance(p,q)≥R,则 h(p)=h(q) 的概率较低。
-
也就是说,如果两个点 p 和 q 距离很远,那么它们被哈希到同一个桶的概率应该很低。
-
-
- 一个局部敏感的哈希函数族 H 对于任意两个点 p 和 q,以及任意两个距离阈值 R 和 r(R>r),具有以下性质
-
多哈希表:
- 通常使用多个这样的哈希表,以增加查找精度。
-
候选集生成:
- 对于一个查询点,首先计算其哈希值,并在相应的桶中查找候选点。
-
后处理:
- 在候选集中进行距离计算,以找到最近邻
相关文章:
![](https://img-blog.csdnimg.cn/8cdcbd1f8dea4b88b7f7ffaa0269022c.png)
算法笔记 近似最近邻查找(Approximate Nearest Neighbor Search,ANN)
1 介绍 精准最近邻搜索中数据维度一般较低,所以会采用穷举搜索,即在数据库中依次计算其中样本与所查询数据之间的距离,抽取出所计算出来的距离最小的样本即为所要查找的最近邻。 当数据量非常大的时候,搜索效率急剧下降。——>…...
![](https://img-blog.csdnimg.cn/img_convert/3e84ee4009bdfda0f1289f9ab840dad8.webp?x-oss-process=image/format,png)
uni-app 之 vue语法
uni-app 之 vue语法 image.png --- v-html 字符 --- image.png <template><view><view>{{title}}</view>--- v-html 字符 ---<view>{{title2}}</view><view v-html"title2"></view><view>{{arr}}</view&g…...
![](https://img-blog.csdnimg.cn/59027d258848442fa465c9e9925e221f.jpeg#pic_center)
Android之RecyclerView仿ViewPage滑动
文章目录 前言一、效果图二、实现步骤1.xml主布局2.所有用到的drawable资源文件3.xml item布局4.adapter适配器5.javabean实体类6.activity使用 总结 前言 我们都知道ViewPageFragment滑动,但是的需求里面已经有了这玩意,但是在Fragment中还要有类似功能…...
![](https://img-blog.csdnimg.cn/ebdea737007041bbb16511d9a075cea5.png)
【owt-server】AudioSendAdapter分析
owt-server/source/core/rtc_adapter/AudioSendAdapter.cc使用其他线程运行rtprtcpmodule taskrunner分配线程:因此,对rtprtcp的使用都是加了mutex的:首先为音频发送者生成一个随机的ssrc并注册 // SSRCs of this type.std::vector<uint32_t> ssrcs_;发送还要向rtprtc…...
![](https://www.ngui.cc/images/no-images.jpg)
day33 List接口
List实现类 java.util.ArrayList: 底层通过数组保存数据 , 查询快,增删慢 java.util.LinkedList: 底层通过链表保存数据, 查询慢,增删快 如果对操作性能没有特殊要求,我们一般选择ArrayList…...
![](https://www.ngui.cc/images/no-images.jpg)
云原生周刊:Linkerd 发布 v2.14 | 2023.9.4
开源项目推荐 Layerform Layerform 是一个 Terraform 包装器,可帮助工程师使用纯 Terraform 文件构建可重用的基础设施。 为了实现重用,Layerform 引入了层的概念。每层都包含一些基础设施,并且可以堆叠在另一层之上。 除了更易于使用之外…...
![](https://img-blog.csdnimg.cn/642c6816e4e14cbb860567de314f455d.png)
CS420 课程笔记 P5 - 内存编辑 数据类型
文章目录 IntroductionData typesBooleansNegative numbers (Signed integers)Floating-point numbers (fractional numbers) Unknown value scansHealth findingFloat finding (Player position hack / Teleport hack) Additional things Introduction 这节课将结束数据类型并…...
![](https://www.ngui.cc/images/no-images.jpg)
oracle报错 ORA-02290: 违反检查约束条件问题
保存数据库信息时,提示违反检查约束条件,如图: org.springframework.dao.DataIntegrityViolationException: ### Error updating database. Cause: java.sql.SQLIntegrityConstraintViolationException: ORA-02290: 违反检查约束条件 (MXUSER…...
![](https://img-blog.csdnimg.cn/3786174527f2487b82a3f36166f71747.png)
Prometheus + grafana 的监控平台部署
一、Prometheus安装 tar -zxvf prometheus-2.44.0.linux-amd64.tar.gz -C /opt/module/ sudo chown -R bigdata:bigdata /opt/module/prometheus-2.44.0.linux-amd64 mv /opt/module/prometheus-2.44.0.linux-amd64 /opt/module/prometheus-2.44.0 ln -s /opt/module/promethe…...
![](https://www.ngui.cc/images/no-images.jpg)
npm、yarn、pnpm
一、简介 CommonJS 的出现,使 node 环境下的 JS 代码可以用模块更加细粒度的划分。一个类、一个函数、一个对象、一个配置等等均可以作为模块,这种细粒度的划分,是开发大型应用的基石。 为了解决在开发过程中遇到的常见问题,比如…...
![](https://img-blog.csdnimg.cn/a2cb86563df349dc84c37b261a8bc935.jpeg)
力扣|两数相加
先放题目: 给你两个非空的链表,表示两个非负的整数。它们每位数字都是按照 逆序 的方式存储的,并且每个节点只能存储 一位 数字。 请你将两个数相加,并以相同形式返回一个表示和的链表。 你可以假设除了数字 0 之外,…...
![](https://img-blog.csdnimg.cn/165c1e52df26454f84ff9bbc9e97772d.png)
prometheus通过blackbox-exporter监控web站点证书
1 概述 线上站点普遍是https,因此监控https web站点的证书的过期时间,是一个基础性需求。例如,证书过期会导致tls握手失败,进而导致用户无法正常访问web站点。 blackbox-expoter是一个web服务,它暴露了一个接口&#…...
![](https://img-blog.csdnimg.cn/86766580f5d841f48bc207400064aed8.png)
CentOS7 Hadoop3.3.0 安装与配置
一、安装JDK 1、创建文件夹tools和training用于存放压缩包和解压使用,tools存放压缩包,training用于解压后安装jdk和hadoop的路径。 1)回到路径为 / 的位置 cd /2) 创建 tools 和 training mkdir toolsmkdir training3) 进入tools文件夹 …...
![](https://img-blog.csdnimg.cn/1e0be556734f4255961f790934742b71.jpeg#pic_center)
2023年9月CDGA/CDGP数据治理认证考试报名,当然弘博创新
据DAMA中国官方网站消息,2023年度第三期DAMA中国CDGA和CDGP认证考试定于2023年9月23日举行。 报名通道现已开启,相关事宜通知如下: 考试科目: 数据治理工程师(CertifiedDataGovernanceAssociate,CDGA) 数据治理专家(CertifiedDataGovernanc…...
![](https://img-blog.csdnimg.cn/ad2128a376bf4fb998cec70317267dc0.png)
Re45:读论文 GPT-1 Improving Language Understanding by Generative Pre-Training
诸神缄默不语-个人CSDN博文目录 诸神缄默不语的论文阅读笔记和分类 论文全名:Improving Language Understanding by Generative Pre-Training 论文下载地址:https://www.mikecaptain.com/resources/pdf/GPT-1.pdf 本文是2018年OpenAI的工作,…...
![](https://img-blog.csdnimg.cn/20190719172208807.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3hpYW5mYWp1c2hp,size_16,color_FFFFFF,t_70)
VB.NET 如何将某个Excel的工作表中复制到另一个的Excel中的工作表中https://bbs.csdn.net/topics/392861034
参考http://share.freesion.com/306372/可以实现直接拷贝指定表 Private Sub Excel复制工作簿()Dim myExcelApp As New Microsoft.Office.Interop.Excel.ApplicationmyExcelApp.Workbooks.Open(System.Environment.CurrentDirectory "\\测试用例.xlsx", Type.Missin…...
![](https://img-blog.csdnimg.cn/f60ba46a447a480683ac76fbf59aed7e.png#pic_center)
深入解析Kotlin类与对象:构造、伴生、单例全面剖析
前言 本篇文章将带您了解Kotlin编程中的重要概念:类及构造函数、访问修饰符、伴生对象和单例模式。就像搭积木一样,我们会逐步揭开这些概念的面纱,让您轻松理解它们的作用和用法。无论您是编程新手还是有经验的开发者,本文都将为…...
![](https://img-blog.csdnimg.cn/05526439a76c49e1b252ff8b6cddb81b.png)
JavaScript构造函数
1、构造函数: 是一个函数,是通过new运算符进行调用,生成一个特殊的对象并返回。 function 函数名([参数]){ this.属性名 ‘属性值’ ... this.属性名 function([参数]){ 函数体语句 } } 通常情况下,建议构造函数的首字母大写 …...
![](https://www.ngui.cc/images/no-images.jpg)
手写嵌入式操作系统(基于stm8单片机)
#include <stc8h.h> #include <intrins.h> #define MAX_TASKS 2 //简化方面,我们当前操作系统只有2个task #define MAX_TASK_DEP 32unsigned char idata task_sp[MAX_TASKS]; // 任务的堆栈指针 unsigned char idata task_stack[MAX_TASKS][MAX_TASK_DEP];// 每个…...
![](https://www.ngui.cc/images/no-images.jpg)
vue3.3 ~
defineModel 原本: // 1 defineProps({modelValue: {type: Number,required: true,default: 0} })defineProps([modelValue]) // 2 const emit defineEmits([update:modelValue])现在: const value defineModel<number>({ default: 0 })defin…...
![](https://img-blog.csdnimg.cn/03d3c25585544c058a2fda299ea187b3.png)
滑动窗口实例4(将x减到0的最小操作数)
题目: 给你一个整数数组 nums 和一个整数 x 。每一次操作时,你应当移除数组 nums 最左边或最右边的元素,然后从 x 中减去该元素的值。请注意,需要 修改 数组以供接下来的操作使用。 如果可以将 x 恰好 减到 0 ,返回 …...
![](https://img-blog.csdnimg.cn/cbb66bf5214845338e0c456b722e7f39.png)
数据库原理及应用(MySQL)
建议大屏观看,避免格式错误,影响观感 目录 第一章 数据库系统概述 1.数据库系统概述 1.1.信息 1.2.数据 1.3.信息和数据之间的联系 1.4.数据库(DB) 1.5.数据库管理系统(DBMS) 1.6.数据库管理系统的…...
![](https://img-blog.csdnimg.cn/1046c94bac694315b67b251650df48d4.png)
初识Maven(一)命令行操作和idea创建maven工程
Maven 是 Apache 软件基金会组织维护的一款专门为 Java 项目提供**构建**和**依赖**管理支持的工具。 构建过程包含的主要的环节:- 清理:删除上一次构建的结果,为下一次构建做好准备 - 编译:Java 源程序编译成 *.class 字节码文件…...
![](https://www.ngui.cc/images/no-images.jpg)
MHA高可用配置及故障切换
1.什么是 MHA MHA(MasterHigh Availability)是一套优秀的MySQL高可用环境下故障切换和主从复制的软件。 MHA 的出现就是解决MySQL 单点的问题。 MySQL故障切换过程中,MHA能做到0-30秒内自动完成故障切换操作。 MHA能在故障切换的过…...
![](https://img-blog.csdnimg.cn/ec9c16c1e7b648f7a4e7cf401bfdff30.png)
FPGA/IC秋招面试题 1(解析版)
分享个人觉得遇到还不错的题,后续有会继续补充。。。 以下题目均来自网络平台,用于学习交流如有侵权立马删除!!! 1. Verilog语言中,下面哪些语句不可被综合() A. #delay语句 B. initial语句 C. always语句 D. 用gen…...
![](https://img-blog.csdnimg.cn/0bac6487bf594a299cfd1df78960351a.png)
华为云 异构数据迁移
数据库和应用迁移 UGO(Database and Application Migration UGO,以下简称为UGO)是专注于异构数据库结构迁移的专业服务。可将源数据库中的DDL、DML和DCL一键自动转换为华为云GaussDB/RDS的SQL语法,通过数据库评估、对象迁移两大核…...
![](https://www.ngui.cc/images/no-images.jpg)
wininet,winhttp,xmlhttprequest,各版本区别 《转》
一、标准API接口WinINet(Microsoft Windows Internet)和WinHTTP(Microsoft Windows HTTP) 实现Http访问,微软提供了二套API:WinINet, WinHTTP(分别封装于system32目录下的wininet.dll和winhttp.dll内) 二者主要区别在于后者更为安…...
![](https://img-blog.csdnimg.cn/6da046c676594a42be3dab0d40b7eb79.png)
朴素,word,任何参考文献导入endnote
朴素,word,任何参考文献导入endnote 注意:对于以下这几种不做阐述,看其他帖子都有讲述: 这里的参考文献指的是类似于: [1]. Li Y, Lu Y, Huo X, et al. Bandgap tuning strategy by cations and halide io…...
![](https://img-blog.csdnimg.cn/59b0d719a3404345b3f7cc786cfc1668.png)
数学建模--三维图像绘制的Python实现
目录 1.绘制三维坐标轴的方法 2.绘制三维函数的样例1 3.绘制三维函数的样例2 4.绘制三维函数的样例3 5.绘制三维函数的样例4 6.绘制三维函数的样例5 1.绘制三维坐标轴的方法 #%% #1.绘制三维坐标轴的方法 from matplotlib import pyplot as plt from mpl_toolkits.mplot3…...
![](https://img-blog.csdnimg.cn/cba7092e1b554be7bfa4661443006e6b.png)
Spring Cloud Alibaba-Feign整合Sentinel
第1步: 引入sentinel的依赖 <!--sentinel客户端--> <dependency><groupId>com.alibaba.cloud</groupId><artifactId>spring-cloud-starter-alibaba-sentinel</artifactId> </dependency> 第2步: 在配置文件中开启Feign对Sentinel的…...
![](https://imgsa.baidu.com/exp/w=500/sign=46c550d5f91f4134e037057e151e95c1/80cb39dbb6fd526630cdf122af18972bd4073626.jpg)
定远建设局网站/关键词优化排名的步骤
浏览器记住密码,怎么查看密码是什么? 听语音| 浏览:7891 | 更新:2015-01-28 14:26 | 标签:浏览器 1234567分步阅读现在浏览器都有一种功能叫记住密码,其实这样很不安全。 你眼睛看的那几个‘******’并没有…...
![](https://images2015.cnblogs.com/blog/806469/201603/806469-20160323110312683-217203123.png)
如何做增加网站留存的营销活动/seo策略主要包括
小时候对这个东西很好奇,不知道什么原理.一直觉得很好玩.现在研究了下,总结如下 软件的操作步骤很讲究,稍微不慎,则就需要重新来过 知识点: 1,掌握诺顿ghost分区为gh文件 2,学会清理至一个干净的系统 3,学会部署ghost服务器 一 通过网络批量部署系统 工具:mouse-dos https:…...
![](https://img-blog.csdnimg.cn/c6f0e71443b841b89cfb8f3e81fb3bc3.png?x-oss-process=image/watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAcXFfMzc1OTEzMTU=,size_18,color_FFFFFF,t_70,g_se,x_16)
wordpress wp config/百度平台我的订单
参考资料:OpenDDS环境搭建-Windows 10_Saint_EK的博客-CSDN博客_opendds环境搭建由于项目中需要使用到OpenDDS,故记录下环境搭建过程。安装环境windows 10 64位已安装 Visual Stdio 2017、Visual Stdio 2019安装步骤总述:需安装Perl、ACETAO、…...
![](https://img-blog.csdnimg.cn/febdaf753bf2409eadc33ae3c330137e.png)
在网上做贸易哪个网站好/东莞关键词seo优化
环境: Win10 专业版 KONICA MINOLTA 287SeriesPCL 问题描述: 一楼电脑可以打印文件,二楼电脑访问不了打印机 两楼网段之间可以互访,在一楼可以ping通打印机,二楼电脑访问不了打印机 解决方案: 1.检查…...
![](/images/no-images.jpg)
百度云服务器一年多少钱/营销网站seo推广
SQLite数据库的体系结构(翻译自sqlite.org) 1 简介 本文档描述了SQLite库的体系结构,这些信息对那些想理解和修改SQLite的内部工作机制的人是有用的。 本文档描述SQLite 3.0版本,2.8版或更早期的版本与此相似,只是细节上有所不同。…...
![](https://img-blog.csdnimg.cn/20190707215402789.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2N4dTEyMzMyMQ==,size_16,color_FFFFFF,t_70)
管家婆软件多少钱一年/沙坪坝区优化关键词软件
配置IIS Express以便通过IP地址访问调试的网站 2017年02月23日 12:32:44 moonflight 阅读数:1257 问题背景 最近使用C#编写了一个WebService,希望通过Java进行调用。 使用Visual Studio 2013调试WebService时,可以在浏览器中通过localhost…...