当前位置: 首页 > news >正文

提升搜索体验!—— 推出 Elastic Rerank 模型(技术预览版)

作者:来自 Elastic Shubha Anjur Tupil

几分钟内即可开始使用 Elastic Rerank 模型:强大的语义搜索功能,无需重新索引,提供灵活性和成本控制;高相关性、顶级性能和文本搜索效率。

使用我们全新的先进跨编码器 Elastic Rerank 模型(技术预览版),将你的搜索体验提升至 11 级。重新排名模型可为任何搜索体验提供语义提升,而无需你更改数据架构,让你有空间在自己的时间和预算范围内探索其他语义相关性工具。

语义提升你的关键字搜索:无论你的数据今天存储、索引或搜索的位置或方式如何,语义重新排名都是一个简单的附加步骤,可让你通过语义理解提升现有的搜索结果。你可以根据需要灵活地应用此功能 - 无需更改现有数据或索引管道,并且你可以使用 Elastic 基础模型作为你的首选。

适合任何预算的选择灵活性:所有搜索体验都可以通过添加语义含义来改善,这通常通过使用密集或稀疏向量模型(例如 ELSER)来应用。但是,实现相关性目标并不需要一刀切的解决方案,而是需要混合搭配工具来平衡性能和成本。混合搜索就是这样一种选择,它通过使用 Elasticsearch 中的倒数排名融合 (reciprocal rank fusion - RRF) 将语义搜索与关键字搜索相结合来提高相关性。Elastic Rerank 模型现在是代替语义搜索增强搜索相关性的额外杠杆,让你可以灵活地优化相关性和预算。

我们最初在 serverless 上提供,但现在在 Elasticsearch 8.17 的技术预览版中可用,我们的模型的优势超过了当今市场上的其他模型。

高性能和高效:Elastic Rerank 模型优于其他明显更大的重新排名模型。它基于 DeBERTa v3 架构构建,并通过对多样化数据集的提炼进行了微调。我们的详细测试表明,在广泛的检索任务上提升了 40%,在问答数据集上提升了高达 90%。

相比之下,Elastic Rerank 模型在相关性方面明显更胜一筹,甚至与更大的模型相当。在我们的测试中,一些模型(例如 bge-re-ranker-v2-gemma)在相关性方面最接近,但在参数数量方面则大一个数量级。话虽如此,我们在 Open Inference API 中提供了集成,以便访问其他第三方重新排序程序,因此你可以轻松测试并亲自查看。

易于使用

Elastic Rerank 模型不仅具有出色的性能和成本特性,我们还使其非常易于使用,以提高词汇搜索的相关性。我们希望提供易于使用的原语,帮助你快速构建有效的搜索,而无需做出大量决策;从使用哪种模型到如何在搜索管道中使用它们。我们让它易于上手和扩展。

你现在可以将 Inference API 与 text_similiarity_reranker 检索器结合使用 Elastic Rerank。下载并部署后,每个搜索请求都可以处理完整的混合搜索查询,并在一个简单的 _search 查询中对结果集进行重新排序。

PUT _inference/rerank/elastic-rerank
{"service": "elasticsearch","service_settings": {"model_id": ".rerank-v1","num_allocations": 1,"num_threads": 1}
}

将 Elastic Rerank 模型集成到你的代码中非常容易,可以组合不同的检索器以将混合搜索与重新排名相结合。以下是使用 ELSER 进行语义搜索、使用 RRF 进行混合搜索并使用重新排名器对结果进行排名的示例。

GET retrievers_example/_search
{"retriever": {"text_similarity_reranker": {"retriever": {"rrf": {"retrievers": [{"standard": {"query": {"sparse_vector": {"field": "vector.tokens","inference_id": ".elser-2-elasticsearch","query": "Cobrai Kai was a homage to the greatest movie of all time!"}}}},{"knn": {"field": "vector","query_vector": [0.23,0.67,0.89],"k": 3,"num_candidates": 5}}],"rank_window_size": 10,"rank_constant": 1}},"field": "text","inference_id": "elastic-rerank","inference_text": "Which show continues the awesomeness of Karate Kid, the 1984 movie?"}},"_source": ["text", "topic"]
}

如果你拥有像我这样的有趣数据集,将对人工智能的热爱与 Cobrai Kai 结合起来,你将获得一些有意义的东西。

总结

  • 仅限英语的跨编码器模型
  • 语义提升你的关键字搜索,几乎不改变数据的索引和搜索方式
  • 对与索引和搜索分离的语义提升成本有更大的控制和灵活性
  • 重复使用你已经在 Elasticsearch 中拥有的数据
  • 显著提高相关性和性能(与明显更大的模型相比,在大量检索任务中平均提高 40%,在问答任务中提高高达 90%,使用超过 21 个数据集进行测试,平均 nDCG@10 提高 +13 分)
  • 易于使用,开箱即用;内置于 Elastic Inference API,易于加载和用于搜索管道
  • 在我们的产品套件中提供技术预览,最简单的入门方式是使用 Elasticsearch Serverless

如果你想阅读我们如何构建它的所有细节,请访问我们的 Search Labs 博客。

Elasticsearch 包含许多新功能,可帮助你为你的用例构建最佳搜索解决方案。深入了解我们的示例笔记本以了解更多信息,开始免费云试用,或立即在本地机器上试用 Elastic。

更多阅读:介绍 Elastic Rerank:Elastic 的新语义重新排序模型

原文:cRank it up! - Introducing the Elastic Rerank model (in Technical Preview) - Elasticsearch Labs

相关文章:

提升搜索体验!—— 推出 Elastic Rerank 模型(技术预览版)

作者:来自 Elastic Shubha Anjur Tupil 几分钟内即可开始使用 Elastic Rerank 模型:强大的语义搜索功能,无需重新索引,提供灵活性和成本控制;高相关性、顶级性能和文本搜索效率。 使用我们全新的先进跨编码器 Elastic …...

【51单片机】程序实验1112.外部中断-定时器中断

主要参考学习资料:B站【普中官方】51单片机手把手教学视频 前置知识:C语言 单片机套装:普中STC51单片机开发板A4标准版套餐7 码字不易,求点赞收藏加关注(•ω•̥) 有问题欢迎评论区讨论~ 目录 程序实验11&12.外部中断-定时器…...

webrtc-java:引领Java进入实时通信新时代

webrtc-java:引领Java进入实时通信新时代 项目地址:https://gitcode.com/gh_mirrors/we/webrtc-java 在现代互联网应用中,实时通信(Real-Time Communication, RTC)已成为连接人们的桥梁。而说起RTC技术的先锋,不得不…...

TongWeb7-东方通快速使用手册

TongWeb7-东方通 快速使用手册 文章目录 第1章 TongWeb7 产品介绍 1.1 概述1.2 规范支持 第2章 TongWeb7 安装 2.1 TongWeb7 安装要求 2.1.1 TongWeb7 支持的操作系统2.1.2 系统要求2.1.3 其他 2.2 安装TongWeb72.3TongWeb7 目录结构说明2.4 TongWeb7 的启动和停止 第3章 应用…...

JVM内存区块

大家好,经过前两篇文章的介绍,大家对数组也有了一定了解,其实所有的数组都是对象,我们在方法中引用数组的变量叫做引用变量(简称引用),那么数组到底是存放在哪里的呢,为什么引用再出…...

C语言单元总结

黑色加粗表示刷题刷到这样的题 红色加粗表示可能重要 单元一 程序设计宏观认识 C语言程序框架 C语言程序最基本的程序框架由两部分构成,分别是 1) 编译预处理 2) 函数组 C语言程序构成 C程序最大的特点就是所有的程序都是用函数来装配的,函数是构成…...

通过PS和Unity制作2D动画之一:创建形象

1、通过路径画出轮廓 使用路径的过程中,需要注意: 1)如果使用形状工具作图,比如使用椭圆工具画正圆形,需要设置其属性为“路径”。 2)使用路径选择工具,再按住Alt键点击某个路径,可…...

Notable是一款优秀开源免费的Markdown编辑器

一、Notable简介 ‌ Notable‌是一款开源的跨平台Markdown编辑器,支持Linux、MacOS、Windows以及国产操作系统等多种主流操作系统。它以其高颜值和强大的功能,成为了许多用户的首选工具。 主要特性 实时预览‌: Notable提供了实时预览功能&…...

基于MFC绘制门电路

MFC绘制门电路 1. 设计内容、方法与难点 本课题设计的内容包括了基本门电路中与门和非门的绘制、选中以及它们之间的连接。具体采用的方法是在OnDraw函数里面进行绘制,并设计元器件基类,派生出与门和非门,并组合了一个引脚类,在…...

C—指针初阶(2)

如果看完阁下满意的话,能否一键三连呢,我的动力就是大家的支持与肯定,冲! 二级指针 我们先看概念以及作用:用来存放一级指针的地址的指针 先看例子,我们逐一分析 我们先分析上面那个“1” 标注那里&#x…...

Linux 基础环境的开发工具以及使用(下)

1. make / Makefile 自动化构建的工具 1)引入 在我们进行一些大型的工程的时候,代码量是极其大,当我们代码在进行一系列的编译的时候,难免会出现一些错误,当我们对错误进行一系列的更改之后,难道我们需要…...

constexpr、const和 #define 的比较

constexpr、const 和 #define 的比较 一、定义常量 constexpr 定义:constexpr用于定义在编译期可求值的常量表达式。示例:constexpr int x 5;这里,x的值在编译期就确定为5。 const 定义:const表示变量在运行期间不能被修改&…...

期末复习-Hadoop综合复习

说明 以下内容仅供参考,提到不代表考到,请结合实际情况自己复习 目录 说明 一、题型及分值 二、综合案例题-部署Hadoop集群 或 部署Hadoop HA集群 案例 1:Hadoop 基础集群部署 案例 2:Hadoop HA 集群部署 案例 3&#xff…...

禁用SAP Hana错误密码锁定用户功能

背景 公司项目适配多种数据库其中包含SAP Hana,由于有同事的数据库连接工具保存了某个在用的数据库的旧密码,导致时不时会被锁用户。通过查询官方文档已解决,这里统一记录一下。 禁用密码锁定方法 以下按系统管理员和普通用户的解法分别列…...

Ubuntu 22.04加Windows AD域

说明:   Ubuntu 22.04系统通过realmd,sssd加入到 Active Directory 域,并为域用户配置sudo权限。同时为方便用户使用为Ubuntu系统安装wps与sogou中文输入法。 1. Ubuntu 22.04加入Windows AD域 1.1 首先配置网络,Ubuntu系统能…...

qt实现窗口的动态切换

先说一下整体思路。页面布局两个widget然后再将定时器和按钮关联起来。 定时器发出信号的时候,随着信号,不断地重新设置widget的宽度,实现窗口的动态切换。 具体操作如下: class QtWidgetsApplication4 : public QMainWindow {…...

第十七届山东省职业院校技能大赛 中职组“网络安全”赛项资源任务书样题②

第十七届山东省职业院校技能大赛 中职组“网络安全”赛项资源任务书样题② 模块A 基础设施设置与安全加固(200分)A-1 登录安全加固(Windows, Linux)A-2 Nginx安全策略(Linux)A-3日志监控(Windows)A-4中间件…...

【Vulkan入门】09-CreateFrameBuffer

目录 先叨叨git信息关键代码VulkanEnv::FindHostVisitbaleMemoryTypeIndex()TestPipeLine::CreateFramebuffers() 与网上大多数文章不同,其他文章基本上都使用窗口框架(X11、GLFW、WSL等)提供的surface来显示Vulkan渲染出的图像。我认为那样会…...

FPGA设计-Vivado的Off-Chip Termination设置问题

目录 简介: 设置规则: output strength(输出驱动器的电流驱动能力) slew rate(输出电压压摆率) Pull type(上下拉类型) On-chip termination(输入端/输出端的内置片上端接电阻) 输出端接电阻配置 简介: 经常遇到在FPGA设计时,很多人很迷惑这些关于硬件的终…...

GC常见垃圾回收算法,JVM分代模型

如何判断是垃圾?引用计数器和Root可达性算法 如何进行清除?标记清除、复制、标记整理 堆分代模型?Eden,Surevivor,Tenuring 一个对象从创建到消亡的过程? 对象什么时候进入老年代? 一、GC&a…...

面试题整理(三)

芯冰乐知识星球入口:...

可视化建模以及UML期末复习----做题篇

一、单项选择题。(20小题,每小题2分,共40分) 1、UML图不包括( ) A、用例图 B、状态机图 C、流程图 D、类图 E、通信图 答案:C、流程图 UML中不包括传统意义上的流程图,流程图通常是指B…...

PostGIS分区表学习相关

在Postgresql中对空间数据进行表分区的实践_postgresql空间数据-CSDN博客文章浏览阅读1.4k次,点赞26次,收藏21次。Postgresql的分区功能允许将一个大表按照特定的规则拆分成多个小的分区表。这样做的好处在于,在查询数据时,可以只…...

JavaEE 【知识改变命运】03 多线程(3)

文章目录 多线程带来的风险-线程安全线程不安全的举例分析产出线程安全的原因:1.线程是抢占式的2. 多线程修改同一个变量(程序的要求)3. 原子性4. 内存可见性5. 指令重排序 总结线程安全问题产生的原因解决线程安全问题1. synchronized关键字…...

Flash操作 原子写 非原子写

原子和非原子操作 读、修改、写操作 对一个变量 A 1或上0x01,C语言写法: A 1| 0x01; 通过编译转成汇编后: LOAD R1,[#A 1] ; Read a value from A 1 into R1 MOVE R2,#0x01 ; Move the absolute constant 1 into R2 OR R1,R2 ; Bitwise O…...

厦门凯酷全科技有限公司怎么样?

随着短视频和直播带货的兴起,抖音电商平台迅速崛起,成为众多品牌和商家争夺的新战场。在这个竞争激烈的市场中,如何抓住机遇、实现销售增长,成为了每个企业面临的挑战。厦门凯酷全科技有限公司(以下简称“凯酷全”&…...

ubuntu 18.04设置命令行历史记录并同时显示执行命令的时间

以下相关详细信息请参考ubuntu官网。 在Ubuntu 18.04中,查看特定用户(例如用户broko)的命令行历史记录,并同时显示执行命令的时间,可以通过修改用户的shell配置文件来实现: • 设置HISTTIMEFORMAT环境变量…...

推荐系统里面的多任务学习概述

1. 概述 多任务学习(multi-task learning),本质上是希望使用一个模型完成多个任务的建模,在推荐系统中,多任务学习一般即指多目标学习(multi-label learning),不同目标输入相同的fe…...

解决uview ui赋值后表单无法通过验证

微信小程序中 主要还是文档有这样一段话://如果需要兼容微信小程序,并且校验规则中含有方法等,只能通过setRules方法设置规则。 添加即可通过 onReady() {//如果需要兼容微信小程序,并且校验规则中含有方法等,只能通过…...

【GL010】C/C++总结(二)

C部分 1. C中类成员的访问权限 无论成员被声明为 public、protected 还是 private,都是可以互相访问的,没有访问权限的限制。在类的外部 (定义类的代码之外),只能通过对象访问成员,并且通过对象只能访问 p…...

路得威网站谁做的/西安seo培训

导读假如在你正看着屏幕上的某些重要的事情时,你不想让你的小猫或者小狗在你的键盘上行走,或者让你的孩子在键盘上瞎搞一气,那我建议你试试 xtrlock 这个工具。假如在你正看着屏幕上的某些重要的事情时,你不想让你的小猫或者小狗在…...

wordpress分菜单/职业技能培训有哪些

这个帖子里的方法有点过时了,不推荐继续使用。有的时候会碰到这么一种情况,带着电脑和手机出去蹭网,无奈只有一个账号,手机上了电脑就没得用了,电脑用了手机就上不了网。如果能用电脑连接 Wifi 然后再开热点给手机用该…...

网站建设管理与政府/百度竞价怎么开户

文章目录1. 自定义登录页面2. 关闭csrf token参考相关文章: Spring Security默认登录页面原理 spring security 自定义登录页面 1. 自定义登录页面 核心是通过配置,覆盖原有默认的登陆页面: //不写这个注解配置不生效 Configuration publi…...

woocommerce做零售网站/西地那非片多少钱一盒

官网地址&#xff1a;https://cn.vuejs.org/v2/guide/render-function.html slot的使用场景:如果要在定义好的组件内部&#xff0c;加上一段html或者文本&#xff0c;例如这样 <my-button> <p>Hello world</p> </my-button> ,这种时候&#xff0c…...

国内有名的网站设计公司/关键词的优化方案

l首先我们要明确&#xff0c;在arcgis中注记 ≠ 标注 l注记可以理解为你在一个点附近写上这个点是干什么的&#xff0c;而标注则是按照你属性表里的某个字段来进行标注 ​ l注记可以移动&#xff0c;标注则不能&#xff0c;所以问题就来了&#xff0c;我们该如何移动标注呢&a…...

php 手机网站cms系统/网络营销与网站推广的区别

IOS push消息的数字不减少的问题&#xff0c;在做这个问题的时候。发现设置数字为0不能用&#xff0c;这时这个设置为0是写在应用程序加载的函数里面。只有双击Home键出现减号的时候删掉运行才会数字清零。 因此我把这个清零的数字写在 - (void)applicationDidEnterBackground:…...