当前位置: 首页 > news >正文

[240629] 阿里云揭秘其数据中心设计和自研网络,用于大语言模型训练 | Jina AI 发布最新的神经网络重排序模型

目录

    • 阿里云揭秘其数据中心设计和自研网络,用于大语言模型训练
    • Jina AI 发布最新的神经网络重排序模型

阿里云揭秘其数据中心设计和自研网络,用于大语言模型训练

阿里云近日公布了其专为大型语言模型 (LLM) 训练流量而设计的基于以太网的网络设计,该网络已投入生产八个月。

技术成果:

  • 阿里云每个数据中心配备 15,000 个 GPU,每个主机包含 8 个 GPU 和 9 个网卡,以实现高带宽和避免单点故 障。
  • 阿里云选择以太网是为了避免供应商锁定,并利用“整个以太网联盟的力量实现更快的发展”。
  • 阿里云自研网络名为“高性能网络”(HPN),旨在解决传统路由方法在 LLM 训练中遇到的问题,例如哈希极化。
  • 阿里云偏爱单芯片交换机,因为它们比多芯片交换机更稳定。
  • 阿里云为其交换机创建了定制的均热板散热器,以解决过热问题。
  • 阿里云的数据中心设计为每个建筑容纳一个“Pod”,每个 Pod 包含 15,000 个 GPU。
  • 阿里云已经在设计下一代网络架构,以支持更高容量的单芯片交换机和更大的 LLM 训练集群。

行业影响:

  • 阿里云对以太网的偏好支持了 AMD、Broadcom、Cisco 等公司提出的反对 Nvidia 网络业务垄断的论点。
  • 阿里云的 HPN 设计和数据中心架构展示了其对 LLM 训练基础设施的重大投入。
  • 阿里云对单芯片交换机和定制散热解决方案的采用突出了其对性能、稳定性和成本效益的关注。

阿里云为支持 LLM 训练而做出的技术选择和设计决策,展示了其在人工智能 基础设施领域的雄心和实力。

来源:

https://www.theregister.com/2024/06/27/alibaba_network_datacenter_designs_revealed/

Jina AI 发布最新的神经网络重排序模型

Jina AI 发布了最新的神经网络重排序模型 Jina Reranker v2,该模型在速度、多语言支持和功能上都有显著提 升,尤其适用于检索增强生成(RAG)场景。

Jina Reranker v2 的主要优势:

  • 多语言支持: 支持超过 100 种语言的检索,超越了 bge-reranker-v2-m3 的性能。
  • 代理能力: 具备最先进的函数调用和文本到 SQL 转换能力,适用于代理 RAG 场景。
  • 代码检索: 在代码检索任务中表现出色。
  • 超快速度: 吞吐量比 bge-reranker-v2-m3 高 15 倍,比 jina-reranker-v1-base-en 高 6 倍。

Jina Reranker v2 的特性:

  • 创新需求:弥补嵌入模型在检索精度上的不足。
  • 多语言支持:在 MKQA、BEIR 和 AirBench 等基准测试中表现优异。
  • 应用场景:在结构化数据查询、函数调用和代码检索方面的应用。
  • 推理速度:模型尺寸更小、采用了 Flash Attention 2 技术。
  • 训练过程:分四个阶段进行,包括使用英语数据预训练、添加跨语言数据、微调等。

Jina Reranker v2 的应用方式:

  • 通过 Jina Reranker API:提供简单易用的接口,方便快速集成。
  • 通过 RAG/LLM 框架:与 Haystack、LlamaIndex 和 Langchain 等框架集成。
  • 通过 HuggingFace:提供预训练模型,方便研究和评估。
  • 通过私有云部署:即将在 AWS 和 Azure 平台上线。

Jina Reranker v2 是一个功能强大、性能卓越的重排序模型,可以显著提升 RAG 系统的精度和效率,适用于各种多语言、多模态的检索和生成任务。

来源:

https://jina.ai/news/jina-reranker-v2-for-agentic-rag-ultra-fast-multilingual-function-calling-and-code-search

更多内容请查阅 : blog-240629


关注微信官方公众号 : oh my x

获取开源软件和 x-cmd 最新用法

相关文章:

[240629] 阿里云揭秘其数据中心设计和自研网络,用于大语言模型训练 | Jina AI 发布最新的神经网络重排序模型

目录 阿里云揭秘其数据中心设计和自研网络,用于大语言模型训练Jina AI 发布最新的神经网络重排序模型 阿里云揭秘其数据中心设计和自研网络,用于大语言模型训练 阿里云近日公布了其专为大型语言模型 (LLM) 训练流量而设计的基于以太网的网络设计&#x…...

【Docker0】网络更改

目录 1. 停止docker服务 2. 关闭docker默认桥接网络接口 3. 从系统删除docker0接口 4. 创建一个名为bridge0的新接口 5. 添加ip地址和子网掩码 6. 启用bridge0接口 7. (如果没起来就执行该句) 8. 查看ip 1. 停止docker服务 sudo service docker…...

IDEA中导入Maven项目

IDEA中导入Maven项目 方式1:使用Maven面板,快速导入项目 打开IDEA,选择右侧Maven面板,点击 号,选中对应项目的pom.xml文件,双击即可 说明:如果没有Maven面板,选择 View > Appe…...

px、em、rem、rpx 作用和用法详解

px px像素(Pixel)。相对长度单位。像素px是相对于显示器屏幕分辨率而言的。 PX特点 IE无法调整那些使用px作为单位的字体大小; 国外的大部分网站能够调整的原因在于其使用了em或rem作为字体单位; Firefox能够调整px和em&#xff…...

Linux 常用命令 - dd 【复制及转换文件内容】

简介 dd 命令源自于磁盘复制(disk dump)的缩写,是 Linux 和 Unix 系统中用于转换和复制文件的一个强大工具。它可以在复制过程中进行格式转换,支持不同的块大小,能够直接对硬盘设备进行操作,非常适合进行备…...

全网唯一免费无水印AI视频工具!

最近Morph Studio开始免费公测!支持高清画质,可以上传语音,同步口型,最重要的是生成的视频没有水印! Morph Studio国内就可以访问,可以使用国内邮箱注册(我用的163邮箱),…...

kafka(四)消息类型

一、同步消息 1、生产者 同步发送的意思就是,一条消息发送之后,会阻塞当前线程,直至返回 ack。 由于 send 方法返回的是一个 Future 对象,根据 Futrue 对象的特点,我们也可以实现同 步发送的效果,只需在调…...

Emacs之显示blame插件:blamer、git-messenger(一百四十四)

简介: CSDN博客专家,专注Android/Linux系统,分享多mic语音方案、音视频、编解码等技术,与大家一起成长! 优质专栏:Audio工程师进阶系列【原创干货持续更新中……】🚀 优质专栏:多媒…...

【10分钟速通webpack,全流程打包,编译,发包,全干货,附代码 】

需求 后端有个nodejs 基础库,用typescript编写,需要发包到代码仓库上,被其它业务引入。这其中就涉及了: 编译, 打包,发包。 工作流速览 前提依赖 webpack主体 npm install --save-dev webpack webpack…...

设计模式深入解析与实例应用

目录 工厂模式1.简单工厂模式2.工厂方法模式3.抽象工厂模式 策略模式责任链模式概述模板方法模式概述单例模式概述 工厂模式 工厂模式是一种创建型设计模式,它提供了一种创建对象的最佳实践,旨在将对象的创建过程与使用过程分离,以提高代码的…...

服务器数据恢复—异常断电导致RAID6阵列中磁盘出现坏扇区的数据恢复案例

服务器存储数据恢复环境: 一台存储中有一组由12块SAS硬盘组建的RAID6磁盘阵列,划分为一个卷,分配给几台Vmware ESXI主机做共享存储。该卷中存放了大量Windows虚拟机,这些虚拟机系统盘是统一大小,数据盘大小不确定&…...

前端工程化08-新的包管理工具pnpm

1、历史原因解读 pnpm这个东西发布的时间是比较早的,但是在最近一两年的时候才开始流行,甚至是可以说非常的盛行,那么这个包到底是个什么东西的,那么我们先说下,原来的包管理工具到底有那些问题?比如说我们…...

章十九、JavaVUE —— 框架、指令、声明周期、Vue-cli、组件路由、Element

目录 一、 框架 ● vue.js 框架 ● 特点 ● Vue 安装 二、 第一个vue程序 ● 创建项目 ​编辑 ● 导入 vue.js ● 创建vue对象,设置属性,使用模版渲染到页面 介绍 — Vue.js (vuejs.org) 三、 vue指令 ● v-text ● v-html ● v-…...

正则表达式阅读理解

这段正则表达式可以匹配什么呢? 超级复杂的一段正则表达式。 ((max|min)\\s*\\([^\\)]*(,[^\\)]*)*\\)|[a-zA-Z][a-zA-Z0-9]*(_[a-zA-Z][a-zA-Z0-9]*)?(\\*||%)?|[0-9](\\.[0-9])?|\\([^\\)]*(,[^\\)]*)*\\))(\\s*[-*/%]\\s*([a-zA-Z][a-zA-Z0-9]*(_[a-zA-Z][…...

Apache Calcite Linq4j学习

Lin4j简介 Linq4j是Apache Calcite项目中的一个模块,它提供了类似于LINQ(Language-Integrated Query)的功能,用于在Java中进行数据查询和操作。Linq4j可以将逻辑查询转换为物理查询,支持对集合进行筛选、映射、分组等…...

FPGA SATA高速存储设计

今天来讲一篇如何在fpga上实现sata ip,然后利用sata ip实现读写sata 盘的目的,如果需要再速度和容量上增加,那么仅仅需要增加sata ip个数就能够实现增加sata盘,如果仅仅实现data的读写整体来说sata ip设计比较简单,下面…...

MySQL----为什么选择使用MySQL

在我们日常做项目的过程中,不论是个人还是企业,大多数会选择使用MySQL数据库作为后端数据库存储,它到底有什么优势,能够做到如此广为流传呢? 优点 稳定性:MySQL具有良好的稳定性和可靠性,能够保…...

01.音视频小白系统入门(新专栏)

目录 一、基础知识 二、音频 三、视频 四、流媒体服务器 五、收获 音视频技术在远程办公、在线教育、远程医疗等领域的应用广泛。 学习音视频技术有助于提升职业竞争力,满足市场需求。 掌握音视频基础知识对未来发展至关重要,基础不牢会导致后续学习…...

C++:enum枚举共用体union

enum枚举 C继承C的枚举用法 (1)典型枚举类型定义,枚举变量定义和使用 (2)枚举类型中的枚举值常量不能和其他外部常量名称冲突: 举例1宏定义,举例2另一个枚举 // 定义一个名为Color的枚举类型 enum Color {RED, // 红色,默认值…...

动手学深度学习(Pytorch版)代码实践 -计算机视觉-47转置卷积

47转置卷积 import torch from torch import nn from d2l import torch as d2l# 输入矩阵X和卷积核矩阵K实现基本的转置卷积运算 def trans_conv(X, K):h, w K.shapeY torch.zeros((X.shape[0] h - 1, X.shape[1] w - 1))for i in range(X.shape[0]):for j in range(X.shap…...

LinkedIn被封原因和解封方法

对于初识领英和对领英生态规则不熟悉的人来说,很容易造成领英账号被封号(被限制登录)的情况,那么如何才能避免和解决领英帐号被封号(被限制登录)的难题呢? 领英帐号被封号或被限制登录主要会有两类情况。 首先要搞清楚, Linkedi…...

redis sentinel 部署

安装Redis 建议版本不要太低 > 6.2,我这里是redis 7.2.5 curl -fsSL https://packages.redis.io/gpg | sudo gpg --dearmor -o /usr/share/keyrings/redis-archive-keyring.gpg echo "deb [signed-by/usr/share/keyrings/redis-archive-keyring.gpg] http…...

spring boot (shiro)+ websocket测试连接不上的简单检测处理

1、用前端连接测试的demo一切正常,但是到了项目中连接不上了 一开始以为是地址错,但是换了apifox测试也是不可以。 2、考虑是shiro进行了拦截了,所以就访问不到了地址,那么就放行。 3、再次用apifox测试,成功了。 当然…...

Jenkins - Python 虚拟环境

Jenkins - Python 虚拟环境 引言Python 虚拟环境创建 Python 虚拟环境安装 virtualenv(可选)创建虚拟环境激活虚拟环境安装依赖包退出虚拟环境(可选)注意 Python 虚拟环境实践 引言 Automation 脚本通常会部署到 Jenkins 上运行&…...

每日一道算法题 面试题 08.08. 有重复字符串的排列组合

题目 面试题 08.08. 有重复字符串的排列组合 - 力扣(LeetCode) Python class Solution:def permutation(self, S: str) -> List[str]:# 以索引记录字符是否用过lelen(S)idx[_ for _ in range(le) ]# 组合得到的字符串combine[]*leans[]# 递归def fu…...

Apache Kylin资源管理全指南:优化你的大数据架构

标题:Apache Kylin资源管理全指南:优化你的大数据架构 摘要 Apache Kylin是一个开源的分布式分析引擎,旨在为大规模数据集提供高性能的SQL查询能力。在Kylin中进行有效的资源管理对于确保查询性能和系统稳定性至关重要。本文将详细介绍如何…...

计算机网络微课堂(湖科大教书匠)TCP部分

计算机网络微课堂(湖科大教书匠)TCP部分 【计算机网络微课堂(有字幕无背景音乐版)】 TCP的流量控制 一般来说,我们希望数据传输得更快一些。但如果发送方把数据发送得过快,接收方就可能来不及接收&#…...

C++ 字符串介绍

在C编程中,字符串是非常重要的数据类型之一。字符串用于表示文本信息,处理字符串是许多程序的基本需求。C提供了多种方式来处理字符串,包括C风格的字符串(C-strings)和C标准库中的std::string类。本文将介绍这两种字符…...

[Cloud Networking] BGP

1. AS (Autonomous System) 由于互联网规模庞大,所以网络会被分为许多 自治系统(AS-Autonomous system)。 所属类型ASN名称IPv4 数量IPv6数量运营商ISPAS3356LEVEL3 - Level 3 Parent, LLC, US29,798,83273,301,954,048互联网企业AS15169GO…...

Typora failed to export as pdf. undefined

变换版本并没有用,调整图片大小没有用 我看到一个博客后尝试出方案 我的方法 解决:从上图中的A4,变为其他,然后变回A4 然后到处成功,Amazing! 参考: Typora 导出PDF 报错 failed to export…...

java做网站怎么验证登录/营销培训课程视频

原题链接:1022 Digital Library (30分) 题目大意: 一本书,只有一位作者,包含的关键词不超过 5 个。 总共不超过 1000 个不同的关键词,不超过 1000 个不同的出版商。 图书信息介绍完毕后,有一行包含一个整…...

用易语言做钓鱼网站/nba最新消息

华三F1020防火墙作为LNS设备连接用户内网和互联网&#xff0c;用户通过手机APN拨号连接运营商LAC设备&#xff0c;LAC与LNS建立隧道进行认证&#xff0c;从而让用户可以通过手机访问内网资源。<H3C>display cu#version 7.1.064, Release 9313P07#sysname H3C#context Adm…...

大连开发区商场/seo研究中心

信息技术和计算机技术的区别&#xff1a;信息技术范围比计算机技术大&#xff0c;信息技术包括传感技术、计算机技术和通信技术。而计算机技术只包括计算机系统技术、计算机器件技术、计算机部件技术和计算机组装技术等四个方面。信息技术所指内容、信息广而多&#xff0c;计算…...

wordpress 显示文章日期的方法/主流网站关键词排名

编者按&#xff1a;本文作者Clement Vouillon供职于欧洲天使投资机构Point Nine Capital&#xff0c;负责市场相关的工作&#xff0c;此前也曾参与创立2家SaaS公司。拓扑社此前曾编译Clement Vouillon关于2016年SaaS领域趋势的观点&#xff0c;见《投资人解读2016年SaaS领域的7…...

兰州网站制作公司在哪里/定制开发公司

1、磁盘的格式化1.1、查看当前文件目录使用 df -h 命令来查看当前已经挂载的磁盘以及磁盘的信息&#xff1a;root:~>df -h 文件系统 容量 已用 可用 已用% 挂载点 /dev/sda3 259G 229G 30G 89% / devtmpfs 32G 0 32G 0% /dev tmpfs 32G 16M 32G 1% /dev/shm tmpfs 32G 3.2G …...

在线网站建设者/近期发生的重大新闻

查看原文&#xff1a;http://www.sijitao.net/1860.html PostgreSQL数据库流复制主库和备库之间的延迟时间是多少&#xff0c;无论对HA还是负载均衡来说都应该做个评估。比如单纯的HA架构&#xff0c;当主库发生故障时&#xff0c;我们允许多少时间内的数据丢失。不废话&#x…...