Salesforce 发布开源大模型 xGen-MM
xGen-MM 论文
在当今 AI 技术飞速发展的时代,一个新的多模态 AI 模型悄然崛起,引起了业界的广泛关注。这个由 Salesforce 推出的开源模型—— xGen-MM,正以其惊人的全能特性和独特优势,在 AI 领域掀起一阵旋风。那么,xGen-MM 究竟强在哪里?让我们接着往下看。
xGen-MM
xGen-MM
xGen-MM 的主要功能有:
多模态理解: xGen-MM 能同时处理和理解图像和文本信息,支持回答关于视觉内容的问题。
大规模数据学习:通过大量多样化的数据训练,xGen-MM 能捕捉到丰富的视觉和语言模式。
高性能生成: xGen-MM 不仅能理解输入信息,还能生成文本,比如根据─张图片编写描述或回答。
开源可访问: xGen-MM 的模型、数据集和代码是开源的,研究人员和开发者可以自由地访问和使用这些资源来构建自己的应用。
微调能力:用户可以根据自己的特定需求对 xGen-MM 进行微调,适应不同的应用场景。
性能参数
官方论文性能参数图
xGen-MM 拥有令人瞠目结舌的40亿参数,这个庞大的数字背后蕴藏着强大的学习和推理能力。在众多基准测试中,xGen-MM 展现出了惊人的表现。特别是在视觉问答和 OCR 任务中,它的成绩更是傲视群雄。在 TextVQA 任务中,xGen-MM 在 8-shot 评估中取得了66.9的高分,而在 COCO 字幕任务中更是斩获了90.6的优异成绩。
xGen-MM 还采用了动态高分辨率图像编码策略,这使得它能够高效处理不同分辨率的图像,同时保持较低的计算需求。这就像一位技艺精湛的摄影师,能够在保持画质的同时巧妙地压缩文件大小。这种策略大大提升了模型的可扩展性和效率,为其在大规模应用中奠定了坚实基础。
xGen-MM 还 underwent 安全性微调,这进一步增强了模型的可靠性。通过减少幻觉等有害行为,xGen-MM 在保持高精度的同时,更加安全可靠。
技术原理
技术原理
xGen-MM 的强大并非偶然,而是源于其独特的技术创新。它采用了Perceiver架构来高效处理图像数据,能够快速准确地捕捉图像中的关键信息。xGen-MM 还巧妙地结合了大型语言模型(如Phi-3),这使得它在处理文本信息时如鱼得水。
xGen-MM 的训练过程也采用了统一的多模态学习目标,通过单一的自回归损失函数来训练模型。这种方法大大简化了训练过程,同时也提高了模型的性能;而且 xGen-MM 还在大规模多样化的数据集上进行训练,这让它拥有了丰富的知识储备和强大的泛化能力;最后,通过后续优化方法(如DPO),xGen-MM不断提升自身的安全性和可靠性。
相关文章:
![](https://img-blog.csdnimg.cn/img_convert/5b0541a0a8fedf23700c35d8be642e53.jpeg)
Salesforce 发布开源大模型 xGen-MM
xGen-MM 论文 在当今 AI 技术飞速发展的时代,一个新的多模态 AI 模型悄然崛起,引起了业界的广泛关注。这个由 Salesforce 推出的开源模型—— xGen-MM,正以其惊人的全能特性和独特优势,在 AI 领域掀起一阵旋风。那么,x…...
![](https://i-blog.csdnimg.cn/direct/1bbea44c4209425ab0a6319d6740c70e.png)
冒 泡 排 序
今天咱们单独拎出一小节来聊一聊冒泡排序昂 冒泡排序的核心思想就是:两两相邻的元素进行比较(理解思路诸君可看下图) 接下来我们上代码演示: 以上就是我们初步完成的冒泡排序,大家不难发现,不管数组中的元…...
![](https://img-blog.csdnimg.cn/direct/0eed9aa32af4480691ccf310f5a6aa0a.png)
采用先进的人工智能视觉分析技术,能够精确识别和分析,提供科学、精准的数据支持的智慧物流开源了。
智慧物流视频监控平台是一款功能强大且简单易用的实时算法视频监控系统。它的愿景是最底层打通各大芯片厂商相互间的壁垒,省去繁琐重复的适配流程,实现芯片、算法、应用的全流程组合,从而大大减少企业级应用约95%的开发成本可通过边缘计算技术…...
![](https://www.ngui.cc/images/no-images.jpg)
IAA游戏APP如何让合理地让用户观看更多广告,提高广告渗透率
广告变现已经成为休闲游戏开发者重要的收益方式之一,超50%国内休闲游戏已经采用广告变现的方式,游戏广告预算是游戏行业开发者广告变现的主要预算来源。 #深度好文计划#如何合理地提高广告渗透率? 广告渗透率能直接反映游戏中有广告行为用户…...
![](https://i-blog.csdnimg.cn/direct/9cb65d488f79436688b896e04f154fce.png)
环网交换机的特殊作用是什么?
环网交换机作为现代网络建设的重要组成部分,具有独特而特殊的作用。在信息技术迅猛发展的今天,各类数据传输和网络连接需求日益增加,环网交换机的出现为解决这些问题提供了理想的方案。环网交换机通常将多个网络节点通过环形结构连接起来&…...
![](https://www.ngui.cc/images/no-images.jpg)
mac电脑安装Zsh并启用
安装 Zsh 1. 安装 Zsh 新版mac系统会默认安装并使用zsh,如没用,需在终端中安装: brew install zsh2. 安装 Oh My Zsh 克隆Oh My Zsh到你的目录: git clone https://github.com/robbyrussell/oh-my-zsh.git ~/.oh-my-zsh3. 复…...
![](https://i-blog.csdnimg.cn/direct/9e718e3c03984b98b275facd488ae863.png)
【后续更新】python搜集上海二手房数据
源码如下: import asyncio import aiohttp from lxml import etree import logging import datetime import openpyxlwb = openpyxl.Workbook() sheet = wb.active sheet.append([房源, 房子信息, 所在区域, 单价, 关注人数和发布时间, 标签]) logging.basicConfig(level=log…...
![](https://img-blog.csdnimg.cn/img_convert/951becdba2d01ed558aa86ab8985a5f3.png)
创建GPTs,打造你的专属AI聊天机器人
在2023年11月的「OpenAI Devday」大会上,OpenAI再度带来了一系列令人瞩目的新功能,其中ChatGPT方面的突破尤为引人关注。而GPTs的亮相,不仅标志着个性化AI时代的到来,更为开发者和普通用户提供了前所未有的便利。接下来࿰…...
![](https://www.ngui.cc/images/no-images.jpg)
深度学习 vector 之模拟实现 vector (C++)
1. 基础框架 这里我们有三个私有变量,使用 _finish - _start 代表 _size,_end_of_storage - _start 代表 _capacity,并且使用到了模版,可以灵活定义存储不同类型的 vector,这里将代码量较小的函数直接定义在类的内部使…...
![](https://i-blog.csdnimg.cn/direct/dd6fab798fc6412ebe3ce01d2368919e.jpeg)
关于LLC知识10
在LLC谐振腔中能够变化的量 1、输入电压 2、Rac(负载) 所以增益曲线为红色(Rac无穷大)已经是工作的最大极限了,LLC不可能工作在红色曲线之外 负载越重时,增益曲线越往里面 假设: 输入电压…...
![](https://www.ngui.cc/images/no-images.jpg)
最长的严格递增或递减子数组
给你一个整数数组 nums 。 返回数组 nums 中 严格递增 或 严格递减 的最长非空子数组的长度。 示例 1: 输入:nums [1,4,3,3,2] 输出:2 解释: nums 中严格递增的子数组有[1]、[2]、[3]、[3]、[4] 以及 [1,4] 。 nums 中…...
![](https://i-blog.csdnimg.cn/direct/cbde6adfb3c9444bb1775c8bf97d3002.png)
【JavaEE】SpringBoot 统一功能处理:拦截器、统一数据返回与异常处理的综合应用与源码解析
目录 SpringBoot 统⼀功能处理拦截器拦截器快速⼊⻔拦截器详解拦截路径拦截器执⾏流程 登录校验定义拦截器注册配置拦截器 DispatcherServlet 源码分析(了解)初始化(了解) DispatcherServlet的初始化1. HttpServletBean.init()2. FrameworkServlet.initServletBean() WebApplic…...
![](https://i-blog.csdnimg.cn/direct/30881294c2674aa181501c377b02bdb4.jpeg)
I2C学习:上拉电阻选取
一.I2C简介 I2C总线是由Philips公司开发的一种简单、双向二线制同步串行总线。I2C总线在使用时,需要接上拉电阻,这是因为I2C接口是开漏输出,如图1所示。 图1 I2C开漏输出 I2C有5种速度模式:标准(100KHz&am…...
![](https://i-blog.csdnimg.cn/direct/0996022bd3ec4f86ba2b3ff5be6d16f9.png)
AC自动机-1
AC自动机(Aho-Corasick Automaton)是一种高效的多模式字符串匹配算法。它是由Alfred Aho和Margaret Corasick在1975年提出的。这种算法可以在一次扫描输入文本的情况下,同时查找多个模式串。 基本概念 Trie树 AC自动机是基于字典树数据结构构建的字典树…...
![](https://www.ngui.cc/images/no-images.jpg)
注解@Service@Component@Slf4j@Data
在Java中,这四个注解分别属于不同的用途和库,下面是它们各自的作用: Service: 这个注解通常用于Spring框架中,它用于标记服务层组件。在Spring中,服务层通常包含业务逻辑。当一个类被标记为Service…...
![](https://www.ngui.cc/images/no-images.jpg)
【Nodejs】六、express框架
目录 一、express 介绍 二、express 使用 2.1 express 下载 2.2 express 使用 三、express 路由 3.1 什么是路由 3.2 路由的使用 3.3 获取请求参数 3.4 获取路由参数 四、express 响应设置 五、express 中间件 5.1 什么是中间件 5.2 中间件的作用 5.3 中间件的类…...
![](https://csdnimg.cn/release/blog_editor_html/release2.3.6/ckeditor/plugins/CsdnLink/icons/icon-default.png?t=N7T8)
进阶 pro max
最近搞了许多有趣的东西,比如自制rtos,速成数模电,学了一点点的AD,看着视频弄了HAL库,以及定时器和串口中断配合实现接收任意长度(不超过缓冲值)数据,还有配置hal库的freertosfafts …...
![](https://img-blog.csdnimg.cn/img_convert/3f0505de6d47ec0589dd3c1c661ddb9b.gif)
Agentic Security:一款针对LLM模型的模糊测试与安全检测工具
关于Agentic Security Agentic Security是一款针对LLM模型的模糊测试与安全检测工具,该工具可以帮助广大研究人员针对任意LLM执行全面的安全分析与测试。 请注意 Agentic Security 是作为安全扫描工具设计的,而不是万无一失的解决方案。它无法保证完全防…...
![](https://www.ngui.cc/images/no-images.jpg)
Spring Cloud Config 与 Spring Cloud Bus 来实现动态配置文件
要使用 Spring Cloud Config 与 Spring Cloud Bus 来实现动态配置文件,你可以按照以下步骤操作: ### 步骤 1: 添加依赖 首先,确保你的项目中添加了 Spring Cloud Config 客户端和 Bus 的依赖。对于 Maven 项目,pom.xml 文件应该…...
![](https://www.ngui.cc/images/no-images.jpg)
Qt:Qt背景
目录 1.Qt解释 2.Windows下开发GUI的方案 3.框架 4.Qt历史 4.Qt支持的平台 5.Qt版本 6.Qt案例 1.Qt解释 前端开发,分为网页前端开发(Web)、桌面应用开发(Windows、Linux)、移动应用开发(Android)。Q…...
![](https://i-blog.csdnimg.cn/direct/4d91bacba58c44b28e5a760efd9edb1b.png)
【数据结构】选择排序
🍬个人主页:Yanni.— 🌈数据结构:Data Structure. 🎂C语言笔记:C Language Notes 🏀OJ题分享: Topic Sharing 目录 前言: 基本思想 直接选择排序 思路分…...
![](https://i-blog.csdnimg.cn/direct/0435f2ba201242519650d078b8f3d4fa.png)
国产GD32单片机开发入门(二)GD32单片机详解
文章目录 一.概要二.单片机型号命名规则三.GD32F103系统架构四.GD32F103C8T6单片机启动流程五.GD32F103C8T6单片机主要外设资源六.单片机开发过程中查看芯片数据手册的必要性1.单片机外设资源情况2.GD32单片机内部框图3.GD32单片机管脚图4.GD32单片机每个管脚功能5.单片机功耗数…...
![](https://i-blog.csdnimg.cn/direct/cb27d5c02b0d49de9f0cd030ee757a67.png)
8个我平时每天都会看的网站,涵盖办公、娱乐、学习等
分享8个我平时每天都会看的网站,涵盖办公、娱乐、学习等多种类别,试过就知道有多好用! 1、MyFreeMP3 tools.liumingye.cn/music/#/ 一个可以免费听歌的平台,不用充会员,里面收录了大多数的国内外知名流行歌手、乐队的…...
![](https://img-blog.csdnimg.cn/img_convert/6bf84b8a62300ed52d3cb55bdb65c094.png)
Vue2——父子之间间的调用
1、父组件给子组件传值使用props 父组件: <div><SonPage msg"通过props传递值---父>子" ></SonPage><h1>父组件</h1></div> 子组件 <div :style"{border: 1px solid red}"><h1>子组件…...
![](https://i-blog.csdnimg.cn/direct/c23ee896bb2f4d758de7e96fe78bed7c.png)
xfs Vs ext4?
xfs测试 ext4 测试 对比 XFS和EXT4都是Linux系统中广泛使用的文件系统,它们各有特点和优势,选择哪一个取决于你的具体需求和使用场景。下面是它们的主要特点: XFS: 由Silicon Graphics Inc.开发,最初用于SGI的IRIX系统。支持非…...
![](https://i-blog.csdnimg.cn/direct/be4dd662439e468f9d53f328fcaccb5f.png)
数据结构stack (笔记)
文章目录 1. 概念理解易混淆内容 2. 时间复杂度3. 实现方式4. 应用5. 内容出处 1. 概念理解 stack(中文名:堆栈、栈):虽然它叫堆栈,但是它其实指的是栈,跟堆没啥关系。 栈的特性:先进后出、后进先出(这个过程就…...
![](https://www.ngui.cc/images/no-images.jpg)
SQL - 创建 表和数据库
创建和删除数据库 create database if not exists sql_store2; //创建 drop database if exists sql_store2; //删除 -- 创建数据库 create database if not exists sql_store2; drop database if exists sql_store2; 创建表 create table customers (someting); -- 创建表 cre…...
![](https://i-blog.csdnimg.cn/direct/9fd26897915b4a4989c253d53de55909.png)
使用 Arch Linux 几个月有感 | 为什么我选择 Arch Linux ,Arch 的优缺点有什么 | 一些Linux发行版推荐
(终端是 Yakuake ,KDE 自带) 一点碎碎念,可以跳过不看 几年前从 CentOS 接触的 Linux ,试图搭建一个KMS服务器 但是失败了 ,后来装过 Ubuntu Debian deepin Kali Kubuntu Manjaro,踩一路坑最后…...
![](https://www.ngui.cc/images/no-images.jpg)
SQLserver中的增删改查和数据类型
SQLserver增删查改语句 SQL Server 是一种关系数据库管理系统,用于存储、管理和检索数据。以下是一些基本的 SQL 语句,用于在 SQL Server 中执行增删查改操作: 插入数据(Insert) 插入完整行: INSERT INTO …...
![](https://i-blog.csdnimg.cn/direct/4104534e90514d1bbeffefe6fd06741a.png)
个人收藏个性化、实用性、可玩性在线网站持续更新,与君共享
1.https://handraw.top/ 支持中文手绘效果的白板工具,比较怀旧复古风格 界面简单风 2.https://app.diagrams.net 流程图、UML图、网络图、组织结构图、思维导图等,比较专业 可导出图片 PDF HTLM等各种格式 3.https://www.processon.com 主要用于生成…...
![](https://img-blog.csdnimg.cn/img_convert/3f283286c691d954349ccd3a4595721f.png)
建立网站 域名 服务器吗/全球搜索大全
据相关数据统计,中国中小学生,每天课外写作业的时间长达2.82小时!是日本学生的3.7倍、韩国学生的4.8倍。尽管如此,80%的孩子在学习过程中,还都伴有歪歪斜斜、埋头苦干等不正确的姿势。那么,不正确的坐姿对孩…...
![](https://img-blog.csdnimg.cn/20181125175234658.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L0MyNjgxNTk1ODU4,size_16,color_FFFFFF,t_70)
济南网站建设百家号/优化大师最新版下载
文章目录一、实验设计1、滤波前的准备2、函数设计二、实验过程三、结果分析一、实验设计 实验前的准备:傅里叶变换及反变换 opencv示例解读。 1、滤波前的准备 进行傅里叶逆变换需要知道原复数的实部和虚部,但是傅里叶变换后的图像显示的是幅度谱&…...
![](/images/no-images.jpg)
深圳贷款网站建设/临沂google推广
最近项目需要在研究视频实时监控功能。 第一个需要了解的就是 H.264 格式,先以 H.264 文件为例进行数据分析。 在网上下载了 foreman.264 文件,进行了帧类型的分析和帧数据的分析。然后对比实际项目视频的需要,大概分析了一下数据传输的可能性…...
![](https://img-blog.csdnimg.cn/img_convert/5e9aabbf4535aee52434078a5469af03.png#pic_center)
企业外贸营销型网站/营销页面
文章目录2、 输入控件(一)2.1 纯键盘2.1.1 QLineEdit2.1.1.1 描述2.1.1.2 控件创建2.1.1.3 输出模式2.1.1.4 提示字符串2.1.1.5 清空按钮2.1.1.6 添加操作行为2.1.1.7 自动补全2.1.1.8 输入限制2.1.1.8.1 语法2.1.1.8.2 掩码验证2.1.1.9 案例:…...
![](https://img-blog.csdnimg.cn/20190107172500821.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2NhdG9vcA==,size_16,color_FFFFFF,t_70)
兰州市城市建设设计院官方网站/免费收录网站
oracle 11g2 之后出现分析函数 listagg 如下为一个案例: 另外Oracle还一直有一个WM_CONCAT函数,如下简述下其与listagg的区别: 1、WMSYS.WM_CONCAT:依赖WMSYS 用户,不同oracle环境时可能用不了,返回类型为…...
![](http://gw.alicdn.com/tfscom/tuitui/TB1LgAAKmzqK1RjSZFjXXblCFXa.png)
网站做博彩客服怎么样/邯郸seo优化公司
2019年5G已经开始了试商用,因此MWC 2019上5G手机成为业界关注焦点。当然,5G另一个重要的特性是可以拓展到手机之外更多的行业中,其中5G与汽车行业的结合就引人关注。MWC 2019期间,浙江吉利控股集团和高通与高新兴共同发布了吉利全…...