大模型日报2024-06-05
大模型日报
2024-06-05
大模型资讯
- AI气象预测取得重大进展:单台桌面电脑即可运行全球天气模型
- 摘要: 一项新的人工智能天气预测模型已经取得重大进展,该模型能够在一台普通的桌面电脑上运行,预测全球天气。这意味着即使没有复杂的物理计算,AI也能有效进行天气预报。
- SimPO:提升大语言模型RLHF效率与可扩展性的新方法
- 摘要: SimPO突破参考模型限制,解锁大语言模型强化学习人类反馈(RLHF)的高效与可扩展性。人工智能不断进化,重点在于优化算法以提升大模型的性能和效率。
- HuggingFace发布FineWeb:用于LLM预训练的大规模数据集
- 摘要: HuggingFace推出FineWeb数据集,包含15万亿个标记和44TB磁盘空间,旨在提升大语言模型(LLM)的训练效果。
- 微软推出大语言模型在线对齐的主动偏好引导方法
- 摘要: 微软的机器学习研究引入了一种主动偏好引导方法,用于大语言模型(LLMs)的在线对齐。这些模型因其增强的跟随人类指令能力,在近期取得了显著进展。
- 多标记预测:大语言模型性能与效率的飞跃
- 摘要: 研究人员探索了多标记预测技术在大语言模型中的应用,显著提升了模型的性能和效率。这一突破性的研究为大语言模型的发展带来了新的可能性。
- ChatMOF:预测和生成金属有机框架的人工智能系统
- 摘要: ChatMOF是一种人工智能系统,专为预测和生成金属有机框架(MOFs)而设计。该系统利用大型数据集和先进的AI技术,能够高效地生成和评估MOFs,为材料科学和化学研究提供重要支持。
- IPA子公司BioStrand推出用于电子健康记录的先进大语言模型
- 摘要: IPA(IMMUNOPRECISE ANTIBODIES LTD.)的子公司BioStrand宣布推出一款用于电子健康记录(EHR)的先进大语言模型。此次发布旨在提升EHR的处理和分析能力,为医疗行业带来新的创新和效率。
- 亚马逊在秋季发布会上为Alexa引入生成式AI
- 摘要: 亚马逊在秋季发布会上宣布为Alexa引入生成式AI,并推出多款新设备,包括第三代Echo Show 8、Echo Hub等。
- SAP与Mistral AI合作:AI技术与专业知识的结合
- 摘要: SAP与领先的大型语言模型制造商Mistral AI达成合作。这次合作是AI专业知识与技术的共生结合,旨在推动双方在AI领域的发展与创新。
- AI在国际象棋中的表现:部分出色,部分令人失望
- 摘要: 新的基准测试显示,即使是最新的大型语言模型(LLMs)在国际象棋方面也不是最强的选手。AI在推动棋子的能力上表现出部分出色和部分令人失望的结果。
大模型产品
大模型论文
- PlanAgent:基于多模态大语言模型的车辆运动规划
- 摘要: PlanAgent利用多模态大语言模型,通过环境转换、推理引擎和反思模块,实现车辆运动规划的常识推理和广泛适应性,优于现有方法。
- MMLU-Pro: 更具挑战性的多任务语言理解基准
- 摘要: MMLU-Pro通过增加推理题和扩展选项,提高挑战性和稳定性,显著降低模型准确率,更好评估AI进展。
- Helix: 异构GPU集群上的LLM高效分布式服务
- 摘要: Helix通过最大流模型优化LLM推理,使用MILP算法提高异构GPU集群的吞吐量和降低延迟,性能显著提升。
- LoFiT: 局部微调LLM表示
- 摘要: 本文提出LoFiT框架,通过选择特定注意力头进行局部微调,提高LLM在真确性和推理任务中的表现,且参数修改量显著减少。
- 信息瓶颈视角的检索增强生成噪声过滤
- 摘要: 提出信息瓶颈理论用于检索增强生成,过滤噪声,提升问答数据集生成答案的正确性和简洁性。
- 大语言模型与大脑映射的质疑
- 摘要: 研究质疑大语言模型与人脑语言处理的相似性,发现高脑分数主要由句子长度和位置等简单特征解释。
- 大语言模型的低资源安全增强方法
- 摘要: 提出一种无需监督微调或人类反馈强化学习的低资源安全增强方法,通过知识蒸馏提升未对齐模型的防御能力。
- 大语言模型中概念几何结构的研究
- 摘要: 本文研究了大语言模型中语义编码的两个基础问题:分类概念的表示和概念间的层次关系。
- 输出嵌入中的令牌概率编码研究
- 摘要: 本文研究了语言模型输出嵌入中的令牌概率信息,发现编码稀疏性,并通过删除无关维度优化输出分布。
- 通过覆盖性理解偏好微调
- 摘要: 本文分析了在线RL和离线对比方法在偏好微调中的异同,提出了结合两者优势的HyPO算法,提高了性能和效率。
大模型开源项目
- 跨平台GPT-4o实现
- 摘要: gpt-4o项目支持在Windows、macOS和Ubuntu上运行,使用Python语言编写,提供跨平台AI解决方案。
- VinciGit00: AI Python爬虫
- 摘要: VinciGit00是一个基于AI的Python爬虫项目,用于自动化数据抓取,提升效率和准确性。
- ToonCrafter:生成卡通插值研究
- 摘要: ToonCrafter是一个用Python编写的AI项目,旨在研究生成卡通插值技术,助力动画制作与创意设计。
- 基于NVIDIA Isaac Sim的机器人学习框架
- 摘要: isaac-sim是一个统一的机器人学习框架,基于NVIDIA Isaac Sim构建,使用Python语言编写。
- 微软生成式AI入门教程
- 摘要: 微软发布18课生成式AI入门教程,帮助初学者使用Jupyter Notebook语言构建生成式AI应用。
- 从零开始用PyTorch实现ChatGPT
- 摘要: 本项目在Jupyter Notebook中,逐步实现了一个类似ChatGPT的大语言模型,使用PyTorch框架进行构建。
- MiniCPM-Llama3-V 2.5手机端多模态LLM
- 摘要: MiniCPM-Llama3-V 2.5是一款在手机上运行的GPT-4V级别多模态大语言模型,使用Python编写。
相关文章:
大模型日报2024-06-05
大模型日报 2024-06-05 大模型资讯 AI气象预测取得重大进展:单台桌面电脑即可运行全球天气模型 摘要: 一项新的人工智能天气预测模型已经取得重大进展,该模型能够在一台普通的桌面电脑上运行,预测全球天气。这意味着即使没有复杂的物理计算&a…...
LLM 大模型学习必知必会系列(二):提示词工程-Prompt Engineering 以及实战闯关
角色扮演:在系统指令中告诉千问你需要它扮演的角色,即可沉浸式和该角色对话交流语言风格:简单调整 LLM 的语言风格任务设定:比如旅行规划,小红书文案助手这样的专项任务处理System message 也可以被用于规定 LLM 的答复…...
Spring系统学习 - Spring入门
什么是Spring? Spring翻译过来就是春天的意思,字面意思,冠以Spring的意思就是想表示使用这个框架,代表程序员的春天来了,实际上就是让开发更加简单方便,实际上Spring确实做到了。 官网地址:ht…...
Priority_queue
一、priority_queue的介绍和使用 1.1 priority_queue的介绍 1.优先队列是一种容器适配器,根据严格的弱排序标准,它的第一个元素总是它所包含的元素中最大的。 2.优先队列类似于堆, 在堆中可以随时插入元素, 并且只能检索最大堆…...
SpringMVC:获取请求数据
1. 通过RequestParma注解接收 /**** value和name都可以使用,互为别名* 如果此处设置了需要什么参数而前端请求时没有提供则会报400(请求参数不一致错误)* required参数用于设置该参数是否为必须传递参数,默认为true必须传递* defa…...
深度学习 --- stanford cs231 编程作业(assignment1,Q2: SVM分类器)
stanford cs231 编程作业之SVM分类器 写在最前面: 深度学习,或者是广义上的任何学习,都是“行千里路”胜过“读万卷书”的学识。这两天光是学了斯坦福cs231n的一些基础理论,越往后学越觉得没什么。但听的云里雾里的地方也越来越多…...
【scikit-learn010】sklearn算法模型清单实战及经验总结(已更新)
1.一直以来想写下基于scikit-learn训练AI算法的系列文章,作为较火的机器学习框架,也是日常项目开发中常用的一款工具,最近刚好挤时间梳理、总结下这块儿的知识体系。 2.熟悉、梳理、总结下scikit-learn框架模型算法包相关技术点及经验。 3.欢迎批评指正,欢迎互三,跪谢一键…...
Rethinking overlooked aspects in vision-language models
探讨多模态视觉语言模型的一些有趣结论欢迎关注 CVHub!https://mp.weixin.qq.com/s/zouNu-g-33_7JoX3Uscxtw1.Introduction 多模态模型架构上的变化不大,数据的差距比较大,输入分辨率和输入llm的视觉token大小是比较关键的,适配器,VIT和语言模型则不是那么关键。InternVL-…...
【漯河市人才交流中心_登录安全分析报告-Ajax泄漏滑动距离导致安全隐患】
前言 由于网站注册入口容易被黑客攻击,存在如下安全问题: 暴力破解密码,造成用户信息泄露短信盗刷的安全问题,影响业务及导致用户投诉带来经济损失,尤其是后付费客户,风险巨大,造成亏损无底洞…...
C语言—字符函数和字符串函数
1.字符分类函数 C语言中有一系列的函数是专门做字符分类的,也就是一个字符是属于什么类型的字符的。 这些函数的使用都需要包含一个头文件 ctype.h。 例:将一句话中的小写字母改成大写字母。 2.字符转换函数 头文件:ctype.h C语言提供了2…...
爬山算法的详细介绍
爬山算法(Hill Climbing Algorithm)是一种基于启发式的局部搜索算法,常用于解决优化问题。它的核心思想是从当前解的邻域中选择能够使目标函数值最大(或最小)的下一个解作为当前解,直到找到一个满足问题要求…...
硕士课程 可穿戴设备之作业一
作业一 第一个代码使用的方法是出自于[1]。 框架结构 如下图,不过根据对代码的解读,发现作者在代码中省去了对SSR部件的实现,下文再说。 Troika框架由三个关键部件组成:信号分解,SSR和光谱峰值跟踪。(粗…...
测试记录3:WLS2运行Linux界面
1.WLS1转到WLS2 (1)根据自己的平台,下载WLS2安装包 x64: https://wslstorestorage.blob.core.windows.net/wslblob/wsl_update_x64.msi arm64: https://wslstorestorage.blob.core.windows.net/wslblob/wsl_update_arm64.msi (2&…...
好用软件推荐
软件功能相关介绍地址FastStone截图(长截图、定时截图等)CSDNhttps://www.faststone.org/FSCaptureDownload.htmQuicker快捷访问https://getquicker.net/https://getquicker.net/...
王学岗鸿蒙开发(北向)——————(二)TS基本语法详解
1,Ts(TypeScript)语法相当于JAVAScript类型,鸿蒙arkTs是基于TS语言的,当然artTs也融合了其它的语言。 2,本篇文章是基于n9版本。注意,有些语法是已经不能用的。 3, 4,变量:用来存储数据,数字字母组成,数字不…...
【网络协议 | HTTP】HTTP总结与全梳理(一) —— HTTP协议超详细教程
🔥博客简介:开了几个专栏,针对 Linux 和 rtos 系统,嵌入式开发和音视频开发,结合多年工作经验,跟大家分享交流嵌入式软硬件技术、音视频技术的干货。 ✍️系列专栏:C/C、Linux、rtos、嵌入式…...
java基础选择题--11
1. 以下保留字( )不能出现在说明虚函数原型的语句中。A.static B.operator C.void D.const 参考答案:A 2. 一个类中只能定义一个析构函数。( )A.对 B.错 参考答案:A 解释: 在C中,一个类只能有一个析构函数。析构函数在对象生…...
欲除烦恼须无我,各有前因莫羡人
欲除烦恼须无我,各有前因莫羡人...
Vue的APP实现下载文件功能,并将文件保存到手机中
Vue的APP实现下载文件功能,并将文件保存到手机中 文字说明后台核心代码前台核心代码运行截图项目链接 文字说明 本文介绍Vue实现的APP,将文件下载并保存到手机中,为系统提供导出功能;同时支持导入,即选择本地的文件后&…...
泛微开发修炼之旅--07通过后端代码实现创建并发送待办、源码及示例
文章链接:泛微开发修炼之旅--07通过后端代码实现创建并发送待办、源码及示例...
轻松搭建AI应用的三个大模型技术路线
时下聊起AI,想必最热的就是使用AI的应用(chatGPT,文心一言等)来提升自己工作的效率,比如破局俱乐部,洋哥带领星球2万多人开启大航海,教人使用这一波新起的应用进行赚钱与赋能。 在我的视角来看…...
Vue01-vue的简介
一、Vue是什么? 一套用于构建用户界面的渐进式javaScript框架。 构建用户界面: 渐进式: 目前Vue的地位:生态完善,国内前端工程师必备技能。 二、Vue的特点 一个XXX.vue就是一个组件,封装的概念,…...
leetcode455.分发饼干、376. 摆动序列、53. 最大子序和
455.分发饼干 为了满足更多的小孩,就不要造成饼干尺寸的浪费 大尺寸的饼干既可以满足胃口大的孩子也可以满足胃口小的孩子,那么就应该优先满足胃口大的 这里的局部最优就是大饼干喂给胃口大的,充分利用饼干尺寸喂饱一个,全局最…...
JVM的内存结构
JVM 内存结构 方法区: 方法区主要用于存储虚拟机加载的类信息、常量、静态变量,以及编译器编译后的代码等数据。 程序计数器 由于在JVM中,多线程是通过线程轮流切换来获得CPU执行时间的,因此,在任一具体时刻,一个CP…...
轻量管理内核复杂级别的项目
在嵌入式开发中,管理大型项目(例如Linux内核)往往是一个复杂的过程。常规的版本控制系统如Git在处理小型项目时非常高效,但面对庞大的代码库时可能会显得笨重且占用大量存储空间。本文将介绍几种轻量级的方法来管理内核级别的项目…...
【wiki知识库】05.分类管理模块--后端SpringBoot模块
📝个人主页:哈__ 期待您的关注 目录 一、🔥今日目标 二、☀SpringBoot代码修改 1.使用逆向工程生成Category表结构 2. 新增CategoryQueryParam 3.新增CategorySaveParam 4.新增CategotyQueryVo 三、🤖新增分类管理的相关接口…...
资源目录与云SSO
1、开启资源目录 2、创建资源文件夹(根据公司业务划分) 3、资源文件夹内创建或邀请成员 4、创建管控策略(类型访问控制权限授权方法,可以授权给指定给资源文件夹或资源文件夹内成员) 5、可信服务-委派管理员账号数量 …...
ChatGPT AI专题资料合集【65GB】
介绍 ChatGPT & AI专题资料合集【65GB】 🎁【七七云享】资源仓库,海量资源,无偿分享√...
Linux 编译安装python
以deepin操作系统安装Python3.8.10为例。 下载 python3.8.10 官网下载 Linux要下载源码,进行编译。 下图tarball即tar包,是压缩包的意思。python官网给出两种压缩格式的tarball,下载哪个都可以。 方式一:直接点击链接下载 方式…...
2025 QS 世界大学排名公布,北大清华跻身全球前20
一年一度,2025 QS 世界大学排名公布! QS(Quacquarelli Symonds)是唯一一个同时将就业能力与可持续发展纳入评价体系的排名。 继去年 2024 QS 排名因为“墨尔本超耶鲁,新南悉尼高清华”而荣登微博热搜之后,…...
重庆网站查询/免费网站推广方式
原文地址:http://blog.csdn.net/emag_se/archive/2005/03/05/312317.aspx 1.世界上第一个计算机程序员 第一个写软件的人是Ada(Augusta Ada Lovelace),在1860年代她尝试为 Babbage(Charles Babbage)的机械式计算机写软…...
官方电商平台/杭州排名优化公司电话
1、搜狗输入法号称支持ubuntu 14.04版本,但是目前尝试的结果就是由于是和麒麟团队合作的,所以只是支持ubuntu 14.04麒麟版本的直接安装。像原版的ubuntu 14.04和衍生的linux mint 17是无法直接安装使用的,必须得按教程来解决一系列的依赖问题…...
湖北网站建设公司/营销型网站制作
近期在大佬群里各种炫技,各种工具使用,漏洞利用与复现,感觉自己常规安全测试就是个小学生,于是好心的大佬发了个Rapid7Setup-Windows64.exe的渗透工具,但是自己的电脑安装了,破解不了,导致失败&…...
平顶山市哪里有做网站的/优化关键词推广
阅读本文大概需要3分钟。 好吧,我承认我标题党了,如果你是进来找如何搭建小程序中的支付流程的,请你下车吧~ 这篇文章是介绍个人小程序如何集成赞赏功能的,利用微信小程序提供的支付接口必须具有公司资质才可以。或者你也可以集成…...
云盘做网站文件/优化大师专业版
1. ThreadLocal 底层是采用的弱引用,所以 currentResources.isEmpty()为空后,需要调用remove,否则会造成内存泄漏。 2. try(InputStream inputStream encodedResource.getResource().getInputStream()) …… 这样把这个语句放在try的括号内…...
广东网站制作哪家强/宁波网站推广优化公司电话
build.gradle中的minSdkVersion设置过小,为15,改为29即可。...