2023年8月第4周大模型荟萃
2023年8月第4周大模型荟萃
- 2023.8.31
- 版权声明:本文为博主chszs的原创文章,未经博主允许不得转载。
1、美国法官最新裁定:纯AI生成的艺术作品不受版权保护
美国华盛顿一家法院近日裁定,根据美国政府的法律,在没有任何人类输入内容的情况下,人工智能(AI)创作的艺术作品不受版权保护。美国地区法官Beryl Howell于8月18日表示,只有人工智能与人类作者合作的作品才能获得版权,并确认美国版权局驳回了计算机科学家Stephen Thaler代表其DABUS系统提出的申请。此前Thaler认为自己的人工智能系统DABUS拥有创造的艺术作品的版权,但美国版权局拒绝了他的申请,理由是“人类思维与创造性表达之间的联系”是版权保护的关键要素。
2、大模型的商业变现存在困难,盈利不清晰
最近科大讯飞财报显示,上半年营收78.42 亿元,同比下降 17.64%;净利润 0.74亿元,同比大幅下降73.54%。科大讯飞公司称,主要原因是为应对美国极限施压,在核心技术自主可控和产业链可控等方面坚定投入的同时,抢抓通用人工智能的历史新机遇,加大通用人工智能认知大模型的战略投入。
而另一家大模型公司商汤,最近再次传出火速裁员的信息,N+2赔偿,上午通知,下午走人。
3、新加坡国立大学大模型团队认为GPU的内存增长是瓶颈
新加坡国立大学大模型团队近日表示,从 2016 年至 2021 年 1 月,AI 模型的参数量是每 18 个月增长 40 倍;从 2018 年 1 月到 2021 年 1 月,AI 大语言模型的参数量每 18 个月增长 340 倍。而相形之下,2016 年 1 月至 2021 年 1 月间,GPU 的内存增长每 18 个月仅有 1.7 倍。由此得出了GPU内存的增长速度远跟不上大模型的发展速度。
这种认识存在较大的偏差,属于片面的看待问题。要知道,大语言模型是从2017年Google发布Transformer论文后才逐渐开始发展的,然后OpenAI加速了它的爆发,故大语言模型的参数量从2018年开始就呈现爆发状态;而GPU的内存从1999年GPU诞生开始,它的内存就存在了,然后逐年递增,发展规律与摩尔定律相似。其次,硬件(GPU内存)的发展速度与软件(大模型的参数量)的发展速度不是同一个规律,故进行类比很不适合。
4、讯飞声称华为GPU已可对标英伟达A100
2023年亚布力论坛夏季高峰会于8月24日-27日在深圳召开,科大讯飞创始人,董事长刘庆峰出席并演讲。刘庆峰介绍,华为的GPU技术现在已经与英伟达A100相当,但由于算子库不全,因此整体效率与英伟达相比仍存在差距。但任正非非常重视这个问题,“华为的三位董事作为联系工作组到科大讯飞,我们成立了一个专班工作,目前已经可以媲美英伟达A100,这是非常了不起的。”刘庆峰称。“以前百模大战,基本都是由英伟达训练的。企业内部只能进行微小的调优和训练,而基本的训练模型是比较困难的。”刘庆峰表示,这次基本上解决了这个问题。
但是无需高兴,这不过是合作伙伴的吹捧之言而已。事实上,1)华为目前没有自研的 GPU 落地;2)华为目前没有完全对标 NVIDIA A100 的产品,昇腾 NPU 属于 CPU+ AI 加速器,和GPU是两回事;3)另外,HW也欠缺对标CUDA的生态;4)与英伟达不同,华为昇腾 AI 芯片没有细分;而英伟达明确表示 L40S 与 H100 等大模型 GPU 分属不同应用领域,前者面向 Dell 等 IT 企业而后者面向 AI 云计算公司。真相到底如何,需要后续的科学评测。
5、快手推出AI大模型“快意”
8 月 21 日消息,快手自研的大语言模型“快意”(KwaiYii)近日已开启内测,并为业务团队提供了标准 API 和定制化项目合作方案。“快意”是由快手AI团队独立自研的大规模语言模型,而本次发布的正是其新版本KwaiYii-13B。
根据快手自测结果(快意的GitHub主页)显示,KwaiYi-13B-Base大模型在多个方面超越ChatGLM2,可以支持内容创作、信息咨询、逻辑推理、数学解题、代码编写、多轮对话等任务。
- Github主页:https://github.com/kwai/KwaiYii
- 内测主页还找不到(大概率是先吹牛,后补上)。
6、SK海力士发布面向AI的内存HBM3E
今日,韩国半导体公司SK海力士宣布成功开发出面向AI的高性能DRAM(动态随机存取存储器)新产品HBM3E,并开始向客户提供样品进行性能验证,将于明年上半年投入量产。据称,HBM3E每秒最高可处理1.15TB的数据,其散热性能与上一代产品HBM3相比提高了10%,且具备向后兼容性,可直接用于基于HBM3组成的系统。
7、阿里将推出大模型数学工具MindOpt Copilot
最近,阿里云官方公众号官宣了一款大模型数学工具 MindOpt Copilot,把大模型作为建模助手,接收用户以自然语言提出的优化问题,就可自动建模并调用求解器完成求解。MindOpt Copilot,把大模型作为建模助手,接收用户以自然语言提出的优化问题,就可自动建模并调用求解器完成求解。MindOpt Copilot可用于解决餐饮、零售、物流货运、生产制造等场景的资源配置和优化问题,将于近期上线阿里云并对外提供服务。
MindOpt Copilot基于阿里自研的大模型、求解器、建模语言“三大件”开发,借助底层的通义千问大模型,可将用户以自然语言描述的优化问题转化为线性规划和混合整数线性规划的优化模型,并获得最佳答案,比如“如何优化餐厅的座位安排”、“如何控制风险并最大化企业收益”或“鸡兔同笼”类问题。
8、Meta开源发布AI翻译模型及数据集
近日,Meta官宣AI大模型SeamlessM4T,该模型可翻译和转录近百种语言。SeamlessM4T能实现近百种语言的自动语音识别、语音到文本翻译,以及近百种输入语言和35种输出语言的语音翻译、文本转语音翻译。
构建通用语言翻译器有一定挑战性,因为现有的语音到语音、语音到文本的系统都只涵盖了全球现存语言的一小部分,SeamlessM4T扩大了语言覆盖的范围,并且是一个可以完成多种任务的统一多语言模型。秉持其一贯的开源策略,Meta在开源协议CC BY-NC 4.0下公开发布了SeamlessM4T,开发人员可以在这个模型的基础上进行开发。同时,Meta还发布了SeamlessAlign的数据集,其博客提到这也是迄今为止最大的开放多模态翻译数据集,覆盖挖掘的语音和文本对齐总计达270000小时。
Meta在开源的道路上越走越远。
9、VMware联手英伟达开发面向企业的私有AI平台
VMware和英伟达宣布合作推出面向企业的AI平台VMware Private AI Foundation with NVIDIA,并计划于2024年初发布。该平台提供各种集成式AI工具,将使企业能够创建供内部使用的私有模型,并运行各种生成式AI应用,如智能聊天机器人、助手、搜索和摘要等。作为全集成式解决方案,该平台采用英伟达提供的生成式AI软件和加速计算,基于VMware Cloud Foundation构建,并针对AI进行了优化。
10、钉钉开放AI PaaS底座 AI版商业定价19800元起
2023钉钉生态大会上公布了全面智能化的最新进展:已有17条产品线、55个场景全面接入大模型,完成智能化再造;同时面向生态伙伴和客户开放智能化底座AI PaaS,下接大模型,上连用户需求。钉钉方面透露,其生态伙伴和企业可以基于AI PaaS开发各类AI应用。叶军现场实景演示了基于AI PaaS和生态伙伴共创的新产品“数字员工”,以及会议、点餐、教育等多种场景、行业的AI解决方案。
对于备受关注的大模型落地应用场景的收费问题,钉钉也给出了明确的方案:钉钉专业版年费9800元基础上,增加10000元即可获得20万次大模型调用额度;在专属钉钉年费基础上,增加20000元即可获得45万次大模型调用额度。
钉钉声称,截至2023年3月末,钉钉软件付费企业达10万家,其中,小微企业占比58%,中型企业占比30%,大型企业占比12%。钉钉ARR(年度经常性收入)远超半人马公司1亿美元评估标准,仅软件订阅式GAAP收入也已经明显超过这个数字。
11、清华联合字节开源听觉大语言模型SALMONN
清华大学电子工程系与字节跳动火山语音团队合作,于近日推出一款认知导向的开源听觉大语言模型SALMONN(Speech Audio Language Music Open Neural Network),该模型不仅能够感知和理解各种类型的音频输入,还涌现出多语言和跨模态推理等高级能力。目前SALMONN能够胜任英语语音识别、英语到中文的语音翻译、情感识别、音频字幕生成、音乐描述等语音和音频任务,同时涌现出多种在模型训练中没有专门学习过的多语言和跨模态能力,涵盖非英语语音识别、英语到(中文以外)其他语言的语音翻译、对语音内容的摘要和关键词提取、基于音频的故事生成、音频问答、语音和音频联合推理等任务。
- Demo:https://bytedance.gith
- Github主页:https://github.com/bytedance/SALMONN/
12、工业AI公司频率探索完成数千万A轮融资
工业AI预测性维护公司频率探索近日完成数千万元A轮融资,本轮投资由涌铧投资领投,常州高新投跟投,融资资金将主要用于产品研发、生产线建设与市场拓展。频率探索成立于2021年,是一家工业AI预测性维护公司。公司掌握了大量的工业设备机理研究数据及信号分析诊断方法,能够为设备故障提供早期诊断、故障量化、寿命预测及智能运维服务。
13、千亿级数学大模型MathGPT推出
在好未来20周年直播活动中,好未来CTO田密宣布推出好未来自研的数学领域千亿级大模型MathGPT并开启内测。即日起,用户可通过官网(www.mathgpt.com)申请注册账号免费试用体验。
今年5月,好未来曾公布正在进行自研数学大模型的研发,命名为MathGPT。MathGPT是面向全球数学爱好者和科研机构,以解题和讲题算法为核心的数学垂直领域的大模型,也是国内首个专为数学打造的大模型。
14、OpenAI 推出 ChatGPT 企业版
近日,OpenAI 正式发布面向企业的 AI 助手 —— ChatGPT Enterprise 版。企业版可以以更快速度无限制地访问 GPT-4,还可以用来处理更长输入的上下文窗口、拥有加密、企业级安全和营私以及组帐户管理功能。
- 企业版拥有 32,000 个 token 上下文窗口,允许用户处理四倍长的输入、文件或后续操作,简单来看,这意味着它可以同时处理更多文本(或进行更长时间的对话)。token 可以被认为是单词的片段,32,000 个标记大约相当于 24,000 个单词。
- 企业版可以无限制访问 GPT-4(无使用上限),与此同时,访问速度还提高了 2 倍。
- 企业版还提供对高级数据分析的无限制访问,也就是之前的代码解释器。
- 企业版具有企业级隐私、安全和部署工具保护数据,可以让企业拥有并控制自己的业务数据,而 OpenAI 不会对企业的业务数据或对话进行训练,也不会从企业的使用中进行学习。
15、英伟达GPU成为AI界“贫富”的分界线
之前的采矿热潮刚刚凉去,如今的AI热潮更加汹涌百倍,英伟达的人工智能处理器现在“一芯难求”,它甚至成了划分科技界“贫富”的分界线。研究公司SemiAnalysis分析师迪伦·帕特尔(Dylan Patel)和丹尼尔·尼什鲍尔(Daniel Nishball)在上周末对英伟达GPU的分布情况进行了分析,通过企业所拥有的GPU数量对科技界进行了“贫富”划分,分成了两组。
SemiAnalysis的数据显示,少数公司从英伟达那里获得了2万多颗A100或H100 GPU。H100是英伟达最新旗舰AI芯片,价值4万美元。它的前一代是A100芯片,价值1万美元。
1)位于第一梯队的是目前行业领先的AI公司,包括OpenAI、谷歌、Anthropic、Inflection、埃隆·马斯克旗下X、脸书母公司Meta,以及中国互联网巨头如字节跳动、百度、腾讯和阿里巴巴等。
据外媒报道,中国互联网巨头已经订购了价值50亿美元的英伟达芯片。由于美国政府采取的限制措施,中国公司只能采购降级版A800芯片,它的性能要比英伟达的尖端A100或H100芯片弱一些。另外,他们还采购了价值40亿美元的英伟达GPU,2024年交付。
按照H100 GPU的数量计算,Meta将排名世界第二。那么谁是第一呢?谷歌。SemiAnalysis指出,这家互联网巨头是“世界上计算资源最丰富的公司”,具有“无与伦比的高效架构”。
2)位于第二梯队的是知名的AI创业公司,比如Hugging Face、Databricks和Together,它们所拥有的GPU数量也很少。以及国内其它搞大模型的大型企业,这些国内大型企业寻求寻求性能低一两档次的替代方案。
3)其次就是欧洲创业公司和政府支持的超级计算机项目,比如“儒勒凡尔纳”(Jules Verne)以及国内的创业型AI公司,它们在AI大模型训练上“完全没有竞争力”。
16、商汤大模型SenseChat正式开放试用
商汤大模型SenseChat正式开放试用,见:https://chat.sensetime.com/wb/,手机号注册即可使用。目前只提供了一个文生文模型,也即问答模型。这速度,相比于文心、星火、通义千问等落后了不少,吹了几个月的牛,终于落到实处了。
17、美图旗下 AI 数字人生成工具 DreamAvatar 上线
8 月 29 日,美图公司宣布旗下 AI 数字人生成工具 DreamAvatar 已于近日上线,首期推出“AI 演员”数字人服务,以 AI 驱动为核心,服务于视频内容创作、影视处理与剪辑等生产力场景。目前,DreamAvatar“AI 演员”支持最长 10 秒视频的转化,共推出了机器人、兽人、类人三大题材共计 11 个不同风格的数字人形象。见https://www.dreamavatar.com/
相关文章:

2023年8月第4周大模型荟萃
2023年8月第4周大模型荟萃 2023.8.31版权声明:本文为博主chszs的原创文章,未经博主允许不得转载。 1、美国法官最新裁定:纯AI生成的艺术作品不受版权保护 美国华盛顿一家法院近日裁定,根据美国政府的法律,在没有任何…...

Kafka监控工具,LinkedIn详解
Kafka监控工具包括以下几种: Kafka Manager:这是一个开源的Kafka集群管理工具,可以监控Kafka集群的健康和性能,并提供可视化的用户界面。 Kafka Monitor:这是LinkedIn开发的一个监控工具,可以监控Kafka集群…...

如何处理 Flink 作业频繁重启问题?
分析&回答 Flink 实现了多种重启策略 固定延迟重启策略(Fixed Delay Restart Strategy)故障率重启策略(Failure Rate Restart Strategy)没有重启策略(No Restart Strategy)Fallback重启策略ÿ…...

Windows 安装 RabbitMq
Windows 上安装 RabbitMQ 的步骤 RabbitMQ 是一个强大的开源消息队列系统,广泛用于构建分布式、可扩展的应用程序。本教程将带您一步一步完成在 Windows 系统上安装 RabbitMQ 的过程。无需担心,即使您是初学者,也能够轻松跟随这些简单的步骤…...

Mybatis的关系关联配置
前言 MyBatis是一个流行的Java持久化框架,它提供了一种简单而强大的方式来映射Java对象和关系数据库之间的数据。在MyBatis中,关系关联配置是一种用于定义对象之间关系的方式,它允许我们在查询数据库时同时获取相关联的对象。 在MyBatis中&…...

【知识积累】准确率,精确率,召回率,F1值
二分类的混淆矩阵(预测图片是否是汉堡) 分类器到底分对了多少? 预测的图片中正确的有多少? 有多少张应该预测为是的图片没有找到? 精确率和召回率在某种情况下会呈现此消彼长的状况。举个极端的例子…...

什么是分布式系统?
分布式系统是由多个独立的计算机或计算节点组成的系统,这些节点通过消息传递或共享数据的方式进行协调和通信,以实现共同的目标。分布式系统的设计目标是提高系统的可靠性、可扩展性、性能和容错性。 在一个分布式系统中,各个计算机节点之间…...

[AGC043D] Merge Triplets
题目传送门 引 很有意思的计数题 解法 考虑经过操作后得到的排列的性质 性质1: 设 p r e ( i ) pre(i) pre(i):前i个位置的最大值,则不会出现超过3个的连续位置的 p r e pre pre相同 必要性: 考虑反证,若有超过 3 3 3个的连续…...

2023年人工智能开源项目前20名
推荐:使用 NSDT场景编辑器快速搭建3D应用场景 1. Tensorflow 2. Hugging Face Transformers 3. Opencv 4. Pytorch 5. Keras 6. Stable Diffusion 7. Deepfacelab 8. Detectron2 9. Apache Mxnet 10. Fastai 11. Open Assistant 12. Mindsdb 13. Dall E…...

ThinkPHP 集成 jwt 技术 token 验证
ThinkPHP 集成 jwt 技术 token 验证 一、思路流程二、安装 firebase/php-jwt三、封装token类四、创建中间件,检验Token校验时效性五、配置路由中间件六、写几个测试方法,通过postman去验证 一、思路流程 客户端使用用户名和密码请求登录服务端收到请求&…...

gerrit 如何提交进行review
前言 本文主要介绍如何使用gerrit进行review。 下述所有流程都是参考: https://gerrit-review.googlesource.com/Documentation/intro-gerrit-walkthrough.html 先给一个commit后但是还没有push上去的一个办法: git reset --hard HEAD^可以多次reset.…...

罗勇军 →《算法竞赛·快冲300题》每日一题:“游泳” ← DFS+剪枝
【题目来源】http://oj.ecustacm.cn/problem.php?id1753http://oj.ecustacm.cn/viewnews.php?id1023【题目描述】 游泳池可以等分为n行n列的小区域,每个区域的温度不同。 小明现在在要从游泳池的左上角(1, 1)游到右下角(n, n),小明只能向上下左右四个方…...

【教程】PyTorch Timer计时器
转载请注明出处:小锋学长生活大爆炸[xfxuezhang.cn] OpenCV的Timer计时器可以看这篇:Python Timer和TimerFPS计时工具类 Timer作用说明:统计某一段代码的运行耗时。 直接上代码,开箱即用。 import time import torch import os …...

因果推断(六)基于微软框架dowhy的因果推断
因果推断(六)基于微软框架dowhy的因果推断 DoWhy 基于因果推断的两大框架构建:「图模型」与「潜在结果模型」。具体来说,其使用基于图的准则与 do-积分来对假设进行建模并识别出非参数化的因果效应;而在估计阶段则主要…...

探索隧道ip如何助力爬虫应用
在数据驱动的世界中,网络爬虫已成为获取大量信息的重要工具。然而,爬虫在抓取数据时可能会遇到一些挑战,如IP封禁、访问限制等。隧道ip(TunnelingProxy)作为一种强大的解决方案,可以帮助爬虫应用更高效地获…...

题目:2629.复合函数
题目来源: leetcode题目,网址:2629. 复合函数 - 力扣(LeetCode) 解题思路: 倒序遍历计算。 解题代码: /*** param {Function[]} functions* return {Function}*/ var compose function(…...

【实训项目】精点考研
1.设计摘要 如果说高考是一次能够改变命运的考试,那么考研应该是另外一次。为什么那么多人都要考研呢?从中国教育在线官方公布是考研动机调查来看,大家扎堆考研的原因大概集中在这6个方面:本科就业压力大,提升竞争力、…...

软件测试Pytest实现接口自动化应该如何在用例执行后打印日志到日志目录生成日志文件?
Pytest可以使用内置的logging模块来实现接口自动化测试用例执行后打印日志到日志目录以生成日志文件。以下是实现步骤: 1、在pytest配置文件(conftest.py)中,定义一个日志输出路径,并设置logging模块。 import loggi…...

深入理解作用域、作用域链和闭包
🎬 岸边的风:个人主页 🔥 个人专栏 :《 VUE 》 《 javaScript 》 ⛺️ 生活的理想,就是为了理想的生活 ! 目录 📚 前言 📘 1. 词法作用域 📖 1.2 示例 📖 1.3 词法作用域的…...

7款适合3D建模和渲染的GPU推荐
选择一款完美的 GPU 并不是一件容易的事;您不仅必须确保有特定数量的线程和内核来处理图像,而且还应该有足够的 RAM。 这是因为 3D 渲染是一个活跃的工作过程,因为您必须坐在 PC 前并持续与软件交互。为了在 3D 场景中积极工作,您…...

边缘计算物联网网关在机械加工行业的应用及作用分享
随着工业4.0的推进,物联网技术正在逐渐渗透到各个行业领域。机械加工行业作为制造业的基础领域之一,其生产过程的自动化、智能化水平直接影响到产品质量和生产效率。边缘计算物联网网关作为物联网技术的重要组成部分,在机械加工行业中发挥着越…...

(笔记六)利用opencv进行图像滤波
(1)自定义卷积核图像滤波 import numpy as np import matplotlib.pyplot as plt import cv2 as cvimg_path r"D:\data\test6-6.png" img cv.imread(img_path)# 图像滤波 ker np.ones((6, 6), np.float32)/36 # 构建滤波器(卷积…...

WPF C# .NET7 基础学习
学习视频地址:https://www.bilibili.com/video/BV1hx4y1G7C6?p3&vd_source986db470823ebc16fe0b3d235addf050 开发工具:Visual Studio 2022 Community 基础框架:.Net 6.0 下载创建过程略 .Net和.Framework 区别是Net是依赖项ÿ…...

QT里使用sqlite的问题,好多坑
1. 我使用sqlite,开发机上好好的,测试机上却不行。后来发现是缺少驱动(Driver not loaded Driver not loaded),代码检查了又检查,发现应该是缺少dll文件(系统不提示,是自己使用 QMes…...

openGauss学习笔记-59 openGauss 数据库管理-相关概念介绍
文章目录 openGauss学习笔记-59 openGauss 数据库管理-相关概念介绍59.1 数据库59.2 表空间59.3 模式59.4 用户和角色59.5 事务管理 openGauss学习笔记-59 openGauss 数据库管理-相关概念介绍 59.1 数据库 数据库用于管理各类数据对象,与其他数据库隔离。创建数据…...

Nginx安装与部署
文章目录 一,说明二,下载三,Windows下安装1,安装2,启动3,验证 四,Linux下安装1,安装2,启动3,验证 五,Nginx配置 一,说明 Nginx是一款高性能Web和反向代理服务器,提供内存少,高并发,负载均衡和反向代理服务,支持windos和linux系统 二,下载 打开浏览器,输入地址: https://ngin…...

Linux中Tomcat发布war包后无法正常访问非静态资源
事故现象 在CentOS8中安装完WEB环境,首次部署WEB项目DEMO案例,发现可以静态的网页内容, 但是无法向后台发送异步请求,全部出现404问题,导致数据库数据无法渲染到界面上。 原因分析 CentOS请求中提示用来获取资源的连…...

大数据、AI和云原生:引领未来软件开发的技术演进
文章目录 **1. 数据驱动的创新:****2. 智能化应用的兴起:****3. 云原生的敏捷和可扩展性:****4. 实时性和即时性:****5. 数据隐私和安全:****6. 跨平台和跨设备:****7. 自动化和智能编程:****8.…...

Text-to-SQL小白入门(四)指令进化大模型WizardLM
摘要 本文主要对大模型WizardLM的基本信息进行了简单介绍,展示了WizardLM取得的优秀性能,分析了论文的核心——指令进化方法。 论文概述 基本信息 英文标题:WizardLM: Empowering Large Language Models to Follow Complex Instructions中…...

浅谈红队资产信息收集经验
文章目录 子公司资产收集备案号|官网收集子域名|ip收集fofa灯塔ARLX情报社区 资产确认目录扫描Google Hacking绕过CDNnmap端口扫描参数技巧其他常用工具 子公司资产收集 红蓝对抗中往往只会给你目标企业的名称,以及对应的靶标系统地址,而很少有直接从靶标…...