当前位置: 首页 > news >正文

跟着我一步两步三步,用开源方式将AI带入企业

53228a325678fb97271320365c101cad.jpeg

“AI有开源派与闭源派,你挺哪一派?”这是红帽公司针对媒体所做的一次小调查。结果显示,坚定的开源派占50%,挺闭源的仅有5.56%。如果是你,又会怎样选择?

如何才能让AI在企业中快速平稳落地,并且开花、结果呢?“以开源的方法,将AI带入企业。”红帽全球副总裁兼大中华区总裁曹衡康如是说。

d414fd1c423b2b7042a15c7a5451e9fe.png
红帽全球副总裁兼大中华区总裁 曹衡康

开源  开放混合  开放式创新

众所周知,ChatGPT最初也是开源的,甚至曾经采用过红帽的Container。但是后来,它慢慢地走向了闭源。其实选择开源还是闭源,没有绝对的对与错,而是看它能否真正满足应用所需。

站在红帽的角度来说,开源当然是不二之选。从成立的第一天起,红帽就一直秉持开源的精神,践行100%开源的策略。进入AI新时代,红帽的思路是以开源的方法让AI在企业中落地。

b3ff0ba259d2a25ce3320a80fb6ade52.jpeg

“AI在闭源的环境中,可能会存在一些安全隐忧,比如无法确信是否有人在很好地监督闭源环境。而开源的一个优势,是整个社区会共同检查安全问题所在,并且快速解决问题。另外,随着模型的参数越来越大,构建和应用越来越复杂,需要大量的云中算力作为支撑。从某种角度来说,这多少有些浪费。”曹衡康表示,“在推动AI应用方面,红帽的想法是,让模型的应用更加轻量化,进而降低AI在企业中的应用门槛。”

轻量化、简单易用,红帽的AI策略与Linux、OpenShift的推广理念其实是一脉相承的。

当前,我们已经进入了“混合多云”时代,AI的落地应用也不能脱离这个现实。模型既可以在云上开发,也可以在本地数据中心部署和应用。红帽要做的就是通过不断优化,在一个比较简单的环境中,将模型建立起来,为业务赋能。“考虑到资源利用最大化、效率以及安全性等问题,AI应用非常适宜在混合云中完成。”曹衡康表示,“通过红帽的技术,在笔记本电脑上就可以完成数据采集、建模、训练,而不一定用到云。”

从红帽的定位和整体战略来看,不做硬件,也不碰应用,而是在硬件和应用之间搭建一个基础架构、一个平台、一个工具,与更多的生态伙伴合作,以开放的心态推动开放的创新实践。具体来看,从上至下,在AI应用层,红帽提供跨开放混合云的AI赋能的企业应用;在AI模型层,红帽为AI模型提供多样化选择,以提高AI创新的ROI;在AI平台层,红帽提供领先的AI平台,帮助企业安全高效地部署和管理AI模型和AI应用;在AI基础设施层,红帽为企业的AI模型和AI应用提供安全的、可扩展的基础设施以及自动化能力。曹衡康特别提到,红帽能够为企业提供咨询、实施、赋能三位一体的开放创新实验室服务,以加速企业的AI创新实践。

开放混合云、开源思想、开放的创新实践,这就是红帽通过开源的方式将AI带入企业所秉承的基本原则与信条。

由小及大
三步完成AI生产级部署应用

在今年5月举行的2024红帽全球峰会上,红帽一口气公布了20多项创新,涉及产品、开源社区、工具和工具链等,其中与AI相关的创新最受瞩目,创新覆盖AI的基础架构层、平台层、模型层和应用层。

“AI创新,从来就不是一件简单的事情,也不是只要选择一个模型,就万事大吉了。”红帽大中华区解决方案架构部高级总监王慧慧表示,“红帽致力于提供端到端的AI平台和路径,从本地工作平台开始,帮助企业用户轻松地创建并使用AI的代码和环境,并将其无缝地扩展到企业级的生产环境中。”

64e562b8736f83904486f9d888671d0d.jpeg

以开源的方式将AI带入企业,大致可以分成“三步走”。

第一步,在资源受限的桌面环境中,采用小数据集,进行实验性训练。所有的开发人员(包括应用开发人员、模型开发人员)都可以自己的笔记本电脑上,以容器化的方式开发自己的AI应用,或者采用红帽提供的InstructLab工具去建立和调优模型。

InstructLab是一个围绕LAB方法和IBM开源Granite模型构建的开源社区。InstructLab项目的目标是使开发者通过简化大语言模型的创建、构建和贡献过程,能够像参与任何其他开源项目一样,将大语言模型开发的权力交到开发者手中。据悉,IBM Granite 7B英语模型已整合到InstructLab社区中。

“AI模型的训练以前不可能在一台PC上完成,因为原来我们并不认为AI是混合的,而是认为模型训练必须在一个配备了GPU卡的大型数据中心里完成。”王慧慧表示,“未来,我们会将InstructLab集成到Podman Desktop中,让开发者在本地,利用一台PC就能完成初步的AI模型训练。”

第二步,通过完整的合成数据生成技术,采用“教师”模型和“学生”模型的训练方法,进行生产级的模型训练,并提供基本操作脚本化的工具支持。

当构建的模型在本地的PC上通过了验证,开发人员就可以将它推送到一台比较大的服务器上。这时就会用到像红帽Enterprise Linux AI(RHEL AI),在此平台上,通过一套完整的数据生成技术以及相对复杂的“教师模型、学生模型”训练方法,可以针对已经做好的基础模型,接着进行生产化的模型训练。

44a0893ad2d11ec2d6b8d4e8dffad827.jpeg

最新推出的RHEL AI是一个基础模型平台,能够使用户更加便捷地开发、测试和部署生成式人工智能模型。它整合了IBM研究院的开源授权Granite大型语言模型系列、基于大规模对话机器人对齐(LAB)方法的InstructLab模型对齐工具,以及通过InstructLab项目实施的社区驱动模型开发方法。该方案被封装成一个优化的RHEL镜像,用于在混合云环境中部署单个服务器,并已集成到OpenShift AI中。

经过上述一系列操作后,当模型具备了一定的可读性、可使用性,就可以推送到第三步的环境中。

第三步,在更庞大的分布式集群环境中,继续生产级的模型训练,这时就会用到像红帽OpenShift AI,充分利用Kubernetes的扩展、自动化能力,实现MLOps的全部功能。

a5dcc3ffec896e003b234fac77eab3e1.jpeg

未来,随着更多企业在RHEL AI环境中试验和调整AI模型,红帽OpenShift AI将成为继续扩展这些工作流的一个更强大的平台。OpenShift AI是一个混合的平台,既可以部署在本地的数据中心,也可以部署在公有云、私有云中。OpenShift AI为企业用户提供了一个AI应用的DevOps平台,用户可以在OpenShift AI平台上做AI应用的开发、测试、调整、上线、运行。OpenShift AI是一个集大成者,让企业可以完成包括模型、应用和资源控制等在内的所有内容。

“企业应用AI,可以从一个小应用、小模型开始,进行小规模的尝试。在这个阶段,Podman与InstructLab是非常趁手的工具。当企业感觉对AI模型的训练已经比较熟练,并想在更大规模的企业级环境中部署和应用时,就可以将在PC上验证过的模型推送到数据中心,乃至更大规模的分布式集群环境中。这种循序渐进的方式,上手更容易,也可以避免一些不必要的风险或弯路,充分满足企业用户在AI不同应用阶段的需求。”王慧慧如是说。

   打开AI模型“黑箱”
支持混合应用

我们一谈到AI的应用,不可避免地要涉及以下四个方面的问题:第一,基础架构,主要解决算力的问题;第二,算法和模型的问题,相对来说技术门槛比较高;第三,数据,关键是要合规、安全地使用数据;第四,AI的应用场景问题,越来越多的企业在进行深入地摸索和探讨。

当前,生成式AI的需求集中爆发,算力问题被推到了风口浪尖。人们都相信“大力出奇迹”。但随着这股热潮渐渐褪去,从用户的角度,还是更关心如何用AI赋能业务,比如能否用更小的模型、更少的算力,更有效地解决生产中的实际问题。基于开源的方法论和技术,红帽与合作伙伴共创平台、工具、社区,为的就是帮助企业打开AI模型这个“黑箱”,在实际应用中充分发挥企业自身的主动性、创造性和独特的竞争优势。

一个AI项目或者AI应用,可以在本地数据中心建模,在云中进行训练,在产线的任何一台工控设备上完成推理,并且始终保持是同样的一套AI。这就是所谓AI的部署、应用和消费都是混合的。红帽的目标是打造这样一个支持AI的混合环境,并保证其高效、安全、可靠、简单易用。红帽希望有更多的客户、合作伙伴在其平台上开发AI应用。



往/期/回/顾

从科技赋能到价值引领,东莞证券可进化的信创云建设启示录“智算”雄起 | 智算操作系统要“顶天立地”

从虚拟化走向云原生,红帽OpenShift“一手托两家”

生成式AI如何落地?红帽打了个样儿

一场开放混合云的大戏,多亏了红帽“戏精团”的精彩演绎

2950451bf09c2d3bae335748ab421066.jpeg

相关文章:

跟着我一步两步三步,用开源方式将AI带入企业

“AI有开源派与闭源派,你挺哪一派?”这是红帽公司针对媒体所做的一次小调查。结果显示,坚定的开源派占50%,挺闭源的仅有5.56%。如果是你,又会怎样选择? 如何才能让AI在企业中快速平稳落地,并且开…...

天途重磅推出无人机教管平台3.1版及飞课APP

天途无人机教管平台,是一款为院校和培训机构等企业级客户提供的公开版无人机在线培训系统,包含后台管理的【教管平台】和终端的【掌上天途APP】。 天途历经4年上百次调研和迭代打磨,已为一百多家院校和培训机构等企业级客户解决了无人机教学和…...

虚幻引擎 Gerstner Waves -GPU Gems 从物理模型中实现有效的水体模拟

这篇文章重点在于结合GPU Gems一书中有关Gerstner Waves 的数学公式,在虚幻引擎中复现正确的Gerstner Waves和正确的法线 文中内容整理自书中,并附带我的理解,与在虚幻引擎中的实现,可以参考原文看这篇文章,原文网上很…...

Labview_网络流

网络流的介绍 网络流是一种易于配置、紧密集成的动态通信方法,用于将数据从一个应用程序传输到另一个应用程序,其吞吐量和延迟特性可与 TCP 相媲美。但是,与 TCP 不同的是,网络流直接支持任意数据类型的传输,而无需先…...

让生产管理变简单

随着业务的发展,工厂每天要处理很多订单,还要统筹安排各部门工作以及协调上下游加工企业,生产管理问题也随之而来。 1.销售订单评审困难、无法及时抓取到历史数据做参考。由于数据的不及时性、不准确性无法为正常的生产和采购提供数据支撑。同…...

MySQL与SQLite的区别

MySQL 和 SQLite 是两种常见的关系型数据库管理系统,但它们在设计目标、架构和使用场景上有显著的区别。以下是它们的主要区别: 1. 架构与模式 MySQL: 客户端/服务器模式:MySQL 采用 C/S 架构,数据库服务器运行在一…...

Hi3861 OpenHarmony嵌入式应用入门--LiteOS Event

CMSIS 2.0接口使用事件标志是实时操作系统(RTOS)中一种重要的同步机制。事件标志是一种轻量级的同步原语,用于任务间或中断服务程序(ISR)之间的通信。 每个事件标志对象可以包含多个标志位,通常最多为31个&…...

Centos+Jenkins+Maven+Git 将生成的JAR部署到Jenkins服务器上

背景:前一篇写的是Jenkins和项目应用服务器不在同一个服务器上。但是有的公司可能不会给Jenkins单独弄一个服务器。可能就会出现Jenkins就搭建在某一个应用服务器上。这种情况的参考如下的操作。 1、登录 没有安装的参考下面的安装步骤先安装: Jenkins安装手册 输入账号、…...

性能评测系列(PT-010):Spring Boot + MySQL,高并发insert

一、测试概述 测试场景 场景编号: PT-010场景描述: Java应用,MySQL单表写测试目的:指定规格、配置、环境下,Java应用数据库简单写场景负载能力评估。(不含调优,所测结果未必是最优结果&#x…...

网站改成HTTPS方法

网站改成HTTPS只要网站没有特殊性的要求,绝大部分网站很轻松的就可以完成,尤其是CMS类似的网站系统或者自助搭建的网站(比如:这种网站可以在网站后台一次性安装并且生效)。 基本要求 将网站改成HTTPS有2个前提&#…...

智慧社区:居民幸福生活的保底线,价值非常大。

大屏应该能够显示社区内的关键数据,如人流量、车辆数量、垃圾分类情况等。这些数据可以通过图表、数字、地图等形式展示,以便居民和管理者能够直观地了解社区的情况。 智慧社区可视化大屏成为一个有益于社区管理和居民生活的工具,提供实时、准…...

《昇思25天学习打卡营第1天|NapKinG》

昇思MindSpore 学习昇思大模型的第一天,先了解一下此模型的架构,设计理念,以及层次结构,昇思大模型(MindSpore)的优点有很多,易开发,高效执行,全场景统一部署,是一个全场景深度学习框架 易开发的具体表现为API友好,调试难度低,高效执行包括计算效率,数据预处理效率和分布式训练…...

Java项目毕业设计:基于springboot+vue的幼儿园管理系统

数据库:MYSQL5.7 **应用服务:Tomcat7/Tomcat8 使用框架springbootvue** 项目介绍 管理员;首页、个人中心、用户管理、教师管理、幼儿信息管理、班级信息管理、工作日志管理、会议记录管理、待办事项管理、职工考核管理、请假信息管理、缴费信息管理、幼儿请假管理…...

CPU1511作为CPU1513的智能IO设备

一、把一个IO控制器作为另一个IO控制器的IO设备来使用 1、在智能设备通信里定义好传输区后,导出GSD文件 2、在另一个项目程序内添加GSD文件 3、当作PLC的IO设备组态,并连接至PLC_1 4、在右侧更改I区、Q区地址与名称 5、硬件编译并下载,此…...

docker 安装与常用指令

1. docker 安装 sudo yum install -y yum-utilssudo yum-config-manager --add-repo https://download.docker.com/linux/centos/docker-ce.reposudo yum install docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-pluginsudo systemctl enable do…...

如何将 gz 文件通过 local data 导入 OceanBase?

在很多领域,数据的传输是基于 csv,并且,为了方便,属于同一张表的多个 csv 文件还是打包成 gz 文件进行传输。 当 gz 文件传输到下游时,需要将 gz 中的 csv 数据导入数据库,最直接的方法是: 在…...

electron+vue3+vite

1.创建工程 开源的electron构建脚手架:GitHub - electron-vite/electron-vite-vue: 🥳 Really simple Electron Vite Vue boilerplate. 1.使用命令创建工程(node版本在16上) npm create electron-vite 2.项目目录结构 2.安装依…...

react笔记-04redux篇

redux和react-redux笔记,以及项目中如何使用,对redux的封装,让其使用类似于vuex一样方便。 一、redux 1. redux工作流程 流程:创建action > dispatch分发action > 交给store > reducer加工数据返回给store 2. redux的…...

oracle 等待事件

1.db file scattered read 含义:当一个SQL语句需要从数据文件中读取多块非连续的数据块时,就会发生db file scattered read等待事件。这意味着数据分散在不同的位置,数据库需要进行多次I/O操作来收集所需的信息。场景:这种事件常…...

Vue 的 axios二次封装

(以下的接口地址链接换成自己的写!!!) 首先在项目中src的目录下创建一个api的文件夹,在api的文件下在穿件两个文件用于二次封装 别忘了先安装axios:(在根目录下安装axios&#xff0…...

实验操作步骤:使用Tripwire进行文件完整性监控

摘要 在网络安全领域,文件完整性监控是确保系统安全的关键措施之一。Tripwire作为一个业界领先的文件完整性监控工具,能够帮助系统管理员检测未授权的文件更改。本文将详细介绍如何安装、配置并使用Tripwire进行文件完整性监控的实验操作步骤。 1. Tri…...

使用达梦DMHS平滑迁移Oracle数据到DM8

一、迁移前准备 1.环境描述 服务 IP 架构 Oracle 192.168.10.91/92 RAC、主库 Oracle 192.168.10.98 DG备库 达梦 192.168.10.192/192.168.10.193 主备 DMHS 192.168.10.193(DM端) 192.168.10.98(Oracle端) DTS …...

Java面试题:讨论事务的ACID属性,并解释在Java中如何管理事务

事务是数据库管理系统中的一组操作,这些操作要么全部成功,要么全部失败,事务的ACID属性确保了数据库系统的可靠性和一致性。ACID是指: Atomicity(原子性):事务中的所有操作要么全部完成&#xf…...

第 5 章理解 ScrollView 并构建 Carousel UI

通过上一章的学习,我相信你现在应该明白如何使用堆栈构建复杂的 UI。当然,在你掌握 SwiftUI 之前,你还需要大量的练习。因此,在深入研究 ScrollView 以使视图可滚动之前,让我们先以一个挑战开始本章。你的任务是创建一个类似于图 1 所示的卡片视图。 …...

MySQL锁、加锁机制(超详细)—— 锁分类、全局锁、共享锁、排他锁;表锁、元数据锁、意向锁;行锁、间隙锁、临键锁;乐观锁、悲观锁

文章目录 一、概述1.1 MySQL锁的由来1.2 锁定义1.3 锁分类 二、共享锁与排他锁2.1 共享锁(S锁)2.2 排他锁(X锁)2.3 MySQL锁的释放 三、全局锁3.1 介绍3.2 语法3.3 特点 四、表级锁4.1 介绍4.2 表锁4.3 元数据锁(Meta D…...

如何在Java中实现文件上传和下载?

如何在Java中实现文件上传和下载? 大家好,我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编,也是冬天不穿秋裤,天冷也要风度的程序猿! 在现代Web应用程序中,文件上传和下载是常见的功能需求…...

SpringBoot使用滑动窗口限流防止用户重复提交(自定义注解实现)

在你的项目中,有没有遇到用户重复提交的场景,即当用户因为网络延迟等情况把已经提交过一次的东西再次进行了提价,本篇文章将向各位介绍使用滑动窗口限流的方式来防止用户重复提交,并通过我们的自定义注解来进行封装功能。 首先&a…...

ravynOS 0.5.0 发布 - 基于 FreeBSD 的 macOS 兼容开源操作系统

ravynOS 0.5.0 发布 - 基于 FreeBSD 的 macOS 兼容开源操作系统 ravynOS - 一个旨在提供 macOS 的精致性和 FreeBSD 的自由度的操作系统 请访问原文链接:https://sysin.org/blog/ravynos/,查看最新版。原创作品,转载请保留出处。 作者主页…...

韩国面临的本地化挑战

西方文化,尤其是美国电影、音乐和游戏,对韩国也产生了同样大的影响。众所周知,这个国家与外国产品的关系更加开放。然而,游戏在这里仍然受到审查,所以最好避免与朝鲜、日本等有关的分裂性政治主题。否则,你…...

Linux内存从0到1学习笔记(8.17 SMMU Fault调试方法)

写在前面 通过前面的介绍,我们知道了SMMU实际上是一个针对外设的MMU。它作为一个硬件IP被设备执行DMA操作时使用。 再来简单回顾下SMMU的工作流程: 外设 ---> DMA操作 ---> SMMU ---> Memory 也就是说,通常情况下驱动程序会先分配DMA Buffer ---> 然后执行S…...