智算时代的基础设施如何实现可继承可演进?浪潮云海发布 InCloud OS V8 新一代架构平台
从 2023 年开始持续火爆的 AIGC 正在加速落地应用,为全行业带来生产生活效率的变革与升级。面对数字化转型与智能化转型,对于技术团队来说,既要根据业务与 AI 应用去部署以云为基础的 AI 算力,又要与已有数据和系统(甚至是遗留的虚拟机环境)协同去发挥和实现 AI 价值,这其中的异构算力、复杂的工程化工作,可能反而会造成新的烟囱式系统,以及 AI 算力资源的浪费。此外,运维团队面临“新旧相融”的难题,即新旧应用无法平滑衔接、统一管理,新旧IT资产无法无缝相容、统一调度。
更加灵活的智算时代,云基础设施需要可继承、可演进
当前很多企业的云平台采用IaaS、PaaS和SaaS紧耦合的架构,各模块之间难以解耦,设备微调就必须从上至下重新适配,牵一发而动全身,无法快速响应新技术的演进升级。
针对时下 AI 大模型爆发,对基础设施算力性能、灵活性以及成本的需求,浪潮云海提出了“可继承、可演进”的私有云理念。其中可继承即私有云建设要能够继承过去的IT资产和运维能力,包括客户数据中心的硬件、软件等大量基础设施,长年累月的信息化和数字化投资等资产,还包括知识经验、人员组织和流程体系等IT运维能力。
而可演进即面向日趋增强的技术不确定性,私有云要具备持续进化的能力,以满足日益增长的创新应用需求。架构可演进,指云平台整体框架具备升级、演进的能力。从提供基础的虚拟机、存储、网络服务到全栈服务(数据库、中间件、大数据、AI 等);从最小 3 节点小规模平滑扩容到大规模;从单中心扩大到多中心统一管理(多分支统一管理、云边协同);从单一 CPU 架构扩展到多 CPU 架构,从通用算力扩展到 AI 算力等。能力可演进,指人和组织能力的演进。业务应用层面,从传统架构到微服务、云原生架构演进;运维能力从传统的人肉运维,到半自动、全自动 AIops 运维;业务可靠性从单点单中心可靠,到多中心高可靠。

具体从存储、计算、服务、应用四层来说,具备可演进能力的私有云需要具备三大特征:分层解耦、开放标准和一云多芯,可以实现在异构算力需求下各层可形成共识标准,并独立演进迭代。具体来说:
一、在存储层,实现多协议融合,广泛兼容 ISCSI、iSER、NVME over RoCE、FC、FC-NVMe 等主流存储协议,实现各主流品牌存储的兼容利旧;业务创新,支持同品牌或不同品牌、集中式存储或分布式存储间的跨站点容灾。
二、在计算层的一云多芯,充分考虑底层算力设施框架的灵活性,同时支持多类型计算资源,不同的应用匹配不同的计算资源。另外跨算力共享的存储池和网络池,减少网络转发路径,降低建设成本与维护成本。
三、在服务层,浪潮数据云计算方案总监刘健表示,在实际数据中心部署中,行业云中 IaaS 层已分层解耦,但 PaaS 层仍有被云厂商或应用提供商锁定的情况。浪潮云海提出服务层分层共建,其中 PaaS 层通用能力下沉,以容器技术为核心构建敏捷的云原生 iPaaS 底座,满足服务标准化、多样性需求。另外联合共建个性化的能力,个性化能力可以上移,强行业属性的应用交给专业公司共建,实现一云多库、一云多服。
四、在应用层则是开放生态的技术框架和理念,从规划、到方案、集成、交付、售后,全面联合各类生态伙伴,实现行业数字化转型。
浪潮云海 InCloud OS V8 新一代架构平台,实现 IT 资源可继承、可演进
基于可继承可演进的核心理念,浪潮云海发布了新一代架构平台——InCloud OS V8,其产品能力与四层可参考架构一一对应,支撑可演进需求:
- 存储层:文件系统,存储多协议,支持 NVMe-OF,支持 ISCSI,支持私有协议、容灾、备份、安全等,屏蔽底层存储;
- 计算层:一云多芯管理、等价算力调度、AI 智算能力、算力标准化、资源可扩展性;
- 服务层:1、对底层资源的便捷供给,2、工具化能力,在云平台上基于标准模板发布 PaaS 服务,快速嵌入云平台,3、上层管理平台,对日志、监控、运维、用户统一管理;
- 应用层:则是以第三方伙伴服务为主。
浪潮云海根据服务客户的实践经验,总结形成了分布式云、容灾备份、安全云、云替换、智算中心、云原生六大场景解决方案,基本满足了各类应用场景对底层基础设施的需求。具体来看,
- 分布式云解决方案:面向多分支机构场景,满足多级云(省市多级云、集团分支多级云)、异构云、多厂商云、云边(中心云、边缘云)统一管理需求。
- 容灾备份解决方案:面向两地三中心场景,满足客户业务对高可靠的要求,可提供本地备份、同城双活、异地灾备等服务。
- 安全云解决方案:面向安全合规场景,提供满足各类安全测评标准的服务套餐。
- 云替换解决方案:为 VMware 替换、公有云下云等场景提供跨云迁移方案。
- 智算中心解决方案:面向智算中心场景,提供 GPU 整机租赁、AI 开发、AI 训练、大数据等服务,支撑智算中心算力运营。打造从基础设施、算法工具、智能平台到模型服务的 AI 赋能产业生态
- 云原生解决方案:面向以容器技术为支撑的云原生创新应用场景提供开发测试、微服务治理、DevOps 解决方案,方便业务云原生转型,是推动企业数字化转型的最佳工具。
从大模型落地带来实效,到多元算力需求下智算基础设施的发展,智算时代正在真实到来。灵活、高效的算力资源,将是一切智能化发展的基础,CSDN 将持续关注智算技术领域的最新资讯。
相关文章:
智算时代的基础设施如何实现可继承可演进?浪潮云海发布 InCloud OS V8 新一代架构平台
从 2023 年开始持续火爆的 AIGC 正在加速落地应用,为全行业带来生产生活效率的变革与升级。面对数字化转型与智能化转型,对于技术团队来说,既要根据业务与 AI 应用去部署以云为基础的 AI 算力,又要与已有数据和系统(甚…...
LDF、DBC、BIN、HEX、S19、BLF、ARXML、slx等
文章目录 如题 如题 LDF是LIN报文格式文件,把这个直接拖到软件里面,可以发报文和接收报文 DBC是CAN报文格式文件,把这个直接拖到软件里面,可以发报文和接收报文 BIN文件烧录在BOOT里面(stm32),…...
因为使用ArrayList.removeAll(List list)导致的机器重启
背景 先说一下背景,博主所在的业务组有一个核心系统,需要同步两个不同数据源给过来的数据到redis中,但是每次同步之前需要过滤掉一部分数据,只存储剩下的数据。每次同步的数据与需要过滤掉的数据量级大概在0-100w的数据不等。 由…...
Let‘s Encrypt
创建文件夹 mkdir /usr/local/develop/ 安装Certbot客户端 yum install certbot 首先确保example.com和www.example.com这两个域名通过DNS解析绑定了你的web 服务器的公网 IP 就是说先要完成域名解析到服务器 下面命令会验证 /var/www/example 他会将一些命令文件存在…...
C语言 | Leetcode C语言题解之第24题两两交换链表中的节点
题目: 题解: struct ListNode* swapPairs(struct ListNode* head) {struct ListNode dummyHead;dummyHead.next head;struct ListNode* temp &dummyHead;while (temp->next ! NULL && temp->next->next ! NULL) {struct ListNod…...
【LeetCode热题100】【回溯】电话号码的字母组合
题目链接:17. 电话号码的字母组合 - 力扣(LeetCode) 组合的过程是一个长树的过程,可以用深度遍历实现,每一个数字对应的字符串都是一层,一种字母组合就是一条路径,当递归的深度达到层数就找到了…...
解析mysql的DDL语句生成高斯内表及表字段主键配置
mysql的DDL语句如下: CREATE TABLE gg_zr (id bigint(20) NOT NULL COMMENT 责任信息表主键id,zrdm varchar(32) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT 责任代码,zrmc varchar(64) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci DEFAU…...
ANSYS Electromagnetics Suite 2023 R2 三维电磁(EM)仿真软件下载
Ansys家最新的三维电磁(EM)仿真软件ANSYS Electromagnetics Suite 2023 R2日前发布了,老wu这次分享得有点晚  ̄ω ̄,现在已经将资源上传到了网盘供大家免费下载,同时,为了让大家都能与…...
pbootcms百度推广链接打不开显示404错误页面
PbootCMS官方在2023年4月21日的版本更新中(对应V3.2.5版本),对URL参数添加了如下判断 if(stripos(URL,?) ! false && stripos(URL,/?tag) false && stripos(URL,/?page) false && stripos(URL,/?ext_) false…...
springboot 整合 swagger2
整合步骤 pom 添加依赖 <dependency><groupId>io.springfox</groupId><artifactId>springfox-swagger2</artifactId><version>2.9.2</version></dependency><dependency><groupId>io.springfox</groupId>&…...
redis-缓存穿透与雪崩
一,缓存穿透(查不到) 在默认情况下,用户请求数据时,会先在缓存(Redis)中查找,若没找到即缓存未命中,再在数据库中进行查找,数量少可能问题不大,可是一旦大量的请求数据&a…...
K8S临时存储-本地存储-PV和PVC的使用-动态存储(StorageClass)
介绍 容器中的文件在磁盘上是临时存放的,当容器崩溃或停止时容器上面的数据未保存, 因此在容器生命周期内创建或修改的所有文件都将丢失。 在崩溃期间,kubelet 会以干净的状态重新启动容器。 当多个容器在一个 Pod 中运行并且需要共享文件时…...
jeecg-boot安装
我看大家都挺关注,所以集中上传了下代码和相关工具,方便大家快速完成 链接:https://pan.baidu.com/s/1-Y9yHVZ-4DQFDjPBWUk4-A 提取码:op1r 1. 下载代码 下载地址 : JEECG官方网站 - 基于BPM的低代码开发平台(低代码平台_零代…...
Unity面经(自整)——移动开发与Shader
Unity与Android混合开发 为什么使用Flutter构建 Flutter 是 Google 的开源工具包,用于从单个代码库为移动、Web、桌面和嵌入式设备构建应用程序(一套代码跨平台构建app是它最大的优点),并且可以构建高性能、稳定和丰富UI的应用程…...
Nginx实现反向代理、负载均衡、动静分离
1. 什么是Nginx的反向代理? Nginx的反向代理是指Nginx作为服务器的前端,接收客户端的请求,然后将请求转发给后端的真实服务器,并将真实服务器的响应返回给客户端。这种代理方式使得客户端并不知道真实服务器的存在,它…...
【Linux】网络基础(一)
文章目录 一、计算机网络背景1. 网络发展2. 认识“协议” 二、网络协议初识1. 协议分层2. OSI七层模型3. TCP/IP五层(或四层)模型 三、网络传输基本流程1. 同局域网的两台主机通信数据包封装和分用封装分用 2. 跨网络的两台主机通信 四、网络中的地址管理…...
前端小白学习Vue框架(二)
一.属性计算、属性监听、属性过滤 1.认识MVVM V (用户视图界面)通过VM (应用程序) 向Model(数据模型) 取值与赋值的过程! 数据双向绑定 视图改变更新数据,数据改变更新视图 2.属性计算 //在vue实例中通过computed去计算new …...
飞书api增加权限
1,进入飞书开发者后台:飞书开放平台 给应用增加权限 2,进入飞书管理后台 https://fw5slkpbyb3.feishu.cn/admin/appCenter/audit 审核最新发布的版本 如果还是不行,则需要修改数据权限,修改为全部成员可修改。 改完…...
CSS3 平面 2D 变换+CSS3 过渡
个人主页:学习前端的小z 个人专栏:HTML5和CSS3悦读 本专栏旨在分享记录每日学习的前端知识和学习笔记的归纳总结,欢迎大家在评论区交流讨论! 文章目录 ✍一、CSS3 平面 2D 变换💎1 坐标轴💎2 transform 语法…...
【Jenkins】Jenkins自动化工具介绍
目录 技术背景常规的手动打包步骤 Jenkins简介起源与发展Jenkins的核心价值1.自动化1.1代码构建1.2测试自动化1.3自动部署 2.持续集成与持续部署CI/CD的概念如何减少集成问题更快速地发布软件版本 Jenkins优势Jenkins的主要竞争对手Travis CI:CircleCI:GitLab CI: Jenkins与其他…...
Chapter03-Authentication vulnerabilities
文章目录 1. 身份验证简介1.1 What is authentication1.2 difference between authentication and authorization1.3 身份验证机制失效的原因1.4 身份验证机制失效的影响 2. 基于登录功能的漏洞2.1 密码爆破2.2 用户名枚举2.3 有缺陷的暴力破解防护2.3.1 如果用户登录尝试失败次…...
TRS收益互换:跨境资本流动的金融创新工具与系统化解决方案
一、TRS收益互换的本质与业务逻辑 (一)概念解析 TRS(Total Return Swap)收益互换是一种金融衍生工具,指交易双方约定在未来一定期限内,基于特定资产或指数的表现进行现金流交换的协议。其核心特征包括&am…...
数据库分批入库
今天在工作中,遇到一个问题,就是分批查询的时候,由于批次过大导致出现了一些问题,一下是问题描述和解决方案: 示例: // 假设已有数据列表 dataList 和 PreparedStatement pstmt int batchSize 1000; // …...
有限自动机到正规文法转换器v1.0
1 项目简介 这是一个功能强大的有限自动机(Finite Automaton, FA)到正规文法(Regular Grammar)转换器,它配备了一个直观且完整的图形用户界面,使用户能够轻松地进行操作和观察。该程序基于编译原理中的经典…...
return this;返回的是谁
一个审批系统的示例来演示责任链模式的实现。假设公司需要处理不同金额的采购申请,不同级别的经理有不同的审批权限: // 抽象处理者:审批者 abstract class Approver {protected Approver successor; // 下一个处理者// 设置下一个处理者pub…...
AirSim/Cosys-AirSim 游戏开发(四)外部固定位置监控相机
这个博客介绍了如何通过 settings.json 文件添加一个无人机外的 固定位置监控相机,因为在使用过程中发现 Airsim 对外部监控相机的描述模糊,而 Cosys-Airsim 在官方文档中没有提供外部监控相机设置,最后在源码示例中找到了,所以感…...
ThreadLocal 源码
ThreadLocal 源码 此类提供线程局部变量。这些变量不同于它们的普通对应物,因为每个访问一个线程局部变量的线程(通过其 get 或 set 方法)都有自己独立初始化的变量副本。ThreadLocal 实例通常是类中的私有静态字段,这些类希望将…...
Tauri2学习笔记
教程地址:https://www.bilibili.com/video/BV1Ca411N7mF?spm_id_from333.788.player.switch&vd_source707ec8983cc32e6e065d5496a7f79ee6 官方指引:https://tauri.app/zh-cn/start/ 目前Tauri2的教程视频不多,我按照Tauri1的教程来学习&…...
李沐--动手学深度学习--GRU
1.GRU从零开始实现 #9.1.2GRU从零开始实现 import torch from torch import nn from d2l import torch as d2l#首先读取 8.5节中使用的时间机器数据集 batch_size,num_steps 32,35 train_iter,vocab d2l.load_data_time_machine(batch_size,num_steps) #初始化模型参数 def …...
基于小程序老人监护管理系统源码数据库文档
摘 要 近年来,随着我国人口老龄化问题日益严重,独居和居住养老机构的的老年人数量越来越多。而随着老年人数量的逐步增长,随之而来的是日益突出的老年人问题,尤其是老年人的健康问题,尤其是老年人产生健康问题后&…...
