【金猿CIO展】是石科技CIO侯建业:算力产业赋能,促进数字经济建设
侯建业
本文由是石科技CIO侯建业撰写并投递参与“数据猿年度金猿策划活动——2023大数据产业年度优秀CIO榜单及奖项”评选。
大数据产业创新服务媒体
——聚焦数据 · 改变商业
是石科技(江苏)有限公司成立于2021年,由国家超级计算无锡中心与盐城超级计算中心共同成立,是国家超级计算无锡中心首个产业化运营公司。是石科技以算力网络为基础、核心技术研发为内核,面向国产超算产业化需求开展平台布局与建设,为盐城超级计算中心提供全面运维服务。
盐城超级计算中心于2022年7月正式揭牌成立,是国家超级计算无锡中心的首个分中心。2023年被科技部批示“国家新一代人工智能公共算力开放创新平台(筹)”。
是石科技基于国产算力基础设施,依托国家超级计算无锡中心运维管理经验,联合清华大学、北京大学、北京航空航天大学等高校技术优势,整合超算产业链资源,打造超算一体化建设、专业运维管理、多项应用服务的“1+1+N”模式。公司面向国家重大发展战略,以人才培养为驱动,以应用发展为目标,使超算系统从高校院所的科研工具成为生产工作的强力基石。聚焦城市重点产业,围绕气候气象、人工智能、生物医药、工业互联网等领域,全面推动产业高质量发展,成为国产超算产业化领军企业,为我国十四五新基建和新时代科技发展做出突出贡献。
算力基石,国之重器
算力,是数字时代的核心资源,它如同工业时代的电力,是驱动社会进步的引擎。而强大的算力,更是国家在数字时代的核心竞争力,“神威·太湖之光”更被誉为“国之重器”。
以大数据产业应用发展为基础,与云计算、人工智能、物联网、区块链等前沿技术融合,都离不开算力的支撑。在数字化日益加速的今天,算力已经成为衡量一个国家技术实力的重要指标。算力芯片作为算力产业的核心,自美国芯片禁令发布以来,曙光、浪潮、华为等国产算力品牌面临艰难的核心技术攻关问题,同时也对国内芯片产业快速发展带来了契机。
国家级超算中心以提升国家竞争力为首要目标,国内已建成了10多家国家级超算中心。其中,国家超级计算无锡中心运营的“神威·太湖之光”是我国首台采用国产处理器构建的世界第一的超级计算机,并连续4次蝉联国际TOP500榜单第一名。在当前中美贸易战、科技战日趋加剧的时代,神威作为完全基于中国设计并打造的新系统,算力芯片采用申威26010异构众核处理器,该众核处理器采用64位自主神威指令系统,峰值性能为12.5亿亿次每秒,持续性能为9.3亿亿次每秒,核心工作频率1.5GHZ,是我国突破芯片领域“卡脖子”技术的关键成果。2021年,最新一代的神威超级计算机成为我国首台突破百亿亿次计算能力的超算,并在计算性能、能耗比等重要参数上再次实现世界第一。
超算系统结构图
目前,国家超级计算无锡中心运行模式较为成功,相比其他超算中心由研制单位派出团队联合地方政府运行的模式,国家超算无锡中心的模式主要依托科研单位(清华大学、国家实验室 ),并作为科研单位的应用和支撑平台,努力建设国产软硬件一体化生态。在建成后的5年内,科研及产业化方面硕果累累。在科研领域国家超级计算无锡中心连续两年获得了国际超算届的最高奖项"戈登·贝尔”奖,实现了中国在该领域“零”的突破;在产业化方面,其支持了20多个行业的计算模拟需求,并与多个国家级实验室建立长期业务合作。
超/智算中心赋能大数据应用
超算主要用于科学计算,在工业、工程、制造方面,主要用于航空航天、能源、结构设计等领域。随着大数据和人工智能应用的兴起,计算技术在基于数据的智能制造、个性化服务、医疗、政务、物流、交通等多种领域都显示了潜力巨大应用前景。超算也随之从科学研究和工程计算向更广泛的大数据、人工智能、社会治理和生产生活领域渗透。科学计算对于信息产业的作用,可以类比军工中的航空航天对民用制造的作用,发展科学计算带来的新技术、新方法、新需求对工业、消费领域信息技术在更集成、更高速、更高效方面起了关键性的推动作用。
在面向大数据的操作系统上,大数据的处理正在从粗放走向集约,性能、成本、功耗等多方面的约束为面向数据的系统结构设计提供了新的维度。一方面,异构众核CPU、新型存储器件、开源硬件等的出现为面向大数据的系统结构提供了新的机会;另一方面,新型应用对时延、吞吐等方面要求的不断提升对大数据的系统结构提出了新的挑战。
大数据与人工智能深度融合的时代已经来临,盐城国家级人工智能公共算力平台的建成,将为大数据处理、人工智能基础大模型研究与上层服务提供基础算力、存储和数据能力保证,确保在传统大数据应用领域以及气象气候、生物医药、能源材料等诸多传统高性能计算与人工智能相融合的新领域,能够基于已有成果积累快速开展应用服务研发部署工作,借助大规模异构算力和存储能力,在深度神经网络规模、数据集规模等方面有较大提升。
超算应用成果转化
1、“神威·太湖之光”人工智能平台
我们联合国家超算无锡中心和清华大学的科研团队共同开发了基于“神威·太湖之光”超级计算机的人工智能平台,并部署于盐城超级计算中心,其中包括人工智能专用算法库的开发、分布式机器学习、深度学习框架,大数据平台以及应用开发和部署平台等多个关键的软件模块,构成了一套完整的人工智能解决方案。
2、神威深度学习算法库 SWDNN
为支持现有深度学习算法和应用在“神威·太湖之光”上的部署基于申威异构众核处理器(SW26010),我们开发了针对卷积、矩阵乘等深度学习核心计算模块的算法库 SWDNN。利用采用计算任务划分、计算通信重叠、寄存器通信等优化技术,计算模块达到了 60% 的计算效率相比于 GPU(K40m)上的 CuDNN 算法库,可以取得 1.91-9.75 倍的双精度浮点数性能优势。
3、遥感图像分类
基于“神威·太湖之光”平台,对海量未标注遥感图像数据进行非监督分类处理,采用数据:地表覆盖遥感图像 (>10TB)算法使用了:K-means clustering、自动编码器(SAE)、卷积神经网络(CNN)。
4、大规模机器翻译
国家超级计算无锡中心联合盐城超级计算中心共同完成核高基百卡测试训练,并完成针对千万级翻译句对数据集,基于“神威·太湖之光”超级计算机,训练多层 LSTM、端到端翻译模型、基于注意力的模型,单个任务最大训练规模可达 1024 节点。
5、算力中心隐私安全平台
我们联合国家超算无锡中心和北京熠智科技有限公司共同开发了应用于算力中心的隐私计算保护平台,并部署于盐城超级计算中心。该平台面向大规模算力基础设施,用以解决分布式计算中数据、模型安全问题,促进数据、模型、算法等合规有序融合共享,维护数据提供方权益。
综上所述,算力被誉为第四次工业革命基础,大数据资源的累积是产业发展站在“巨人肩膀”上的必要条件,在人工智能应用兴起的背景下,算力与大数据相互结合,将为数字经济产业化带来巨大机遇。我们将推进超算/智算将以全新的业态产品服务于传统产业工作,助力产业经济数字化建设。
·关于侯建业:
侯建业,是石科技副总经理兼CIO,国家超算无锡中心盐城分中心副主任、国家级新一代人工智能开放平台负责人、多年互联网从业经验。主要从事大规模集群运维,国家级超算、智算平台运营,大语言模型应用和国产化适配,气候气象、航空航天等领域的模拟研发
·关于推荐企业:熠智科技
北京熠智科技有限公司是国内领先的隐私保护解决方案提供商,公司基于DataVault可控计算、Fidelius机密计算、区块链和联邦学习等技术,面向智算、金融、能源、政务和工业等领域的数据要素流通场景,提供数据、模型算法的全流程高性能隐私保护方案。其中公司自主研发产品DataVault可控计算面向大规模算力基础设施,首次开创性的应用于国内高性能计算场景,解决了分布式计算中数据、模型安全问题。结合此前熠智科技联合多家行业伙伴发布的DataVault大模型推训一体机,熠智科技具备从单机到集群大模型隐私安全保护方案的部署能力。公司拥有隐私计算、区块链相关发明专利和软件著作权百余项。
相关文章:
【金猿CIO展】是石科技CIO侯建业:算力产业赋能,促进数字经济建设
侯建业 本文由是石科技CIO侯建业撰写并投递参与“数据猿年度金猿策划活动——2023大数据产业年度优秀CIO榜单及奖项”评选。 大数据产业创新服务媒体 ——聚焦数据 改变商业 是石科技(江苏)有限公司成立于2021年,由国家超级计算无锡中心与…...
TypeScript 类
目录 1、实例 2、创建类的数据成员 3、创建实例化对象 4、完整实例 5、类的继承 6、继承类的方法重写 7、static关键字 8、instanceof运算符 9、访问控制修饰符 10、类和接口 TypeScript 是面向对象的 JavaScript。类描述了所创建的对象共同的属性和方法。支持面向对…...
Oracle分区表
文章目录 A. varchar2类型时间字段(20240102)分区实战1. 表要不要分区2. 将已经存在的表改造为分区表(时间字段,varchar2类型)3. 增加分区3.1 增加分区3.2 置换分区,不会复制索引,不要用这种语法建表,这是专门为置换分区用的3.3 分…...
【leetcode】力扣算法之旋转图像【难度中等】
题目描述 给定一个 n n 的二维矩阵 matrix 表示一个图像。请你将图像顺时针旋转 90 度。 你必须在 原地 旋转图像,这意味着你需要直接修改输入的二维矩阵。请不要 使用另一个矩阵来旋转图像。 用例 输入: matrix [[1,2,3],[4,5,6],[7,8,9]] 输出&…...
【Java集合类篇】HashMap的数据结构是怎样的?
HashMap的数据结构是怎样的? ✔️HashMap的数据结构✔️ 数组✔️ 链表 ✔️HashMap的数据结构 在Java中,保存数据有两种比较简单的数据结构: 数组和链表(或红黑树)。 HashMap是 Java 中常用的数据结构,它实现了 Map 接口。Has…...
Spring 应用合并之路(一):摸石头过河 | 京东云技术团队
公司在推进降本增效,在尝试多种手段之后,发现应用太多,每个应用都做跨机房容灾部署,则最少需要 4 台机器(称为容器更合适)。那么,将相近应用做一个合并,减少维护项目,提高…...
Android13配置selinux让system应用可读sys,proc,SN号
system权限应用读sys,proc目录及SN号 Android13预置的system应用,需要读/sys, /proc目录,读(SN)serial number号, 需要修改selinux配置,否则会报avc错. 其修改方法会比Android11复杂一些. 实现 system_app.te中添加…...
防勒索病毒攻击的关键措施
【作者】朱向东 中原银行 高级工程师 在当今数字化时代,勒索病毒成为了企业和个人面临的一项严峻威胁。勒索病毒攻击可以导致数据丢失、系统瘫痪以及经济损失。为了保护自己和组织的利益,采取一系列的防范措施是至关重要的。下面是一些关键的措施&#…...
代表团坐车 - 华为OD统一考试
OD统一考试(B卷) 分值: 100分 题解: Java / Python / C++ 题目描述 某组织举行会议,来了多个代表团同时到达,接待处只有一辆汽车可以同时接待多个代表团,为了提高车辆利用率,请帮接待员计算可以坐满车的接待方案输出方案数量。 约束: 一个团只能上一辆车,并且代表团…...
运用Jmeter进行登录测试
开始了解Jmeter,写篇关于Jmeter的博客做备忘,这里以苏宁易购网站的登录请求为例实战来说明测试计划元件,创建一个 Web 测试计划。 今天简单介绍Jemeter的入门,Jmeter 的安装这边就跳过,直接讲述如何使用JMETER,如何运用Jmeter进行测试。 a.下载jmeter软件 b.安装…...
Docker学习与应用(四)-容器数据卷
1、容器数据卷 1)什么是容器数据卷 docker的理念回顾 将应用和环境打包成一个镜像! 数据?如果数据都在容器中,那么我们容器删除,数据就会丢失!需求:数据可以持久化 MySQL,容器删…...
CentOS 7.6下HTTP隧道代理的安全性考虑
在CentOS 7.6上配置HTTP隧道代理时,安全性是一个不可忽视的重要因素。以下是对HTTP隧道代理安全性的一些关键考虑因素: 1. 加密和数据安全 使用强加密算法:确保您使用的是经过广泛认可和强化的加密算法,如AES-256-GCM。数据完整…...
Mockito+junit5搞定单元测试
目录 一、简介1.1 单元测试的特点1.2 Mock类框架的使用场景1.3 常见的Mock框架1.3.1 Mockito1.3.2 EasyMock1.3.3 PowerMock1.3.4 Testable1.3.5 比较 二、Mockito的使用2.1 导入pom文件2.2 mock对象和spy对象2.3 初始化mock/spy对象的方式2.4 参数匹配2.5 方法插桩2.6 InjectM…...
PostgreSQL获取当天、昨天、本月、上个月、本年、去年的数据
gps_time为timestamp类型日期字段 获取当天的数据 WHERE DATE_TRUNC(day, gps_time) CURRENT_DATE --或 WHERE DATE(gps_time) CURRENT_DATE获取昨天的数据 WHERE DATE_TRUNC(day, gps_time) CURRENT_DATE - INTERVAL 1 day获取本月的数据 WHERE DATE_TRUNC(month, gps_…...
XCTF:stage1[WriteUP]
从题目中下载到图片: 考虑图片是png,隐写方式有可能是高宽修改,也可能是色相隐藏,色彩通道位隐藏等等 使用stegsolve对图片进行一下伽马、颜色转换 在图片的左上角就显示出了一个二维码 使用QR_Rresearch工具对二维码扫描 获得一…...
STM32CubeMX教程13 ADC - 单通道转换
目录 1、准备材料 2、实验目标 3、ADC概述 4、实验流程 4.0、前提知识 4.1、CubeMX相关配置 4.1.1、时钟树配置 4.1.2、外设参数配置 4.1.3、外设中断配置 4.2、生成代码 4.2.1、外设初始化调用流程 4.2.2、外设中断调用流程 4.2.3、添加其他必要代码 5、常用函数…...
矩阵的乘法
首先矩阵的乘法定义如下: #include <stdio.h> int main() { int i 0; int j 0; int arr[20][20] { 0 }; int str[20][20] { 0 }; int s[20][20] { 0 }; int n1 0; int n2 0; int m2 0; int z 0; int m1 0;…...
python爬取招聘网站数据
这段代码是使用Selenium自动化测试模块进行网页爬取的示例代码。它通过模拟人的行为在浏览器中操作网页来实现爬取。具体的流程如下: 导入所需的模块,包括Selenium、时间、随机、csv等模块。打开浏览器,创建一个Chrome浏览器实例。设置要爬取…...
灌区信息化方案(什么是现代化灌区,如何一步到位)
一、系统概述 详情:https://www.key-iot.com.cn/ 本灌区信息化方案以星创易联公司的各类智能设备为基础,通过其产品完成水文、雨情、土壤等多源异构数据的采集,以无线自组网的方式实现数据传输,并在后台管理中心建立信息化软件平台,对数据进行融合处理。系统实现对…...
jmeter自动录制脚本功能
问题排查: 建议用 google浏览器; 重启一下jmeter; 过滤规则重新检查下; 看下代理设置是否正常; 注意:下面的的过滤设置中 用的都是正则表达式的规则。...
十一、工具盒类(MyQQ)(Qt5 GUI系列)
目录 编辑 一、设计需求 二、实现代码 三、代码解析 四、总结 一、设计需求 抽屉效果是软件界面设计中的一种常用形式,可以以一种动态直观的方式在有限大小的界面上扩展出更多的功能。本例要求实现类似 QQ 抽屉效果。 二、实现代码 #include "dialog.…...
postgresql 查询字段 信息
SELECT base.“column_name”, col_description ( t1.oid, t2.attnum ), base.udt_name, COALESCE(character_maximum_length, numeric_precision, datetime_precision), (CASE WHEN ( SELECT t2.attnum ANY ( conkey ) FROM pg_constraint WHERE conrelid t1.oid AND contyp…...
antv/x6_2.0学习使用(四、边)
一、添加边 节点和边都有共同的基类 Cell,除了从 Cell 继承属性外,还支持以下选项。 属性名类型默认值描述sourceTerminalData-源节点或起始点targetTerminalData-目标节点或目标点verticesPoint.PointLike[]-路径点routerRouterData-路由connectorCon…...
C++ stack用法总结
std::stack 是 C 标准模板库(STL)中的容器适配器,它提供了栈(stack)的功能,基于其他序列容器实现。以下是 std::stack 的用法总结: 包含头文件: #include <stack>创建 std::…...
【大数据进阶第三阶段之Datax学习笔记】阿里云开源离线同步工具Datax概述
【大数据进阶第三阶段之Datax学习笔记】阿里云开源离线同步工具Datax概述 【大数据进阶第三阶段之Datax学习笔记】阿里云开源离线同步工具Datax快速入门 【大数据进阶第三阶段之Datax学习笔记】阿里云开源离线同步工具Datax类图 【大数据进阶第三阶段之Datax学习笔记】使用…...
PHP 基础编程 2
文章目录 时间函数dategetdatetime 使用数组实现登录注册和修改密码简单数组增加元素方法修改元素方法删除元素方法 具体实现方法数组序列化数组写入文件判断元素是否在关联数组中(登录功能实现)实现注册功能实现修改admin用户密码功能 时间函数 时区&am…...
git merge origin master 和 git merge origin/master 的区别
git merge origin master和git merge origin/master的区别 1. git checkout dev 2. git fetch origin master 3. git merge origin release 把 origin/master,heads/release merge到 heads/dev1. git checkout dev 2. git fetch origin master 3. git me…...
数据挖掘 模糊聚类
格式化之前的代码: import matplotlib.pyplot as plt#绘图 import pandas as pd#读取数据集 from sklearn.preprocessing import scale from sklearn.cluster import DBSCAN#聚类 from sklearn import preprocessing#数据预处理的功能,包括缩放、标准化…...
Vue2和Vue3各自的优缺点以及区别对比
Vue2和Vue3各自的优缺点以及区别对比 Vue2的优点: 成熟稳定:Vue2是一个经过长时间发展和测试的成熟版本,广泛应用于各种项目中。 生态系统丰富:由于Vue2的流行程度,它的生态系统相对较为完善,有大量的插件…...
手写一个加盐加密算法(java实现)
目录 前言 什么是MD5?? 加盐算法 那别的人会不会跟你得到相同的UUID? 如何使用盐加密? 代码实现 前言 对于我们常见的登录的时候需要用到的组件,加密是一个必不可少的东西,如果我们往数据库存放用户…...
外贸企业公司网站建设/可以做产品推广的软件有哪些
新的一年又开始了 2010年 祝大家新年快乐! 加油,加油,加油--- 2009年12月31日23:59:59 转载于:https://www.cnblogs.com/meiqunfeng/archive/2009/12/31/1637235.html...
wordpress怎么设置页面导航/营销渠道管理
一 GTID的介绍 GTID是一个基于原始mysql服务器生成的一个已经被成功执行的全局事务ID,它由服务器ID以及事务ID组合而成。这个全局事务ID不仅仅在原始服务器器上唯一,在所有存在主从关系 的mysql服务器上也是唯一的。正是因为这样一个特性使得mysql的主从…...
个人做加盟商机网站如何盈利/google chrome网页版
实验原理:内核:内核是整个操作系统的最底层,它负责了整个硬件的驱动以及提供了各种系统所需的内核功能,包括防火墙机制,是否支持LVM或Quota文件系统,以及进程和内存管理和通信功能。其实内核就是系统上面的…...
江门专业做网站/网盟推广平台
先导入jia包 驱动jar包 druid的Jar包 写配置文件 定义配置文件(手动加载) 名称:自定义路径:自定义封装工具类代码 package com.lingaolu.dataSource;import com.alibaba.druid.pool.DruidDataSourceFactory;import javax.sql.Data…...
龙之向导外贸网站怎么样/贺州seo
最近有同事需求,作的专题需要一个投票功能,商讨后看了下社区的投票代码,感慨良多,决定用redis做一个单纯的投票数据处理,以方便后续对社区投票的修改 所以功能就很简单,不考虑选项,内容等存储&a…...
公司怎么找做网站/网站seo优化培训
babel本地编辑环境搭建 今天讲的是babel搭建本地环境,众所周知,现如今,javascript已经发布了es7版本,但是目前环境大多数只能支持到es5,连nodejs也不能完全支持es6,es7。今天将的babel能将我们写的es6&…...