当前位置: 首页 > news >正文

重工业数字化转型创新实践:某国家特大型钢铁企业如何快速落地基于实时数仓的数据分析平台

使用 TapData,化繁为简,摆脱手动搭建、维护数据管道的诸多烦扰,轻量替代 OGG, Kettle 等同步工具,以及基于 Kafka 的 ETL 解决方案,「CDC + 流处理 + 数据集成」组合拳,加速仓内数据流转,帮助企业将真正具有业务价值的数据作用到实处,将“实时数仓”方法论落进现实。

TapData 持续迭代产品能力,优化用户体验的同时,也在不断探索各行各业数据需求的底层逻辑,力求为行业用户提供更加简洁、更具针对性的解题思路。本期内容便是我们在钢铁行业做出的实践以及展望。

当下,随着 5G、云计算、大数据、人工智能、工业互联网等新一代信息技术的加速应用,并逐渐被现行工业体系吸纳、消化、融合,重工业不再仅仅是传统意义上的钢铁洪流与机器轰鸣,而是融入了智能化、绿色化、数字化的全新面貌,日益涌现出新业态和新模式。

其中,钢铁行业作为重工业的重要支柱,正在经历深刻的变革。向前追溯,新中国成立伊始,确立了以钢铁为代表的重工业优先发展战略。“一五”时期,中国钢铁工业提出了“三大、五中、十八小”的战略布局,推动了一批重点钢铁基地的建设,为国家工业化进程奠定了坚实的基础。此后,钢铁行业伴随着中国经济的飞速发展而不断壮大,已从高速发展阶段进入高质量发展阶段,产业结构性调整、提升空间放大。

然而,传统的生产运营方式的逐渐暴露出瓶颈,既有高能耗、高排放的挑战,又遇管理流程复杂、跨部门协作不畅、信息孤岛、决策效率低等问题,逐渐难以适应现代化的发展需求,行业亟需转型升级。为此,钢铁企业纷纷布局数据中心、智能化生产线和工业互联网平台,迈向新的发展阶段。类似的数字化转型不仅局限于生产过程,还扩展到了供应链、物流等多个领域,持续打通数据壁垒,实现跨部门的协同和智能化运营。

本期案例便将聚焦于某国家特大型钢铁企业(以下简称“某钢”)的数字化创新实践。

一、客户背景:系统复杂,数据源多样,数据整合难

成立于二十世纪五十年代,某钢身为钢铁工业的老牌企业,产业链、生态圈不断健全,企业高质量发展的步伐越迈越大、越迈越矫健。面对新时代对于重工业发起的挑战与召唤,某钢围绕“一切业务数字化、一切数字业务化”的转型思路,打造企业竞争新优势。积极通过数字化手段,端到端的全面数据资产整合,打破数据壁垒,实现从采购、生产、销售等各业务环节全要素、全流程、全价值链的集成,提升企业运营管理效率。

作为转型过程中的核心驱动力,数据资源的高效整合与利用成为了钢铁行业升级的关键,也是某钢在实践中面临的主要挑战。
在这里插入图片描述在国内外市场布局的不断加深中,某钢的业务也迅速扩展,覆盖范围和规模持续扩大。尤其是在新的数字化转型的关键阶段,智能供应链管理、生产线优化、个性化定制、全球销售分析、实时财务监控以及 ESG 监控等需要消费数据资源的业务场景越来越多,而且对数据的实时性、准确性和可用性提出了更高的要求。

随着供应链管理、生产线监控和销售分析等关键业务流程的智能化升级,这些系统需要即时获取最新的生产数据、库存状况和市场反馈,以便快速做出响应和决策。尤其是在面对复杂的多并发查询、跨系统数据整合以及多业务系统的协同运作时,数据的实时同步变得至关重要。如果无法在短时间内实现数据的精准同步和汇总,业务响应的滞后将直接影响生产效率和市场竞争力。

一方面,某钢内部系统复杂,数据源种类多,面对愈加旺盛的数据需求,需要有效提升数据整合效率;另一方面,历史方案中选用的实时数据同步工具,有一定的学习门槛,对技术人员要求较高,能力无法跟上需求变化,易用性差,排错麻烦。

与此同时,某钢的历史数仓方案是以 Hive 为数据处理底座,而 Hive 作为批处理引擎,擅长离线数据处理,但在实时性要求较高的业务场景中往往表现不佳。而随着业务需求的增加,尤其是在面对复杂查询和多并发场景时,Hive 的响应速度逐渐显露出瓶颈,无法满足实时数据分析和处理的需求。这导致系统在处理大规模实时数据时效率低下,延迟明显。为解决这些问题,亟需引入更适合实时处理的解决方案,以提高系统的响应速度和数据处理能力。

与这样的数仓迁移需求相伴,为确保整个数据链路的流畅运行,选择更加合适的实时数据同步工具的需求也更加迫切。基于这些考量,某钢决定引入 Apache Doris 作为新一代数仓引擎,将现有数仓架构逐步迁移上去,并选择 TapData 来承担实时数据复制和集成部分的工作,希望借助二者出色的低延迟能力和高性能处理,解决现有架构中遇到的诸多问题,提升整体数据处理的实时性和性能。

二、解决方案:TapData + Doris,构建高效、实时的企业级数据分析平台

主要场景

  • 数据源:Doris、MySQL、SQL Server、Oracle、DB2、DWS,Hudi、Hive 等
  • 业务系统:ERP、OA、MES 等
  • 成果反馈:已上线生产链路约 20+ ,运行状况稳定,性能表现良好

在这里插入图片描述① Doris:高性能实时分析的核心引擎

作为数仓迁移的目标平台,Doris 凭借其 MPP 架构和列式存储,能够在复杂查询和高并发请求下提供卓越的性能。其高效的数据压缩技术和向量化执行引擎,使得 Doris 在处理大规模数据时可以显著降低延迟,快速响应查询请求。Doris 支持实时数据写入,这对于需要增量更新和实时数据处理的场景尤为重要。通过 Doris,某钢能够从根本上解决当前数仓方案所面临的批处理滞后和查询延迟问题,进一步提升业务数据的时效性和决策的实时性。

此外,Doris 的内置多维分析能力,为某钢提供了在不同业务维度上快速执行复杂查询的可能,极大提升了数据分析的效率。无论是生产系统的实时监控,还是跨部门业务的综合分析,Doris 都能提供及时准确的数据支持。

② TapData:高效的数据同步与集成平台
在这里插入图片描述为了保障数据在迁移过程中以及新架构上线后的平稳流转,TapData 扮演了关键的角色。作为一款支持多源异构数据库同步的集成平台,TapData 能够无缝连接现有的 ERP、OA、MES 等业务系统中的 MySQL、SQL Server、Oracle 和 DB2 数据库,确保各个系统间的数据同步顺畅、高效。TapData 的核心优势在于其 0 侵入式 集成能力,无需对现有系统进行大幅改动即可实现数据的实时同步,极大减少了迁移过程中的风险和工作量。

TapData 不仅能够解决传统同步工具在易用性和性能上的短板,其内置的自动化任务管理功能和可视化操作界面,降低了数据同步的复杂性,缩短了实施周期。对于某钢这样的大型企业来说,TapData 帮助他们快速构建了一条灵活、易于扩展的数据通道,实现了历史数据和实时数据的无缝融合。

③ 高效实时的数据链路

在实际操作中,TapData 实现了来自 MySQL、SQL Server、Oracle 等数据源的实时数据采集,并将这些数据同步至 Doris 等数据目标的过程中保持了数据的一致性与完整性。通过对数据流进行统一管理,TapData 能够根据业务需求动态调整数据同步的频率和模式,确保在多系统环境中实现跨部门、跨平台的数据流通和共享。

这种灵活性使得某钢不仅能够完成从历史方案的顺利迁移,还可以在未来的扩展中应对不断变化的业务需求。此外,Doris 的实时处理和分析能力,使得数据一旦同步到位,便可以立即进行处理和分析,极大缩短了数据的决策路径。

④ 未来扩展:弹性可扩展架构

随着业务的不断发展,某钢的数据量和数据处理需求将持续增长。Doris 和 TapData 的组合为企业提供了强大的扩展性。Doris 的分布式架构支持动态扩展存储和计算资源,能够轻松应对数据量的爆炸式增长。与此同时,TapData 的模块化设计允许企业根据需求快速添加新的数据源或目标端,无需中断现有的数据链路。

⑤ 方案优势总结

TapData + Doris 的数据方案的逐步上线,为某钢的数智化转型带来:

  • 高效的数据同步能力:TapData 实现了异构数据库之间的高效同步,保证了系统间数据的一致性和实时性。
  • 强大的实时分析功能:Doris 的高性能和低延迟特性,使得某钢能够进行快速的实时数据查询和多维分析。
  • 易用的操作和维护:TapData 提供了简单的配置界面和全方位的任务监控,减少了运维难度,提升了系统的可维护性。
  • 弹性的扩展架构:Doris 和 TapData 均具备弹性扩展能力,能够应对未来业务增长带来的数据量增加和处理需求的变化。

通过这一数据方案,某钢不仅解决了现有系统的性能瓶颈和实时性问题,还为未来的数字化转型和智能制造提供了坚实的数据基础。今后,TapData 也将持续挖掘实时数据在重工业的实用性价值,为从业者提供更多运营灵感,帮助更多企业应对数据管理的复杂性。

推荐阅读】:

  • 制造业数字化转型创新思路 |《数智新时代制造业数字化创新实践白皮书》上线!
  • TapData 信创数据源 | 国产信创数据库 OceanBase数据同步指南,加速国产化进程,推进自主创新建设
  • TapData 信创数据源 | 国产信创数据库 TiDB数据迁移指南,加速国产化进程,推进自主创新建设
  • TapData 信创数据源 |国产信创数据库达梦(Dameng)数据迁移指南,加速国产化进程,推进自主创新建设
  • ETL vs. ELT:数据集成的最佳实践是什么?

相关文章:

重工业数字化转型创新实践:某国家特大型钢铁企业如何快速落地基于实时数仓的数据分析平台

使用 TapData,化繁为简,摆脱手动搭建、维护数据管道的诸多烦扰,轻量替代 OGG, Kettle 等同步工具,以及基于 Kafka 的 ETL 解决方案,「CDC 流处理 数据集成」组合拳,加速仓内数据流转,帮助企业…...

【linux】手动启动sshd

安装openssh-server修改配置文件启动 以下是在常见的Linux系统中手动开启sshd服务的步骤: 1.安装openssh-server CentOS/RHEL系统 首先,以具有管理员权限的用户(通常是root)登录到系统。检查sshd服务是否已经安装。可以使用以…...

前端项目【本科期间】

1.基于博达网站群的申达办官方网站开发与维护 实习项目:校发展规划中心暨申请更名大学办公室官方网站 技术栈:HTML/CSS/Javascript 博达网站群的入门级指南 -CSDN博客博达网站群的入门级指南 -CSDN博客 网上少的较全的基于博达网站建设指南,CSDN相关内容综合指数NO有.1 …...

深度学习中的学习率调度:循环学习率、SGDR、1cycle 等方法介绍及实践策略研究

深度学习实践者都知道,在训练神经网络时,正确设置学习率是使模型达到良好性能的关键因素之一。学习率通常会在训练过程中根据某种调度策略进行动态调整。调度策略的选择对训练质量也有很大影响。 大多数实践者采用一些广泛使用的学习率调度策略,例如阶梯式衰减或余弦退火。这些…...

Python毕业设计-基于 Python flask 的前程无忧招聘可视化系统,Python大数据招聘爬虫可视化分析

博主介绍:✌Java徐师兄、7年大厂程序员经历。全网粉丝13w、csdn博客专家、掘金/华为云等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专栏推荐订阅👇🏻 不…...

Linux初阶——线程(Part1)

一、线程概念 1、如何理解线程 说到线程,那么我们就要回到进程了。 1.1. 再谈进程 对一个进程来说,它在内存中是这样的: 图1.1-a 其中一个 task_struct 独享一个进程地址空间和一个页表。 而线程其实和进程差不多,是这样的&…...

SpringBoot后端开发常用工具详细介绍——flyway数据库版本控制工具

文章目录 什么是flyway简介为什么要使用flyway 流程介绍整合springboot添加pom文件配置flyway向resource/db/migration添加sql文件 注意事项1. 迁移报错2. 迁移顺序 参考 什么是flyway 简介 为什么要使用flyway 我们在开发时往往会有这样一种情况: 进行软件开发…...

CSS揭秘:7. 伪随机背景

前置知识:CSS 渐变,5. 条纹背景,6. 复杂的背景图案 前言 本篇主要内容依然是关于背景的,无限平铺的背景会显得整齐美观,但又有些呆板,如何实现背景的多样性和随机性,是本篇的核心。 一、四种颜…...

SAP CODE DEMO:查找AL11 指定路径下文件中的内容

有时候需要查找某个具体的内容,在哪个文件内。数据量大的时候可以利用程序查找 选择界面: 路径,和文件名都可以模糊搜查 search string:你要查找的信息。 代码参考如下: report z00R010 NO STANDARD PAGE HEADING…...

【华为HCIP实战课程二十四】中间到中间系统协议IS-IS配置实战,网络工程师

一、IS-IS整体架构 将Level-1路由器部署在非骨干区域,Level-2路由器和Level-1-2路由器部署在骨干区域。 每一个非骨干区域都通过Level-1-2路由器与骨干区域相连! 1、在IS-IS中,每个链路可以属于不同的区域,OSPF中每个链路属于同一个区域 2、在IS-IS中,单个区域没有物理…...

【工具】新手礼包之git相关环境包括中文的一套流程{收集和整理},gitlab的使用

【工具】新手礼包之git相关环境包括中文的一套流程{收集和整理} git Git 详细安装教程(详解 Git 安装过程的每一个步骤) TortoiseGit 【TortoiseGit】TortoiseGit安装和配置详细说明...

篇章十一 打包构建工具

文章目录 一、gulp1. 流2. gulp 的作用3. gulp 的安装、检测和卸载 二、webpack1. 打包样式资源2. 打包 html 资源3. 打包图片资源4. 压缩 html 代码5. 生产环境基本配置 三、vite 打包构建工具,都是依赖于 node 环境进行开发,底层封装的内容就是 node 里…...

青少年编程与数学 02-002 Sql Server 数据库应用 06课题、数据库操作

青少年编程与数学 02-002 Sql Server 数据库应用 06课题、数据库操作 课题摘要:一、数据库的文件组成二、系统数据库三、创建数据库四、数据库配置1. 修改数据库文件大小和增长设置2. 添加或移除数据文件3. 设置数据库选项4. 配置数据库的恢复模型5. 管理数据库的访问权限6. 使…...

MacOS下载安装Logisim(图文教程)

本章教程主要介绍如何在MacOS系统中安装Logisim。 一、Logisim是什么? Logisim是一个用于电子逻辑门电路模拟的教育工具软件。它允许用户通过图形界面构建和测试复杂的数字逻辑电路,如加法器、解码器、编码器、寄存器、内存等,从而帮助学生理解计算机硬件的工作原理。 二、如…...

Flink CDC系列之:调研应用Flink CDC将 ELT 从 MySQL 流式传输到 StarRocks方案

Flink CDC系列之:调研应用Flink CDC将 ELT 从 MySQL 流式传输到 StarRocks方案 准备准备 Flink Standalone 集群准备 docker compose为 MySQL 准备记录使用 Flink CDC CLI 提交作业 同步架构和数据更改路由变更清理 本教程将展示如何使用 Flink CDC 快速构建从 MySQ…...

一次元空间FullGC导致OOM问题分析

原文,作者:kkyeer 原文需要翻墙,所以转载。 现象 观测平台告警:FullGC次数大于阈值,5分钟内大于11次,频次大概1-2周有一次 告警后服务概率性会自动恢复,控制台打印 Exception: java.lang.OutOf…...

Web前端开发工具和依赖安装

各种安装&#xff1a; node.js https://nodejs.org/zh-cn/ 安装完node.js 可以使用npm&#xff0c;npm跟随nodejs一起安装 node --version 查看已安装node.js的版本&#xff0c;确认是否安装nodejs npm -v 查看npm版本npm install <Module Name> 安装模块 npm insta…...

【学习心得】远程root用户访问服务器中的MySQL8

一、Ubuntu下的MySQL8安装 在Ubuntu系统中安装MySQL 8.0可以通过以下步骤进行1. 更新包管理工具的仓库列表&#xff1a; sudo apt update 2. 安装MySQL 8.0&#xff0c;root用户默认没有密码&#xff1a; sudo apt install mysql-server sudo apt install mysql-client 【…...

lust变频器维修电梯变频器CDD34.014.W2.1LSPC1

LUST伺服在安装时须注意&#xff0c;不可有任何的铁屑、螺丝、导线等掉人驱动器内。在安装完成后应作基本的检测动作&#xff0c;如对地阻抗&#xff0c;和短路检测等。 所有的安装及使用事项需要符合安全规定&#xff0c;并且也需要符合当地的相关规定和灾害预防措施。DC BUS…...

跨越地域限制:在线原型设计软件的自由与便捷

网络原型设计软件因其便捷性和灵活性&#xff0c;在现代设计工作中扮演着至关重要的角色。与传统的桌面端软件相比&#xff0c;网络原型设计工具无需安装&#xff0c;不受地域限制&#xff0c;且兼容各种操作系统&#xff0c;无论是Linux、Solaris、Mac还是Windows&#xff0c;…...

flash-waimai:高仿饿了么外卖平台,使用他轻松打造自己的外卖平台

嗨&#xff0c;大家好&#xff0c;我是小华同学&#xff0c;关注我们获得“最新、最全、最优质”开源项目和工作学习方法 flash-waimai 是一个完整的外卖平台解决方案&#xff0c;包括手机端、后台管理端和 API 服务。该项目仿照了饿了么的外卖服务&#xff0c;为用户提供了一个…...

2.5 塑性力学—应变状态

个人专栏—塑性力学 1.1 塑性力学基本概念 塑性力学基本概念 1.2 弹塑性材料的三杆桁架分析 弹塑性材料的三杆桁架分析 1.3 加载路径对桁架的影响 加载路径对桁架的影响 2.1 塑性力学——应力分析基本概念 应力分析基本概念 2.2 塑性力学——主应力、主方向、不变量 主应力、主…...

1.机器人抓取与操作介绍-深蓝学院

介绍 操作任务 操作 • Insertion • Pushing and sliding • 其它操作任务 抓取 • 两指&#xff08;平行夹爪&#xff09;抓取 • 灵巧手抓取 7轴 Franka 对应人的手臂 6轴 UR构型去掉一个自由度 课程大纲 Robotic Manipulation 操作 • Robotic manipulation refers…...

六,Linux基础环境搭建(CentOS7)- 安装HBase

Linux基础环境搭建&#xff08;CentOS7&#xff09;- 安装HBase 大家注意以下的环境搭建版本号&#xff0c;如果版本不匹配有可能出现问题&#xff01; 一、HBase下载及安装 HBase是一个分布式的、面向列的开源数据库&#xff0c;该技术来源于 Fay Chang 所撰写的Google论文“…...

《计算机网络网络层:连接虚拟世界的关键桥梁》

一、网络层概述 网络层在计算机网络中占据着至关重要的地位&#xff0c;它作为连接不同网络的关键层次&#xff0c;起着承上启下的作用。网络层的主要任务是实现网络互连&#xff0c;将数据设法从源端经过若干个中间节点传送到目的端&#xff0c;为分组交换网上的不同主机提供通…...

【AIGC】2024-arXiv-CtrLoRA:一种可扩展且高效的可控图像生成框架

2024-arXiv-CtrLoRA: An Extensible and Efficient Framework for Controllable Image Generation CtrLoRA&#xff1a;一种可扩展且高效的可控图像生成框架摘要1. 引言相关工作3. 方法3.1 准备工作3.3 有效适应新条件3.4 条件嵌入网络的设计 4. 实验4.1 实验设置4.2 与现有方法…...

立仪光谱共焦在玻璃上奥秘与应用

在现代工业和科学研究中&#xff0c;玻璃因其透明、坚硬和易加工的特性被广泛应用于各个领域。然而&#xff0c;玻璃的厚度测量一直是困扰业界的一大难题。传统的千分尺或电容式传感器虽然在一定程度上能满足生产需求&#xff0c;但在精度、效率以及适用范围上存在明显的局限。…...

【天气识别系统】Python+卷积神经网络算法+人工智能+深度学习+TensorFlow+算法模型训练+Django网页界面

一、介绍 天气识别系统&#xff0c;以Python作为主要编程语言&#xff0c;通过收集了4种常见的天气图像数据集&#xff08;多云、雨天、晴天、日出&#xff09;&#xff0c;然后基于TensorFlow搭建卷积神经网络算法模型&#xff0c;通过多轮迭代训练&#xff0c;最后得到一个识…...

MiniCTX:面向大语言模型定理证明的上下文相关基准测试系统

卡内基梅隆大学的研究人员推出MiniCTX&#xff0c;这是一个强大的基准测试系统&#xff0c;旨在通过整合前所未有的多重上下文元素&#xff08;包括前提、先前证明、注释、符号以及导入和声明等结构组件&#xff09;来彻底改变大型语言模型中定理证明能力的评估方式&#xff0c…...

树莓派开发相关知识三PWM控制转速

基于树莓派PWM控制 控制L298N马达驱动转速 马达驱动转速 1、L298N电路图&#xff1a; 2、需要留意的有几点 INA~IND四个引脚分别控制OUTA-OUTD&#xff0c;即&#xff0c;INA高电平则OUTA有电。 ENA&#xff0c;ENB分别使能控制OUTA~OUTB以及OUTC~OUTD。 OUT口有VCC电压驱动…...

wordpress响应式中文/在线检测网站安全

有术无道止于术&#xff0c;有道无术术尚可求 Shutout to 马士兵、李卫民向所有开发者致敬第一章 Hello World 第一代编程语言&#xff1a;打孔机&#xff0c;老师都没有见过第二代编程语言&#xff1a;汇编&#xff0c;比较难第三代编程语言&#xff1a;面向过程语言三代半&am…...

安卓开发app/贵港网站seo

...

石家庄做网站比较好的公司/软文网站名称

这篇文章主要介绍了Python二次规划和线性规划使用实例,文中通过示例代码介绍的非常详细&#xff0c;对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 对于二次规划&#xff08;quadratic programming&#xff09;和线性规划&#xff08;Linear Programming&a…...

网站建设的学校/seo网络营销招聘

P30 JComboBox下拉列表框1.概述2.代码实例3.效果演示4.使用案例系统&#xff1a;Win10 Java&#xff1a;1.8.0_333 IDEA&#xff1a;2020.3.4 Gitee&#xff1a;https://gitee.com/lijinjiang01/JavaSwing 1.概述 JComboBox&#xff1a;下拉列表框。JComboBox以下列列表的形式…...

内容不相关的网站做301重定向/免费的短视频app大全

网络协议的定义&#xff1a;为计算机网络中进行数据交换而建立的规则、标准或约定的集合。例如&#xff0c;网络中一个微机用户和一个大型主机的操作员进行通信&#xff0c;由于这两个数据终端所用字符集不同&#xff0c;因此操作员所输入的命令彼此不认识。为了能进行通信&…...

做网站合肥/成人厨师短期培训班

requestAnimationFrame window.requestAnimationFrame() 方法跟 setTimeout 类似&#xff0c;都是推迟某个函数的执行。不同之处在于&#xff0c;setTimeout 必须指定推迟的时间; window.requestAnimationFrame() 则是推迟到浏览器下一次重流时执行&#xff0c;执行完才会进行…...