当前位置：首页 > news >正文

flink学习之广播流与合流操作demo

news 2025/7/3 17:39:00

广播流是什么？

将一条数据广播到所有的节点。使用 dataStream.broadCast()

广播流使用场景？

一般用于动态加载配置项。比如lol，每天不断有人再投诉举报，客服根本忙不过来，腾讯内部做了一个判断，只有vip3以上的客户的投诉才会有人工一对一回复，过了一段时间大家都发现vip3才有人工，都开始充钱到vip3，此时人还是很多，于是只有vip4上的客户才能人工回复

vip3->vip4 这种判断标准在不断的变化。此时就需要广播流。因为此时数据只有1条，需要多个节点都收到这个变化的数据。

广播流怎么用？

一般通过connect合流去操作 a connect b.broadcast 。a是主流也就是数据流，b是配置变化流

不多说直接上demo，开箱即用

package com.chenchi.broadcast;import org.apache.flink.api.common.state.BroadcastState;
import org.apache.flink.api.common.state.MapStateDescriptor;
import org.apache.flink.api.common.state.ValueState;
import org.apache.flink.api.common.state.ValueStateDescriptor;
import org.apache.flink.api.common.typeinfo.Types;
import org.apache.flink.configuration.Configuration;
import org.apache.flink.streaming.api.datastream.BroadcastStream;
import org.apache.flink.streaming.api.datastream.DataStream;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.streaming.api.functions.co.CoProcessFunction;
import org.apache.flink.streaming.api.functions.co.KeyedBroadcastProcessFunction;
import org.apache.flink.streaming.api.functions.source.SourceFunction;
import org.apache.flink.util.Collector;import java.util.HashMap;
import java.util.Random;public class BroadCastStreamDemo {public static void main(String[] args) throws Exception {StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();DataStream<Pattern> patternDataStream = env.addSource(new ChangeSource());DataStream<User> userDataStream = env.addSource(new CustomerSource());userDataStream.print("user");patternDataStream.print("pattern");//test1  直接合流 不广播。只会在一个节点更新。 用于特殊需求？
//        userDataStream
//                .keyBy(user -> user.userId)
//                .connect(patternDataStream)
//                .process(new CustomerSimpleProcess())
//                .print();//test2// 定义广播状态的描述器，创建广播流 如何保存需要的广播数据呢 这个案例是通过map保留变化数据
//        userDataStream
//                .keyBy(user -> user.userId)
//                .connect(patternDataStream.broadcast())
//                .process(new CustomerSimpleProcess())
//                        .print();//test3MapStateDescriptor<Void, Pattern> bcStateDescriptor = new MapStateDescriptor<>("patterns", Types.VOID, Types.POJO(Pattern.class));//通过描述器 更新BroadcastStream<Pattern> broadcast = patternDataStream.broadcast(bcStateDescriptor);userDataStream.keyBy(user -> user.userId).connect(broadcast).process(new CustomerBroadCastProcess()).print();env.execute();}private static class CustomerBroadCastProcess extends KeyedBroadcastProcessFunction<Integer, User, Pattern, String> {@Overridepublic void processElement(User user, KeyedBroadcastProcessFunction<Integer, User, Pattern, String>.ReadOnlyContext readOnlyContext, Collector<String> collector) throws Exception {Integer userVip = user.getVip();//获取广播流的数据 不是通过map保存Pattern pattern = readOnlyContext.getBroadcastState(new MapStateDescriptor<>("patterns", Types.VOID, Types.POJO(Pattern.class))).get(null);if (pattern!=null){Integer patternVip = pattern.vip;String result = "当前系统需要的vip等级=" + patternVip + ",用户id=" + user.userId + ",vip=" + userVip;if (userVip>= patternVip){result=result+"符合要求";}else {result=result+"不符合要求";}collector.collect(result);}else {System.out.println("pattern is null ");}}@Overridepublic void processBroadcastElement(Pattern pattern, KeyedBroadcastProcessFunction<Integer,User, Pattern, String>.Context context, Collector<String> collector) throws Exception {BroadcastState<Void, Pattern> bcState = context.getBroadcastState(new MapStateDescriptor<>("patterns", Types.VOID, Types.POJO(Pattern.class)));// 将广播状态更新为当前的patternbcState.put(null, pattern);}}public static class CustomerSimpleProcess extends CoProcessFunction<User, Pattern, String> {ValueState<Integer> vip; //这个是保留主流的state的。 不是保留广播流的stateHashMap<String,Integer> vipMap;@Overridepublic void open(Configuration parameters) throws Exception {vip = getRuntimeContext().getState(new ValueStateDescriptor<>("vip", Integer.class));vipMap=new HashMap<String,Integer>();super.open(parameters);}@Overridepublic void processElement1(User user, CoProcessFunction<User, Pattern, String>.Context context, Collector<String> collector) throws Exception {Integer userVip = user.getVip();Integer patternVip = vipMap.getOrDefault("vip", 0);String result = "当前系统需要的vip等级=" + patternVip + ",用户id=" + user.userId + ",vip=" + userVip;if (userVip>=patternVip){result=result+"符合要求";}else {result=result+"不符合要求";}collector.collect(result);}@Overridepublic void processElement2(Pattern pattern, CoProcessFunction<User, Pattern, String>.Context context, Collector<String> collector) throws Exception {vipMap.put("vip",pattern.vip);}}public static class User {public Integer userId;public Integer vip;public User() {}public User(Integer userId, Integer vip) {this.userId = userId;this.vip = vip;}public Integer getUserId() {return userId;}public void setUserId(Integer userId) {this.userId = userId;}public Integer getVip() {return vip;}public void setVip(Integer vip) {this.vip = vip;}@Overridepublic String toString() {return "Action{" +"userId=" + userId +", vip='" + vip + '\'' +'}';}}// 定义行为模式POJO类，包含先后发生的两个行为public static class Pattern {public Integer vip;public Pattern() {}public Pattern(Integer vip) {this.vip = vip;}@Overridepublic String toString() {return "Pattern{" +"vip='" + vip + '\'' +'}';}}private static class CustomerSource implements SourceFunction<User> {boolean run = true;@Overridepublic void run(SourceContext<User> sourceContext) throws Exception {while (true) {Integer userId = new Random().nextInt(1000);Integer vip = new Random().nextInt(10);sourceContext.collect(new User(userId, vip));Thread.sleep(1000);}}@Overridepublic void cancel() {run = false;}}private static class ChangeSource implements SourceFunction<Pattern> {boolean run = true;@Overridepublic void run(SourceContext<Pattern> sourceContext) throws Exception {int i = 1;while (true) {sourceContext.collect(new Pattern(i++));Thread.sleep(5000);}}@Overridepublic void cancel() {run = false;}}}

demo思想：以上述vip做例子，获取用户不断投诉的id和vip等级，数据库保存可以享受人工服务的vip等级，该等级可以自行调整(我是随着时间变化主键增大)。

test1 不广播

注意看pattern:4 print vip=2的消息但是不代表是task4收到的消息，我们看到>1输出了vip=2

但是task10 task9都还是vip=0 ，说明流没有广播，除非此处并行度设置为1

test2 map保存变化数据

test3通过描述器获取数据

和test2 一样，不过要注意因为两个流的数据有先后，可能还没有pattern就来了user信息，所以建议先初始化，或者先添加pattern流。

flink学习之广播流与合流操作demo

广播流是什么？ 将一条数据广播到所有的节点。使用 dataStream.broadCast() 广播流使用场景？ 一般用于动态加载配置项。比如lol，每天不断有人再投诉举报，客服根本忙不过来，腾讯内部做了一个判断，只有vip3…...

编程日记 2023/9/10 11:54:13

PPT架构师架构技能图

PPT架构师架构技能图目录概述需求： 设计思路实现思路分析1.软素质2.核心输出（office输出） 参考资料和推荐阅读 Survive by day and develop by night. talk for import biz , show your perfect code,full busy，skip hardness,ma…...

编程日记 2023/9/10 11:53:11

STM32微控制器的低功耗模式

STM32微控制器的低功耗模式（Low-power modes）：Sleep mode、Stop mode 和 Standby mode。 1.1 Sleep Mode（睡眠模式）：把STM32微控制器当作一位劳累的工人，他在工作过程中需要短暂的休息。在Sleep模式下，微控制器会关闭一部分电路，减小功耗，但仍然保持对中央处理单…...

编程日记 2023/9/10 11:52:10

tensorflow QAT

tensorflow qat https://www.wpgdadatong.com/tw/blog/detail/70672 在边缘运算的重点技术之中，除了简化复杂的模块构架，来简化参数量以提高运算速度的这项模块轻量化网络构架技术之外。另一项技术就是各家神经网络框架（TensorFlow、Pytorc…...

编程日记 2023/9/10 11:51:09

[杂谈]-快速了解LoRaWAN网络以及工作原理

快速了解LoRaWAN网络以及工作原理文章目录快速了解LoRaWAN网络以及工作原理1、LoRaWAN网络元素1.1 终端设备（End Devices）1.2 网关（Gateways）1.3 网络服务器（Net Server）1.4 应用服务器（Appli…...

编程日记 2023/9/10 11:50:07

MySQL--MySQL表的增删改查（基础）

排序：ORDER BY 语法： – ASC 为升序（从小到大） – DESC 为降序（从大到小） – 默认为 ASC SELECT … FROM table_name [WHERE …] ORDER BY column [ASC|DESC], […]; *** update...

编程日记 2023/9/10 11:49:06

Vue中启动提示polyfill缺少-webpack v5版本导致

安装 npm i node-polyfill-webpack-plugin 因为我们的项目使用webpack v5，其中polyfill Node核心模块被删除。所以，我们安装它是为了在项目中访问这些模块 vue.config.js文件 const { defineConfig } require("vue/cli-service"); const No…...

编程日记 2023/9/10 11:48:05

Hugging Face实战-系列教程3：AutoModelForSequenceClassification文本2分类

🚩🚩🚩Hugging Face 实战系列总目录有任何问题欢迎在下面留言本篇文章的代码运行界面均在notebook中进行本篇文章配套的代码资源已经上传下篇内容： Hugging Face实战-系列教程4：padding与attention_mask 输出我…...

编程日记 2023/9/10 11:47:02

《TCP/IP网络编程》阅读笔记--Socket类型及协议设置

目录 1--协议的定义 2--Socket的创建 2-1--协议族（Protocol Family） 2-2--Socket类型（Type） 3--Linux下实现TCP Socket 3-1--服务器端 3-2--客户端 3-3--编译运行 4--Windows下实现 TCP Socket 4-1--TCP服务端 4-2--TC…...

编程日记 2023/9/10 11:45:59

GitHub使用教程

GitHub使用教程视频教程一：Github 新手够用指南 | 全程演示&个人找项目技巧放送_哔哩哔哩_bilibili 笔记： README.md编写教程：Typora官方免费版与入门教程__阿伟_的博客-CSDN博客找开源项目的一些途径 • https://github.com/trendin…...

编程日记 2023/9/10 11:44:58

sql server 分区表

分区表分区表是在SQL Server 2005之后的版本引入的特性，这个特性允许把逻辑上的一个表在物理上分为很多部分。换句话说，分区表从物理上看是将一个大表分成几个小表，但是从逻辑上看，还是一个大表。步骤创建分表区的步骤分为…...

编程日记 2023/9/10 11:43:57

开源许可证概述：GNU, BSD, Apache, MPL, 和 MIT

前言开源许可证是开源软件分发的基础。它们定义了使用者如何使用，修改，分发开源软件。在这篇文章中，我们将探讨五种常见的开源许可证：GNU通用公共许可证 (GNU GPL)，BSD许可证，Apache许可证，Mo…...

编程日记 2023/9/10 11:42:55

java中log使用总结

目录一、概述1.1. 核心日志框架1.2 门面日志框架二、最佳实践2.1 核心日志框架API包2.2 门面日志框架依赖2.3 集成使用2.3.1 集成jcl2.3.2 集成slf4j2.3.2.1 slf4j集成单一框架2.3.2.2 slf4j整合混合框架三、总结3.1 所有相关包3.1.1 核心日志框架包3.1.2 门面日志框架3.1.3…...

编程日记 2023/9/10 11:41:53

【Java】传输层协议TCP

传输层协议TCP TCP报文格式首部长度保留位32位序列号和32位确认应答号标记ACKSYNFINRSTURGPSH 16位窗口大小16位校验和16位紧急指针选项 TCP特点可靠传输实现机制-确认应答超时重传连接管理机制三次握手四次挥手特殊情况滑动窗口流量控制拥塞控制延迟应答捎带应答面向字节流粘…...

编程日记 2023/9/10 11:40:52

计算机网络基础知识（非常详细）

1. 网络模型 1.1 OSI 七层参考模型七层模型，亦称 OSI（Open System Interconnection）参考模型，即开放式系统互联，是网络通信的标准模型。一般称为 OSI 参考模型或七层模型。它是一个七层的、抽象的模型体&#xff…...

编程日记 2023/9/10 11:39:51

如何进行SEO优化数据分析？（掌握正确的数据分析方法，让您的网站更上一层楼！）

在互联网时代，SEO优化已经成为了每一个网站运营者必备的技能。而在SEO优化中，数据分析更是至关重要的一环。在本文中，我们将会详细介绍如何正确的进行SEO优化数据分析，让您的网站更上一层楼！ 数据分析的重要性数据分…...

编程日记 2023/9/10 11:38:50

Golang不同平台编译的思考

GOOS和GOARCH $GOOS可选值如下： darwin dragonfly freebsd linux netbsd openbsd plan9 solaris windows $GOARCH可选值如下 386 amd64 arm 在编译的时候我们可以根据实际需要对这两个参数进行组合。更详细的说明可以进官网看看 ## http://golang.org/cmd/go http…...

编程日记 2023/9/10 11:37:49

1.认证密码校验用户密码加密存储 Configuration public class SecurityConfig extends WebSecurityConfigurerAdapter {Beanpublic PasswordEncoder passwordEncoder(){return new BCryptPasswordEncoder();}} 我们没有这个配置，默认明文存储, {id}password;实现…...

编程日记 2023/9/10 11:36:47

时序预测 | MATLAB实现ICEEMDAN-iMPA-BiLSTM时间序列预测

时序预测 | MATLAB实现ICEEMDAN-iMPA-BiLSTM时间序列预测目录时序预测 | MATLAB实现ICEEMDAN-iMPA-BiLSTM时间序列预测预测效果基本介绍程序设计参考资料预测效果基本介绍 ICEEMDAN-iMPA-BiLSTM功率/风速预测基于改进的自适应经验模态分解改进海洋捕食者算法双向长短期记忆…...

编程日记 2023/9/10 11:34:44

二叉树（上)

“路虽远，行则将至” ❤️主页：小赛毛目录 1.树概念及结构 1.1树的概念 1.2 树的相关概念 1.3 树的表示（树的存储） 2.二叉树概念及结构 2.1概念 2.2现实中的二叉树 2.3 特殊的二叉树： 2.4 二叉树的性质 3.二叉树的顺…...

编程日记 2023/9/10 11:33:41

RestClient

什么是RestClient RestClient 是 Elasticsearch 官方提供的 Java 低级 REST 客户端，它允许HTTP与Elasticsearch 集群通信，而无需处理 JSON 序列化/反序列化等底层细节。它是 Elasticsearch Java API 客户端的基础。 RestClient 主要特点轻量级&#xff…...

编程新知 2025/6/23 4:26:10

深入剖析AI大模型：大模型时代的 Prompt 工程全解析

今天聊的内容，我认为是AI开发里面非常重要的内容。它在AI开发里无处不在，当你对 AI 助手说 "用李白的风格写一首关于人工智能的诗"，或者让翻译模型 "将这段合同翻译成商务日语" 时，输入的这句话就是 Prompt。…...

编程新知 2025/7/1 6:09:18

Golang 面试经典题：map 的 key 可以是什么类型？哪些不可以？

Golang 面试经典题：map 的 key 可以是什么类型？哪些不可以？ 在 Golang 的面试中，map 类型的使用是一个常见的考点，其中对 key 类型的合法性是一道常被提及的基础却很容易被忽视的问题。本文将带你深入理解 Golang 中…...

编程新知 2025/6/21 16:06:37

Xshell远程连接Kali（默认 | 私钥）Note版

前言:xshell远程连接，私钥连接和常规默认连接任务一开启ssh服务 service ssh status //查看ssh服务状态 service ssh start //开启ssh服务 update-rc.d ssh enable //开启自启动ssh服务任务二修改配置文件 vi /etc/ssh/ssh_config //第一…...

编程新知 2025/7/2 16:58:56

React第五十七节 Router中RouterProvider使用详解及注意事项

前言在 React Router v6.4 中，RouterProvider 是一个核心组件，用于提供基于数据路由（data routers）的新型路由方案。它替代了传统的 <BrowserRouter>，支持更强大的数据加载和操作功能（如 loader 和…...

编程新知 2025/7/2 21:48:11

Mybatis逆向工程，动态创建实体类、条件扩展类、Mapper接口、Mapper.xml映射文件

今天呢，博主的学习进度也是步入了Java Mybatis 框架，目前正在逐步杨帆旗航。那么接下来就给大家出一期有关 Mybatis 逆向工程的教学，希望能对大家有所帮助，也特别欢迎大家指点不足之处，小生很乐意接受正确的建议&…...

编程新知 2025/7/1 5:43:01

【网络安全产品大调研系列】2. 体验漏洞扫描

前言 2023 年漏洞扫描服务市场规模预计为 3.06（十亿美元）。漏洞扫描服务市场行业预计将从 2024 年的 3.48（十亿美元）增长到 2032 年的 9.54（十亿美元）。预测期内漏洞扫描服务市场 CAGR（增长率&…...

编程新知 2025/7/2 16:36:17

2024年赣州旅游投资集团社会招聘笔试真

2024年赣州旅游投资集团社会招聘笔试真题 ( 满分 1 0 0 分时间 1 2 0 分钟 ) 一、单选题(每题只有一个正确答案，答错、不答或多答均不得分) 1.纪要的特点不包括()。 A.概括重点 B.指导传达 C. 客观纪实 D.有言必录【答案】: D 2.1864年，()预言了电磁波的存在，并指出…...

编程新知 2025/6/21 10:08:07

Java面试专项一-准备篇

一、企业简历筛选规则一般企业的简历筛选流程：首先由HR先筛选一部分简历后，在将简历给到对应的项目负责人后再进行下一步的操作。 HR如何筛选简历例如：Boss直聘（招聘方平台） 直接按照条件进行筛选例如&#xff1a…...

编程新知 2025/7/2 15:01:02

今日学习：Spring线程池|并发修改异常|链路丢失|登录续期|VIP过期策略|数值类缓存

文章目录优雅版线程池ThreadPoolTaskExecutor和ThreadPoolTaskExecutor的装饰器并发修改异常并发修改异常简介实现机制设计原因及意义使用线程池造成的链路丢失问题线程池导致的链路丢失问题发生原因常见解决方法更好的解决方法设计精妙之处登录续期登录续期常见实现方式特…...

编程新知 2025/6/22 19:33:11

flink学习之广播流与合流操作demo

相关文章：

flink学习之广播流与合流操作demo

PPT架构师架构技能图

STM32微控制器的低功耗模式

tensorflow QAT

[杂谈]-快速了解LoRaWAN网络以及工作原理

MySQL--MySQL表的增删改查（基础）

Vue中启动提示polyfill缺少-webpack v5版本导致

Hugging Face实战-系列教程3：AutoModelForSequenceClassification文本2分类

《TCP/IP网络编程》阅读笔记--Socket类型及协议设置

GitHub使用教程

sql server 分区表

开源许可证概述：GNU, BSD, Apache, MPL, 和 MIT

java中log使用总结

【Java】传输层协议TCP

计算机网络基础知识（非常详细）

如何进行SEO优化数据分析？（掌握正确的数据分析方法，让您的网站更上一层楼！）

Golang不同平台编译的思考

SpringSecurity学习

时序预测 | MATLAB实现ICEEMDAN-iMPA-BiLSTM时间序列预测

二叉树（上)

RestClient

深入剖析AI大模型：大模型时代的 Prompt 工程全解析

Golang 面试经典题：map 的 key 可以是什么类型？哪些不可以？

Xshell远程连接Kali（默认 | 私钥）Note版

React第五十七节 Router中RouterProvider使用详解及注意事项

Mybatis逆向工程，动态创建实体类、条件扩展类、Mapper接口、Mapper.xml映射文件

【网络安全产品大调研系列】2. 体验漏洞扫描

2024年赣州旅游投资集团社会招聘笔试真

Java面试专项一-准备篇

今日学习：Spring线程池|并发修改异常|链路丢失|登录续期|VIP过期策略|数值类缓存