当前位置：首页 > news >正文

spark的学习-06

news 文章来源：https://blog.csdn.net/qq_62984376/article/details/143692083 2025/4/11 19:36:18

SparkSQL读写数据的方式

1）输入Source

方式一：给定读取数据源的类型和地址

spark.read.format("json").load(path)
spark.read.format("csv").load(path)
spark.read.format("parquet").load(path)

方式二：直接调用对应数据源类型的方法

spark.read.json(path)
spark.read.csv(path)
spark.read.parquet(path)

特殊参数：option，用于指定读取时的一些配置选项

spark.read.format("csv").option("sep", "\t").load(path)jdbcDF = spark.read \.format("jdbc") \.option("url", "jdbc:postgresql:dbserver") \.option("dbtable", "schema.tablename") \.option("user", "username") \.option("password", "password") \.load()

1、普通的文件读取方式：

import osfrom pyspark import SparkConf, SparkContext
from pyspark.sql import SparkSessionif __name__ == '__main__':os.environ['JAVA_HOME'] = 'C:/Program Files/Java/jdk1.8.0_131'# 配置Hadoop的路径，就是前面解压的那个路径os.environ['HADOOP_HOME'] = r'D:\BigDate\05-Hadoop\software\hadoop-3.3.1'# 配置base环境Python解析器的路径os.environ['PYSPARK_PYTHON'] = 'C:/ProgramData/Miniconda3/python.exe'  # 配置base环境Python解析器的路径os.environ['PYSPARK_DRIVER_PYTHON'] = 'C:/ProgramData/Miniconda3/python.exe'# 创建spark对象spark = SparkSession.builder.master("local[2]").appName("第一次构建SparkSession").config("spark.sql.shuffle.partitions", 2).getOrCreate()deptDf = spark.read.csv("../../datas/zuoye/dept.csv").toDF("deptno","dept_name","dept_address")empDf = spark.read.format("csv").option("sep","\t").load("../../datas/zuoye/emp.tsv").toDF("empno","ename","salary","comm","deptno")deptDf.createOrReplaceTempView("dept")empDf.createOrReplaceTempView("emp")# spark.sql("""#     select * from dept# """).show()## spark.sql("""#         select * from emp#     """).show()# 需求：查询统计每个部门薪资最高的前两名员工的信息以及员工所在的部门名称。spark.sql("""with t as (select e.*,d.dept_name,dense_rank() over(partition by e.deptno order by cast(salary as int) desc) paixu from emp e join dept d on d.deptno = e.deptno) select * from t where paixu <= 2""").show()spark.stop()

2、通过jdbc读取数据库数据

注意：使用jdbd读取之前，需要先将mysql5或者8 的驱动放在

import osfrom pyspark import SparkConf, SparkContext
from pyspark.sql import SparkSessionif __name__ == '__main__':os.environ['JAVA_HOME'] = 'C:/Program Files/Java/jdk1.8.0_131'# 配置Hadoop的路径，就是前面解压的那个路径os.environ['HADOOP_HOME'] = r'D:\BigDate\05-Hadoop\software\hadoop-3.3.1'# 配置base环境Python解析器的路径os.environ['PYSPARK_PYTHON'] = 'C:/ProgramData/Miniconda3/python.exe'  # 配置base环境Python解析器的路径os.environ['PYSPARK_DRIVER_PYTHON'] = 'C:/ProgramData/Miniconda3/python.exe'# 得到sparkSession对象spark = SparkSession.builder.master("local[2]").appName("").config("spark.sql.shuffle.partitions", 2).getOrCreate()# 处理逻辑# 读取json 数据df1 = spark.read.format("json").load("../../datas/sql/person.json")df1.show()# 另一种写法,推荐使用这一种df2 = spark.read.json("../../datas/sql/person.json")df2.show()df3 = spark.read.csv("../../datas/dept.csv")df4 = spark.read.format("csv").load("../../datas/dept.csv")# 读取分隔符为别的分隔符的文件user_schema = StructType([StructField(name="emp_id", dataType=StringType(), nullable=False),StructField(name="emp_name", dataType=StringType(), nullable=True),StructField(name="salary", dataType=DoubleType(), nullable=True),StructField(name="comm", dataType=DoubleType(), nullable=True),StructField(name="dept_id", dataType=LongType(), nullable=True)])# 使用csv 读取了一个 \t 为分隔符的文件，读取的数据字段名很随意，所以可以自定义df5 = spark.read.format("csv").option("sep","\t").load("../../datas/emp.tsv",schema=user_schema)df5.show()# 昨天的作业是否也可以有另一个写法movie_schema = StructType([StructField(name="movie_id", dataType=LongType(), nullable=False),StructField(name="movie_name", dataType=StringType(), nullable=True),StructField(name="movie_type", dataType=StringType(), nullable=True)])movieDF = spark.read.format("csv").option("sep","::").load("../../datas/zuoye/movies.dat",schema=movie_schema)movieDF.show()spark.read.load(path="../../datas/zuoye/movies.dat",format="csv",sep="::",schema=movie_schema).show()dict = {"user":"root","password":"root"}jdbcDf = spark.read.jdbc(url="jdbc:mysql://localhost:3306/spark",table="emp",properties=dict)jdbcDf.show()# jdbc的另一种写法jdbcDf2 = spark.read.format("jdbc") \.option("driver", "com.mysql.cj.jdbc.Driver") \.option("url", "jdbc:mysql://localhost:3306/spark") \.option("dbtable", "spark.dept") \.option("user", "root") \.option("password", "root").load()jdbcDf2.show()# 读取hive表中的数据# 关闭spark.stop()

3、读取集群中hive表中的数据

import osfrom pyspark import SparkConf, SparkContext
from pyspark.sql import SparkSessionif __name__ == '__main__':os.environ['JAVA_HOME'] = 'C:/Program Files/Java/jdk1.8.0_131'# 配置Hadoop的路径，就是前面解压的那个路径os.environ['HADOOP_HOME'] = r'D:\BigDate\05-Hadoop\software\hadoop-3.3.1'# 配置base环境Python解析器的路径os.environ['PYSPARK_PYTHON'] = 'C:/ProgramData/Miniconda3/python.exe'  # 配置base环境Python解析器的路径os.environ['PYSPARK_DRIVER_PYTHON'] = 'C:/ProgramData/Miniconda3/python.exe'# 创建spark对象spark = SparkSession \.builder \.appName("测试spark链接") \.master("local[2]") \.config("spark.sql.warehouse.dir", 'hdfs://bigdata01:9820/user/hive/warehouse') \.config('hive.metastore.uris', 'thrift://bigdata01:9083') \.config("spark.sql.shuffle.partitions", 2) \.enableHiveSupport() \.getOrCreate()spark.sql("select * from homework.game").show()spark.stop()

2）输出Sink

方式一：给定输出数据源的类型和地址

df.write.format("json").save(path)
df.write.format("csv").save(path)
df.write.format("parquet").save(path)

方式二：直接调用对应数据源类型的方法

df.write.json(path)
df.write.csv(path)
df.write.parquet(path)

特殊参数：option，用于指定输出时的一些配置选项

df.write \
.format("jdbc") \
.option("url", "jdbc:postgresql:dbserver") \
.option("dbtable", "schema.tablename") \
.option("user", "username") \
.option("password", "password") \
.save()

append: 追加模式，当数据存在时，继续追加

overwrite: 覆写模式，当数据存在时，覆写以前数据，存储当前最新数据；

error/errorifexists: 如果目标存在就报错，默认的模式

ignore: 忽略，数据存在时不做任何操作

df.write.mode(saveMode="append").format("csv").save(path)

保存为普通格式：

import osfrom pyspark import SparkConf, SparkContext
from pyspark.sql import SparkSessionif __name__ == '__main__':os.environ['JAVA_HOME'] = 'C:/Program Files/Java/jdk1.8.0_131'# 配置Hadoop的路径，就是前面解压的那个路径os.environ['HADOOP_HOME'] = r'D:\BigDate\05-Hadoop\software\hadoop-3.3.1'# 配置base环境Python解析器的路径os.environ['PYSPARK_PYTHON'] = 'C:/ProgramData/Miniconda3/python.exe'  # 配置base环境Python解析器的路径os.environ['PYSPARK_DRIVER_PYTHON'] = 'C:/ProgramData/Miniconda3/python.exe'# 创建spark对象spark = SparkSession.builder.master("local[2]").appName("第一次构建SparkSession").config("spark.sql.shuffle.partitions", 2).getOrCreate()df = spark.read.json("../../datas/person.json")df.createOrReplaceTempView("person")rsDf = spark.sql("""select name,age from person where age = (select max(age) from person)""")rsDf.write.csv("hdfs://bigdata01:9820/result")spark.stop()

如果你的hdfs没有关闭安全模式的话，会报一个错误，使用下面命令关闭安全模式即可

Hdfs 关闭安全模式
hdfs dfsadmin -safemode leave

保存到本地数据库：

import osfrom pyspark import SparkConf, SparkContext
from pyspark.sql import SparkSessionif __name__ == '__main__':os.environ['JAVA_HOME'] = 'C:/Program Files/Java/jdk1.8.0_131'# 配置Hadoop的路径，就是前面解压的那个路径os.environ['HADOOP_HOME'] = r'D:\BigDate\05-Hadoop\software\hadoop-3.3.1'# 配置base环境Python解析器的路径os.environ['PYSPARK_PYTHON'] = 'C:/ProgramData/Miniconda3/python.exe'  # 配置base环境Python解析器的路径os.environ['PYSPARK_DRIVER_PYTHON'] = 'C:/ProgramData/Miniconda3/python.exe'# 创建spark对象spark = SparkSession.builder.master("local[2]").appName("第一次构建SparkSession").config("spark.sql.shuffle.partitions", 2).getOrCreate()df = spark.read.format("csv").option("sep","\t").load("../../datas/zuoye/emp.tsv") \.toDF("id","name","sal","comm","deptno")# 本地数据库jdbc连接df.write.format("jdbc") \.option("driver","com.mysql.cj.jdbc.Driver") \.option("url","jdbc:mysql://localhost:3306/homework") \.option("dbtable","emp1") \.option("user","root") \.option("password","123456") \.save(mode="overwrite")spark.stop()

保存到集群的hive中：

这里的spark环境是yarn，执行代码之前，需要先打开hdfs、yarn、hive（metastore和hiveserver2）

注意：如果没有使用schema，直接用toDf导入的时候，也可以导入成功，但是表中的字段类型就全都是String类型的，使用schema导入的时候可以指定字段的数据类型

import osfrom pyspark import SparkConf, SparkContext
from pyspark.sql import SparkSession
from pyspark.sql.types import StringType, StructType, StructField, IntegerTypeif __name__ == '__main__':os.environ['JAVA_HOME'] = 'C:/Program Files/Java/jdk1.8.0_131'# 配置Hadoop的路径，就是前面解压的那个路径os.environ['HADOOP_HOME'] = r'D:\BigDate\05-Hadoop\software\hadoop-3.3.1'# 配置base环境Python解析器的路径os.environ['PYSPARK_PYTHON'] = 'C:/ProgramData/Miniconda3/python.exe'  # 配置base环境Python解析器的路径os.environ['PYSPARK_DRIVER_PYTHON'] = 'C:/ProgramData/Miniconda3/python.exe'# 创建spark对象spark = SparkSession \.builder \.appName("测试本地连接hive") \.master("local[2]") \.config("spark.sql.warehouse.dir", 'hdfs://bigdata01:9820/user/hive/warehouse') \.config('hive.metastore.uris', 'thrift://bigdata01:9083') \  #9083 metastore的端口号.config("spark.sql.shuffle.partitions", 2) \.enableHiveSupport() \.getOrCreate()# 如果没有这样指定表头的数据类型，导入hive中的数据类型全都是String 类型的# 指定了之后，表头的数据类型就是指定的了dept_schema = StructType([StructField(name="id", dataType=IntegerType(), nullable=False),StructField(name="name", dataType=StringType(), nullable=True),StructField(name="address", dataType=StringType(), nullable=True),])df = spark.read.format("csv").load("../../datas/zuoye/dept.csv",schema=dept_schema)df.show()df.write.saveAsTable("homework.dept1")spark.stop()

连接DataGrip

通过DataGrip连接 spark（读取的是hive中的数据）

/opt/installs/spark/sbin/start-thriftserver.sh --hiveconf hive.server2.thrift.port=10001 --hiveconf hive.server2.thrift.bind.host=bigdata01 --master yarn --conf spark.sql.shuffle.partitions=2

一个综合案例：

1-统计查询每个省份的总销售额【订单金额要小于1万】：省份、订单金额

2-统计查询销售额最高的前3个省份中，统计各省份单日销售额超过1000的各省份的店铺个数

只对销售额最高的前3个省份做统计：将这三个省份的数据过滤出来
统计每个省份每个店铺每天的销售额超过1000的店铺个数
省份、店铺id【去重】、销售额、天

3-统计查询销售额最高的前3个省份中，每个省份的平均订单金额

只对销售额最高的前3个省份做统计：将这三个省份的数据过滤出来
按照省份分组，求订单金额平均值

4-统计查询销售额最高的前3个省份中，每个省份的每种支付类型的占比

只对销售额最高的前3个省份做统计：将这三个省份的数据过滤出来
支付类型：微信、刷卡、支付宝、现金
支付类型的占比 = 类型支付个数 / 总个数
分组：每个省份每种类型支付的个数 / 每个省份总支付个数
省份、支付类型

读取数据变成DataFrame，并对不合法的数据进行清洗【过滤、转换】

订单金额超过10000的订单不参与统计
storeProvince不为空：None，也不为 ‘null’值
只保留需要用到的字段，将字段名称转换成Python规范：a_b_c
并对时间戳进行转换成日期，获取天
对订单金额转换为decimal类型

import osfrom pyspark import SparkConf, SparkContext
from pyspark.sql import SparkSessionif __name__ == '__main__':os.environ['JAVA_HOME'] = 'C:/Program Files/Java/jdk1.8.0_131'# 配置Hadoop的路径，就是前面解压的那个路径os.environ['HADOOP_HOME'] = r'D:\BigDate\05-Hadoop\software\hadoop-3.3.1'# 配置base环境Python解析器的路径os.environ['PYSPARK_PYTHON'] = 'C:/ProgramData/Miniconda3/python.exe'  # 配置base环境Python解析器的路径os.environ['PYSPARK_DRIVER_PYTHON'] = 'C:/ProgramData/Miniconda3/python.exe'# 创建spark对象spark = SparkSession.builder.master("local[2]").appName("第一次构建SparkSession").config("spark.sql.shuffle.partitions", 2).getOrCreate()df = spark.read.json("../../datas/function/retail.json")df.createOrReplaceTempView("orders")# spark.sql("""#     select * from orders# """).show()'''- 核心字段- "storeProvince"：订单所在的省份信息，例如：湖南省- "storeID"：订单所产生的店铺ID，例如：4064- "receivable"：订单收款金额：例如：22.5- "payType"：订单支付方式，例如：alipay- "dateTS"：订单产生时间，例如：1563758583000'''#数据清洗clearDf = spark.sql("""select storeProvince store_province,storeID store_id,cast(receivable as decimal(10,2)) receivable,payType pay_type,from_unixtime(dateTS/1000,"yyyy-MM-dd") date_tSfrom orders where receivable < 10000 and storeProvince is not null and storeProvince != 'null'""")clearDf.createOrReplaceTempView("clear_orders")# 1-统计查询每个省份的总销售额【订单金额要小于1万】：省份、订单金额df1 = spark.sql("""select store_province,sum(receivable) total_money from clear_orders group by store_province""")df1.createOrReplaceTempView("province_total_money")# 统计查询销售额最高的前3个省份中，统计各省份单日销售额超过1000的各省份的店铺个数# 只对销售额最高的前3个省份做统计：将这三个省份的数据过滤出来qiansanDf = spark.sql("""select * from clear_orders where store_province in (select store_province from province_total_money order by total_money desc limit 3)""")qiansanDf.createOrReplaceTempView("qs_province")# 统计每个省份每个店铺每天的销售额超过1000的店铺个数# spark.sql("""#     select store_province,count(distinct store_id) from qs_province group by store_province having sum(receivable) > 1000# """).show()spark.sql("""with t as(select date_ts,store_id,store_province from qs_province group by date_ts,store_id,store_province having sum(receivable) > 1000)select store_province,count(distinct store_id) store_num from t group by store_province""").show()qiansanDf.createOrReplaceTempView("qs_details")# 统计查询销售额最高的前3个省份中，统计各省份单日销售额超过1000的各省份的店铺个数spark.sql("""with t as(select date_ts,store_id,store_province from qs_details group by date_ts,store_id,store_province having sum(receivable) > 1000)select store_province,count(distinct store_id) store_num from t group by store_province""").show()# 每个省份的平均订单金额spark.sql("""select store_province,round(avg(receivable),2) avg_receivable from qs_details group by store_province""").show()# 每个省份的每种支付类型的占比spark.sql("""with t as(select store_province,pay_type,count(1) total_order from  qs_details group by store_province,pay_type)select store_province,pay_type,round(total_order/(sum(total_order) over(partition by store_province )),2) rate from t """).show()spark.stop()

spark的学习-06

SparkSQL读写数据的方式 1）输入Source 方式一：给定读取数据源的类型和地址 spark.read.format("json").load(path) spark.read.format("csv").load(path) spark.read.format("parquet").load(path) 方式二&#xff1a…...

编程日记 2024/11/12 9:21:58

本文目录 Linux C语言 socket 编程 client 端头文件 unistd.h & arpa/inet.h1. **unistd.h**2. **arpa/inet.h** socket() 创建套接字sockaddr_in 结构体inet_pton()connect()send()recv()send() 和 recv() 中的 flags 参数**默认行为（flags 0）的特…...

编程日记 2024/11/12 9:20:57

Flutter错误： uses-sdk:minSdkVersion 16 cannot be smaller than version 21 declared

前言今天要做蓝牙通信的功能，我使用了flutter_reactive_ble这个库，但是在运行的时候发现一下错误 Launching lib/main.dart on AQM AL10 in debug mode... /Users/macbook/Desktop/test/flutter/my_app/android/app/src/debug/AndroidManifest.xml Err…...

编程日记 2024/11/12 9:18:55

Spark 的容错机制：保障数据处理的稳定性与高效性

Spark 的介绍与搭建：从理论到实践_spark环境搭建-CSDN博客 Spark 的Standalone集群环境安装与测试-CSDN博客 PySpark 本地开发环境搭建与实践-CSDN博客 Spark 程序开发与提交：本地与集群模式全解析-CSDN博客 Spark on YARN：Spark集群模式…...

编程日记 2024/11/12 9:15:52

TCP可靠连接的建立和释放，TCP报文段的格式，UDP简单介绍

TCP连接的建立（三次握手） 建立连接使用的三报文 SYN 报文仅用于 TCP 三次握手中的第一个和第二个报文（SYN 和 SYN-ACK），用于初始化连接的序列号。数据传输阶段不再使用 SYN 标志。 SYN 报文通常只携带连接请求信息&a…...

编程日记 2024/11/12 9:14:51

LLMs之PDF：zeroX(一款PDF到Markdown 的视觉模型转换工具)的简介、安装和使用方法、案例应用之详细攻略

LLMs之PDF：zeroX(一款PDF到Markdown 的视觉模型转换工具)的简介、安装和使用方法、案例应用之详细攻略目录 zeroX的简介 1、支持的文件类型 zeroX的安装和使用方法 T1、Node.js 版本： 安装使用方法使用文件 URL： 使用本地路径&…...

编程日记 2024/11/12 9:13:50

开源数据库 - mysql - mysql-server-8.4(gtid主主同步+ keepalived热切换)部署方案

前置条件假设主从信息 mysqlhostport主192.168.1.13306从192.168.1.23306vip192.168.1.3 部署流程导出测试环境表结构与数据使用mysqldump ./mysqldump -ulzzc -p -S /tmp/mysql3306.sock --single-transaction --database lzzc > databaseLZZCxxxx.sql查看gtid号 …...

编程日记 2024/11/12 9:10:46

Java全栈体系路线

Java全栈体系路线摘要 Java 是一门广泛应用于企业级开发的语言，具有强大的生态系统和丰富的工具支持。成为一名 Java 全栈开发工程师不仅需要掌握后端开发技能，还需要具备前端开发和数据库管理的能力。本文将详细介绍 Java 全栈开发的学习路线&#x…...

编程日记 2024/11/12 9:09:43

【Unity基础】Unity中如何导入字体？

在Unity中，不能像其他软件一样直接使用字体文件，需要通过FontAssetCreator将其转换成Texture的Asset文件，然后才能使用。本文介绍了使用FontAssetCreator导入字体的过程，并对其参数设置进行了说明。 Font Asset Creator 是 Uni…...

编程日记 2024/11/12 9:04:38

使用NVIDIA GPU加速FFmpeg视频压制：完全指南

引言在视频处理领域，FFmpeg是一个强大的工具。结合NVIDIA的硬件编码器NVENC，我们可以实现快速高效的视频压制。本文将详细解析一个实用的视频压制命令，帮助你理解每个参数的作用。核心命令 ffmpeg -i input.mp4 -vf scale640:360 -c:v h…...

编程日记 2024/11/12 8:57:29

Python学习：scipy是什么？

文章目录一、Scipy简介二、Scipy的组成部分1. 基础功能：2. 特殊函数：3. 优化：4. 积分：5. 插值：6. 信号处理：7. 图像处理：8. 统计分布：9. 空间数据结构和算法：10. 稀疏矩…...

编程日记 2024/11/12 8:56:28

spark的学习-05

SparkSql 结构化数据与非结构化数据结构化数据就类似于excel表中的数据（统计的都是结构化的数据）一般都使用sparkSql处理结构化的数据结构化的文件：JSON、CSV【以逗号分隔】、TSV【以制表符分隔】、parquet、orc 结构化的表：…...

编程日记 2024/11/12 8:54:25

SQL注入（SQL Injection）详解

SQL注入（SQL Injection）是一种代码注入技术，它通过在应用程序的输入字段中插入或“注入”恶意的SQL语句，从而操控后端数据库服务器执行非预期的命令。这种攻击方式常用于绕过应用程序的安全措施，未经授权地访问、修改或…...

编程日记 2024/11/12 8:53:24

深入解析 OpenHarmony 构建系统-2-目录结构与核心组件

引言 OpenHarmony作为一款面向全场景的分布式操作系统，其构建系统在开发过程中扮演着至关重要的角色。本文将详细介绍OpenHarmony构建系统的目录结构和核心组件，帮助开发者更好地理解和使用这一强大的工具。目录结构概览以下是OpenHarmony构建系统的目录结构，每个目录和…...

编程日记 2024/11/12 8:50:19

网络安全应急响应(归纳)

目录一、概述二、理论系统排查系统基本信息 windowsLinux用户信息 WindowsLinux启动项：开机系统在前台或者后台运行的程序，是病毒等实现持久化驻留的常用方法。 WindowsLinux任务计划：由于很多计算机都会自动加载“任务计划”&#xff0c…...

编程日记 2024/11/12 8:49:18

【网络协议栈】网络层（上）网络层的基本理解、IP协议格式、网络层分组（内附手画分析图简单易懂）

绪论 “It does not matter how slowly you go as long as you do not stop.”。本章是自上而下的进入网络协议栈的第三个篇幅–网络层–，本章我将带你了解网络层，以及网络层中非常重要的IP协议格式和网络层的分片组装问题，后面将持续更新网…...

编程日记 2024/11/12 8:42:11

数据库类型介绍

1. 关系型数据库（RDBMS） 关系型数据库是最常见的一类数据库，它们通过表（Table）来存储数据，表之间通过关系（如主键和外键）来关联。 • MySQL：开源的关系型数据库管理系统&…...

编程日记 2024/11/12 8:40:10

一步一步从asp.net core mvc中访问asp.net core WebApi

"从asp.net core mvc中访问asp.net core WebApi"看到这个标题是不是觉得很绕口啊，但的确就是要讲一讲这样的访问。前面我们介绍了微信小程序访问asp.net core webapi(感兴趣的童鞋可以看看前面的博文有关WEBAPI的搭建)，这里我们重点不关心如何…...

编程日记 2024/11/12 8:39:08

linux中kubectl命令使用

一.命令介绍 kubectl 是 Kubernetes 集群管理的命令行工具，用于与 Kubernetes API 交互。你可以通过它来管理和操作 Kubernetes 集群中的资源，如 Pod、Deployment、Service 等。下面是如何在不同操作系统上下载和使用 kubectl 的方法。二.下载 kubect…...

编程日记 2024/11/12 8:34:04

Linux 系统结构

Linux系统一般有4个主要部分：内核、shell、文件系统和应用程序。内核、shell和文件系统一起形成了基本的操作系统结构，它们使得用户可以运行程序、管理文件并使用系统。 1. linux内核内核是操作系统的核心，具有很多最基本功能，它…...

编程日记 2024/11/12 8:33:03

ESP32-S3设备智能化升级，物联网无线AI语音交互，让生活更加便捷和有趣

在人工智能和物联网技术的推动下，无线AI语音交互技术正在成为智能设备的新选择。这种技术的发展，不仅改变了我们与设备的沟通方式，更开启了一个新的智能交互方案。想象一下，通过简单的语音指令，就能控制家中的灯光、…...

编程日记 2024/11/12 8:31:00

Python的函数（补充浅拷贝和深拷贝）

一、定义函数的定义：实现【特定功能】的代码块。形参：函数定义时的参数，没有实际意义实参：函数调用/使用时的参数，有实际意义函数的作用： 简化代码提高代码重用性便于维护和修改提高代码的可扩展性…...

编程日记 2024/11/12 8:28:58

oracle查询字段类型长度等字段信息

1.查询oracle数据库的字符集 SELECT * FROM NLS_DATABASE_PARAMETERS WHERE PARAMETER NLS_CHARACTERSET; 2.查询字段长度类型 SELECT * FROM user_tab_columns WHERE table_name user AND COLUMN_NAME SNAME 请确保将user替换为您想要查询的表名。sname为字段名这里的字…...

编程日记 2024/11/12 8:21:52

C语言 | Leetcode C语言题解之第559题N叉树的最大深度

题目： 题解： /*** Definition for a Node.* struct Node {* int val;* int numChildren;* struct Node** children;* };*/int maxDepth(struct Node* root) {if (!root) {return 0;}int depth 0;// 创建空队列const int qCap 10e4 1;str…...

编程日记 2024/11/12 8:19:50

光流法（Optical Flow）

一、简介光流法（Optical Flow）是一种用于检测图像序列中像素运动的计算机视觉技术。其基于以下假设： 1.亮度恒定性假设：物体在运动过程中，其像素值在不同帧中保持不变。 2.空间和时间上的连续性：相邻像素之…...

编程日记 2024/11/12 8:17:47

Rancher的安装

1. 概览 1.1 用户界面优势 Rancher 提供了一个直观的图形用户界面（GUI）。对于不熟悉 Kubernetes 复杂的命令行操作（如使用kubectl）的用户来说，通过 Rancher 的界面可以方便地进行资源管理。例如，用户可以在…...

编程日记 2024/11/12 8:14:43

【Linux】获得同一子网下当前在线设备IP/Latency/MAC 通过nmap指定CIDR扫描当前在线设备

【Linux】获得同一子网下当前在线设备IP/Latency/MAC 通过nmap指定CIDR扫描当前在线设备通过路由器的后台，查看当前在线设备，受到网卡版本的影响，有时会有部分设备看不见MAC和分配的IP。此时，可以借助命令行工具扫描子网下所有连…...

编程日记 2024/11/12 8:13:40

Ubuntu22.04安装DataEase

看到DataEase的驾驶舱，感觉比PowerBI要好用一点，于是搭建起来玩玩。Dataease推荐的操作系统是Ubuntu22.04/Centos 7。下载了Ubuntu22.04和DataEase 最新版本的离线安装包一.安装ubuntu22.04 在安装的时候，没有顺手设置IP地址信息&#xff…...

编程日记 2024/11/12 8:12:34

Taro React-Native IOS 打包发布

http网络请求不到配置 fix react-native facebook::flipper::SocketCertificateProvider‘ (aka ‘int‘) is not a function or func_rn运行debug提示flipper-CSDN博客 Xcode 15（iOS17）编译适配报错_no template named function in namespace std-CS…...

编程日记 2024/11/12 8:11:33

【卷积神经网络CNN】基于深度学习动物图像识别系统（完整系统源码+数据库+开发笔记+详细部署教程+启动教程）✅

目录【卷积神经网络CNN】基于深度学习动物图像识别系统（完整系统源码数据库开发笔记详细部署教程启动教程）✅ 一、项目背景二、项目目标三、项目创新点四、项目功能五、开发技术介绍六、数据库设计七、启动步骤八、项目功能展示九、开…...

编程日记 2024/11/12 8:08:30