当前位置：首页 > news >正文

摸鱼大数据——Spark SQL——DataFrame详解一

news 文章来源：https://blog.csdn.net/weixin_65694308/article/details/140060191 2024/10/6 4:07:18

1.DataFrame基本介绍

 DataFrame表示的是一个二维的表。二维表，必然存在行、列等表结构描述信息表结构描述信息(元数据Schema): StructType对象字段: StructField对象，可以描述字段名称、字段数据类型、是否可以为空行: Row对象列: Column对象，包含字段名称和字段值在一个StructType对象下，由多个StructField组成，构建成一个完整的元数据信息

如何构建表结构信息数据：

2.DataFrame的构建方式

 方式1: 使用SparkSession的createDataFrame(data,schema)函数创建data参数1.基于List列表数据进行创建2.基于RDD弹性分布式数据集进行创建3.基于pandas的DataFrame数据进行创建schema参数1: 字符串格式一 :“字段名1 字段类型,字段名2 字段类型”格式二(推荐):“字段名1:字段类型,字段名2:字段类型”2: List格式: ["字段名1","字段名2"]  3: DataType（推荐，用的最多）格式一:schema=StructType().add('字段名1',字段类型).add('字段名2',字段类型)格式二:schema=StructType([StructField('字段名1',类型),StructField('字段名1',类型)])方式2: 使用DataFrame的toDF(colNames)函数创建DataFrame的toDF方法是一个在Apache Spark的DataFrame API中用来创建一个新的DataFrame的方法。这个方法可以将一个RDD转换为DataFrame，或者将一个已存在的DataFrame转换为另一个DataFrame。在Python中，你可以使用toDF方法来指定列的名字。如果你不指定列的名字，那么默认的列的名字会是_1, _2等等。 格式: rdd.toDF([列名])方式3: 使用SparkSession的read()函数创建在 Spark 中，SparkSession 的 read 是用于读取数据的入口点之一，它提供了各种方法来读取不同格式的数据并将其加载到 Spark 中进行处理。统一API格式: spark.read.format('text|csv|json|parquet|orc|...')  : 读取外部文件的方式.option('k','v')   : 选项  可以设置相关的参数 (可选).schema(StructType | String)  :  设置表的结构信息.load('加载数据路径')  : 读取外部文件的路径, 支持 HDFS 也支持本地简写API格式:注意: 以上所有的外部读取方式，都有简单的写法。spark内置了一些常用的读取方案的简写格式: spark.read.文件读取方式()注意: parquet:是Spark中常用的一种列式存储文件格式和Hive中的ORC差不多, 他俩都是列存储格式

2.1 createDataFrame()创建

场景：一般用在开发和测试中。因为只能处理少量的数据

2.1.1 基于列表

 # 导包import osfrom pyspark.sql import SparkSession# 绑定指定的python解释器os.environ['SPARK_HOME'] = '/export/server/spark'os.environ['PYSPARK_PYTHON'] = '/root/anaconda3/bin/python3'os.environ['PYSPARK_DRIVER_PYTHON'] = '/root/anaconda3/bin/python3'# 创建main函数if __name__ == '__main__':# 1.创建SparkContext对象spark = SparkSession.builder.appName('pyspark_demo').master('local[*]').getOrCreate()# 2.创建DF对象data = [(1, '张三', 18), (2, '李四', 28), (3, '王五', 38)]df1 = spark.createDataFrame(data,schema=['id','name','age'])# 展示数据df1.show()# 查看结构信息df1.printSchema()print('---------------------------------------------------------')df2 = spark.createDataFrame(data,schema='id int,name string,age int')# 展示数据df2.show()# 查看结构信息df2.printSchema()print('---------------------------------------------------------')df3 = spark.createDataFrame(data,schema='id:int,name:string,age:int')# 展示数据df3.show()# 查看结构信息df3.printSchema()# 3.关闭资源spark.stop()

2.1.2 基于RDD普通方式

场景：RDD可以存储任意结构的数据；而DataFrame只能处理二维表数据。在使用Spark处理数据的初期，可能输入进来的数据是半结构化或者是非结构化的数据，那么可以先通过RDD对数据进行ETL处理成结构化数据，再使用开发效率高的SparkSQL来对后续数据进行处理分析。

Schema选择StructType对象来定义DataFrame的“表结构”转换RDD

 # 导包import osfrom pyspark.sql import SparkSession# 绑定指定的python解释器from pyspark.sql.types import StructType, StringType, StructFieldos.environ['SPARK_HOME'] = '/export/server/spark'os.environ['PYSPARK_PYTHON'] = '/root/anaconda3/bin/python3'os.environ['PYSPARK_DRIVER_PYTHON'] = '/root/anaconda3/bin/python3'# 创建main函数if __name__ == '__main__':# 1.创建SparkContext对象spark = SparkSession.builder.appName('pyspark_demo').master('local[*]').getOrCreate()sc = spark.sparkContext# 2.读取生成rddtextRDD = sc.textFile('file:///export/data/spark_project/spark_sql/data/data1.txt')print(type(textRDD)) # <class 'pyspark.rdd.RDD'>etlRDD = textRDD.map(lambda line:line.split(',')).map(lambda l:(l[0],l[1]))# 3.定义schema结构信息schema1 = StructType().add('name',StringType(),True).add('age',StringType(),True)schema2 = StructType([StructField('name',StringType(),True),StructField('age',StringType(),True)])schema3 = ['name','age']schema4 = 'name string,age string'schema5 = 'name:string,age:string'# 4.创建DF对象dfpeople = spark.createDataFrame(etlRDD,schema5)# 5.df展示结构信息dfpeople.show()dfpeople.printSchema()# 6.拓展: 创建临时视图,方便sql查询dfpeople.createTempView('peoples')r = spark.sql('select * from peoples')r.show()# 7.关闭资源sc.stop()spark.stop()

2.1.3 基于RDD反射方式

Schema使用反射方法来推断Schema模式Spark SQL 可以将 Row 对象的 RDD 转换为 DataFrame，从而推断数据类型。

 # 导包import osfrom pyspark.sql import SparkSession# 绑定指定的python解释器from pyspark.sql.types import StructType, StringType, StructField, Rowos.environ['SPARK_HOME'] = '/export/server/spark'os.environ['PYSPARK_PYTHON'] = '/root/anaconda3/bin/python3'os.environ['PYSPARK_DRIVER_PYTHON'] = '/root/anaconda3/bin/python3'# 创建main函数if __name__ == '__main__':# 1.创建SparkContext对象spark = SparkSession.builder.appName('pyspark_demo').master('local[*]').getOrCreate()sc = spark.sparkContext# 2.读取生成rdd# 3.定义schema结构信息textRDD = sc.textFile('file:///export/data/spark_project/spark_sql/data/data1.txt')etlRDD_schema = textRDD.map(lambda line:line.split(',')).map(lambda l:Row(name=l[0],age=l[1]))# 4.创建DF对象dfpeople = spark.createDataFrame(etlRDD_schema)# 5.df展示结构信息dfpeople.show()dfpeople.printSchema()# 6.拓展: 创建临时视图,方便sql查询dfpeople.createTempView('peoples')r = spark.sql('select * from peoples')r.show()# 7.关闭资源sc.stop()spark.stop()

2.2 toDF()创建

schema模式编码在字符串中,toDF参数用于指定列的名字。如果你不指定列的名字，那么默认的列的名字会是_1, _2等等。

 # 导包import osfrom pyspark.sql import SparkSession# 绑定指定的python解释器from pyspark.sql.types import StructType, StringType, StructField, Rowos.environ['SPARK_HOME'] = '/export/server/spark'os.environ['PYSPARK_PYTHON'] = '/root/anaconda3/bin/python3'os.environ['PYSPARK_DRIVER_PYTHON'] = '/root/anaconda3/bin/python3'# 创建main函数if __name__ == '__main__':# 1.创建SparkContext对象spark = SparkSession.builder.appName('pyspark_demo').master('local[*]').getOrCreate()sc = spark.sparkContext# 2.读取生成rdd# 3.定义schema结构信息textRDD = sc.textFile('file:///export/data/spark_project/spark_sql/data/data1.txt')etlRDD = textRDD.map(lambda line:line.split(','))# 4.创建DF对象dfpeople = etlRDD.toDF(['name','age'])# 5.df展示结构信息dfpeople.show()dfpeople.printSchema()# 6.拓展: 创建临时视图,方便sql查询dfpeople.createTempView('peoples')r = spark.sql('select * from peoples')r.show()# 7.关闭资源sc.stop()spark.stop()

2.3 read读取外部文件

复杂API

 统一API格式: spark.read.format('text|csv|json|parquet|orc|avro|jdbc|.....') # 读取外部文件的方式.option('k','v') # 选项  可以设置相关的参数 (可选).schema(StructType | String) #  设置表的结构信息.load('加载数据路径') # 读取外部文件的路径, 支持 HDFS 也支持本地

简写API

 请注意: 以上所有的外部读取方式，都有简单的写法。spark内置了一些常用的读取方案的简写格式: spark.read.读取方式()例如: df = spark.read.csv(path='file:///export/data/_03_spark_sql/data/stu.txt',header=True,sep=' ',inferSchema=True,encoding='utf-8',)

2.3.1 Text方式读取

 text方式读取文件：1- 不管文件中内容是什么样的，text会将所有内容全部放到一个列中处理2- 默认生成的列名叫value，数据类型string3- 只能够在schema中修改字段value的名称，其他任何内容不能修改

 # 导包import osfrom pyspark.sql import SparkSession# 绑定指定的python解释器from pyspark.sql.types import StructType, StringType, StructField, Rowos.environ['SPARK_HOME'] = '/export/server/spark'os.environ['PYSPARK_PYTHON'] = '/root/anaconda3/bin/python3'os.environ['PYSPARK_DRIVER_PYTHON'] = '/root/anaconda3/bin/python3'# 创建main函数if __name__ == '__main__':# 1.创建SparkContext对象spark = SparkSession.builder.appName('pyspark_demo').master('local[*]').getOrCreate()# 2.读取数据# 注意: 读取text文件默认只有1列,且列名交value,可以通过schema修改df = spark.read\.format('text')\.schema('info string')\.load('file:///export/data/spark_project/spark_sql/data/data1.txt')# 5.df展示结构信息df.show()df.printSchema()# 6.拓展: 创建临时视图,方便sql查询df.createTempView('peoples')r = spark.sql('select * from peoples')r.show()# 6.关闭资源spark.stop()

2.3.2 CSV方式读取

 csv格式读取外部文件：1- 复杂API和简写API都必须掌握2- 相关参数作用说明：2.1- path：指定读取的文件路径。支持HDFS和本地文件路径2.2- schema：手动指定元数据信息2.3- sep：指定字段间的分隔符2.4- encoding：指定文件的编码方式2.5- header：指定文件中的第一行是否是字段名称2.6- inferSchema：根据数据内容自动推断数据类型。但是，推断结果可能不精确

 # 导包import osfrom pyspark.sql import SparkSession# 绑定指定的python解释器from pyspark.sql.types import StructType, StringType, StructField, Rowos.environ['SPARK_HOME'] = '/export/server/spark'os.environ['PYSPARK_PYTHON'] = '/root/anaconda3/bin/python3'os.environ['PYSPARK_DRIVER_PYTHON'] = '/root/anaconda3/bin/python3'# 创建main函数if __name__ == '__main__':# 1.创建SparkContext对象spark = SparkSession.builder.appName('pyspark_demo').master('local[*]').getOrCreate()# 2.读取数据# 注意: csv文件可以识别多个列,可以使用schema指定列名,类型# 原始方式# df = spark.read\#     .format('csv')\#     .schema('name string,age int')\#     .option('sep',',')\#     .option('encoding','utf8')\#     .option('header',False)\#     .load('file:///export/data/spark_project/spark_sql/data/data1.txt')# 简化方式df = spark.read.csv(schema='name string,age int',sep=',',encoding='utf8',header=False,path='file:///export/data/spark_project/spark_sql/data/data1.txt')# 5.df展示结构信息df.show()df.printSchema()# 6.拓展: 创建临时视图,方便sql查询df.createTempView('peoples')r = spark.sql('select * from peoples')r.show()# 7.关闭资源spark.stop()

2.3.3 JSON方式读取

 json读取数据：1- 需要手动指定schema信息。如果手动指定的时候，字段名称与json中的key名称不一致，会解析不成功，以null值填充2- csv/json中schema的结构，如果是字符串类型，那么字段名称和字段数据类型间，只能以空格分隔

json的数据内容

 {'id': 1,'name': '张三','age': 20}{'id': 2,'name': '李四','age': 23,'address': '北京'}{'id': 3,'name': '王五','age': 25}{'id': 4,'name': '赵六','age': 29}

代码实现

 # 导包import osfrom pyspark.sql import SparkSession# 绑定指定的python解释器from pyspark.sql.types import StructType, StringType, StructField, Rowos.environ['SPARK_HOME'] = '/export/server/spark'os.environ['PYSPARK_PYTHON'] = '/root/anaconda3/bin/python3'os.environ['PYSPARK_DRIVER_PYTHON'] = '/root/anaconda3/bin/python3'# 创建main函数if __name__ == '__main__':# 1.创建SparkContext对象spark = SparkSession.builder.appName('pyspark_demo').master('local[*]').getOrCreate()# 2.读取数据# 注意: json的key和schema指定的字段名不一致,会用null补充,如果没有数据也是用null补充# 简化方式df = spark.read.json(schema='id int,name string,age int,address string',encoding='utf8',path='file:///export/data/spark_project/spark_sql/data/data2.txt')# 5.df展示结构信息df.show()df.printSchema()# 6.拓展: 创建临时视图,方便sql查询df.createTempView('peoples')r = spark.sql('select * from peoples')r.show()# 关闭资源spark.stop()

摸鱼大数据——Spark SQL——DataFrame详解一

1.DataFrame基本介绍 DataFrame表示的是一个二维的表。二维表，必然存在行、列等表结构描述信息表结构描述信息(元数据Schema): StructType对象字段: StructField对象，可以描述字段名称、字段数据类型、是否可以为空行: Row对象列: Column对象&#xff…...

编程日记 2024/7/7 14:49:40

【Java探索之旅】初识多态_概念_实现条件

文章目录 📑前言一、多态1.1 概念1.2 多态的实现条件 🌤️全篇总结 📑前言多态作为面向对象编程中的重要概念，为我们提供了一种灵活而强大的编程方式。通过多态，同一种操作可以应用于不同的对象，并根据对象…...

编程日记 2024/7/7 14:48:38

[Day 26] 區塊鏈與人工智能的聯動應用：理論、技術與實踐

數據科學與AI的整合應用數據科學（Data Science）和人工智能（AI）在現代技術世界中扮演著至關重要的角色。兩者的整合應用能夠為企業和研究人員提供強大的工具，以更好地理解、預測和解決各種複雜的問題。本文將深入探討…...

编程日记 2024/7/7 14:47:37

算法 —— 滑动窗口

目录长度最小的子数组无重复字符的最长子串最大连续1的个数将x减到0的最小操作数找到字符串中所有字母异位词最小覆盖子串长度最小的子数组 sum比target小就进窗口，sum比target大就出窗口，由于数组是正数，所以相加会使sum变大&…...

编程日记 2024/7/7 14:44:34

【设计模式】工厂模式（定义 | 特点 | Demo入门讲解）

文章目录定义简单工厂模式案例 | 代码Phone顶层接口设计Meizu品牌类Xiaomi品牌类PhoneFactory工厂类Customer 消费者类工厂方法模式案例 | 代码PhoneFactory工厂类 Java高级特性---工厂模式与反射的高阶玩法方案：反射工厂模式总结其实工厂模式就是用一个代理类帮…...

编程日记 2024/7/7 14:43:32

Linux之计划和日志

计划任务计划任务概念解析在Linux操作系统中，除了用户即时执行的命令操作以外，还可以配置在指定的时间、指定的日期执行预先计划好的系统管理任务（如定期备份、定期采集监测数据）。通过安装at和crontabs这两个系统服务实现一次性、周期性计划任务的功能，并分别通过at、…...

编程日记 2024/7/7 14:42:31

C++ 多态篇

文章目录 1. 多态的概念和实现1.1 概念1.2 实现1.2.1 协变1.2.2 析构函数1.2.3 子类虚函数不加virtual 2. C11 final和override3.1 final3.2 override 3. 函数重载、重写与隐藏4. 多态的原理5. 抽象类6.单继承和多继承的虚表6.1 单继承6.2 多继承 7. 菱形继承的虚表(了解)7.1 菱…...

编程日记 2024/7/7 14:41:29

LVGL-SquareLine Studio ■ SquareLine Studio-官网下载地址■ SquareLine Studio-参考博客■ SquareLine Studio-安装■ SquareLine Studio-汉化■ SquareLine Studio-■ SquareLine Studio-■ SquareLine Studio-■ SquareLine Studio-■ SquareLine Studio- ■ SquareLine S…...

编程日记 2024/7/7 14:38:27

mysqli 与mysql 区别和联系, 举例说明

mysqli是一种PHP的扩展，用于与MySQL数据库进行交互。它提供了一套面向对象的接口，可以更方便地操作数据库。MySQL是一种关系型数据库管理系统，用于存储和管理数据。区别： mysqli是MySQL的扩展，而不是单独的数据库管…...

编程日记 2024/7/7 14:36:25

【SpringCloud应用框架】Nacos安装和服务提供者注册

第二章 Spring Cloud Alibaba Nacos之Nacos安装和服务提供者注册文章目录 Nacos介绍为何使用Nacos？一、Nacos下载和安装1. 下载2. 安装Linux/Unix/MacWindows 二、Nacos服务提供者注册1. Nacos代替Eureka2. Nacos服务注册中心3. 引入Nacos Discovery进行服务注册/发…...

编程日记 2024/7/7 14:35:24

英语学习交流小程序的设计

管理员账户功能包括：系统首页，个人中心，用户管理，每日打卡管理，备忘录管理，学习计划管理，学习资源管理，论坛交流微信端账号功能包括：系统首页，学习资源&…...

编程日记 2024/7/7 14:34:22

实现Java多线程中的线程间通信

实现Java多线程中的线程间通信大家好，我是微赚淘客系统3.0的小编，也是冬天不穿秋裤，天冷也要风度的程序猿！ 1. 线程间通信的基本概念在线程编程中，线程间通信是指多个线程之间通过共享内存或消息传递的方式进行交…...

编程日记 2024/7/7 14:32:20

C++模板元编程(一)——可变参数模板

这个系列主要记录C模板元编程的常用语法文章目录引言语法应用函数模板可变参数的打印可变参数的最小/最大函数类模板参考文献引言在C11之前，函数模板和类模板只支持含有固定数量的模板参数。C11增强了模板功能，允许模板定义中包含任意个(包括0个)…...

编程日记 2024/7/7 14:31:19

kafka中

Kafka RocketMQ概述 RabbitMQ概述 ActiveMQ概述 ZeroMQ概述 MQ对比选型适用场景-从公司基础建设力量角度出发适用场景-从业务场景出发 Kafka配置介绍运行Kafka 安装ELAK 配置EFAK EFAK界面 KAFKA常用术语 Kafka常用指令 Kafka中消息读取单播消息 group.id 相同多播消息 g…...

编程日记 2024/7/7 14:28:14

Android 获取当前电池状态

在 API 级别 23 上获取充电状态要在 API 级别 23 上获取电池的当前状态，只需使用电池管理器系统服务： BatteryManager batteryManager (BatteryManager) getSystemService(BATTERY_SERVICE); boolean isCharging batteryManager.isCharging();使用 S…...

编程日记 2024/7/7 14:27:13

【JVM 的内存模型】

1. JVM内存模型下图为JVM内存结构模型： 两种执行方式： 解释执行：JVM是由C语言编写的，其中有C解释器，负责先将Java语言解释翻译为C语言。缺点是经过一次JVM翻译，速度慢一点。JIT执行：JIT编译器…...

编程日记 2024/7/7 14:26:12

【雷丰阳-谷粒商城】【分布式高级篇-微服务架构篇】【17】认证服务01—短信/邮件/异常/MD5

持续学习&持续更新中… 守破离【雷丰阳-谷粒商城】【分布式高级篇-微服务架构篇】【17】认证服务01 环境搭建验证码倒计时短信服务邮件服务验证码短信形式：邮件形式： 异常机制MD5参考环境搭建 C:\Windows\System32\drivers\etc\hosts 192.168.…...

编程日记 2024/7/7 14:24:09

geom buffer制作

1. auto buffer_geom line_string->buffer(15);//buffer //这个是x和y各扩大段15个单位 auto buffer_geom line_string->buffer(15);//buffer //这个是x和y各扩大段15米获取buffer坐标 auto boundary buffer_geom->getBoundary(); auto boundary_coords boun…...

编程日记 2024/7/7 14:22:07

微软正在放弃React

最近，微软Edge团队撰写了一篇文章，介绍了微软团队如何努力提升Edge浏览器的性能。但在文中，微软对React提出了批评，并宣布他们将不再在Edge浏览器的开发中使用React。我将详细解析他们的整篇文章内容，探讨这一决定对…...

编程日记 2024/7/7 14:20:05

U盘非安全退出后的格式化危机与高效恢复策略

在数字化时代，U盘作为数据存储与传输的重要工具，其数据安全备受关注。然而，一个常见的操作失误——U盘没有安全退出便直接拔出，随后再插入时却遭遇“需要格式化”的提示，这不仅让用户措手不及，更可能意味着…...

编程日记 2024/7/7 14:18:01

安卓虚拟位置修改

随着安卓系统的不断更新，确保软件和应用与最新系统版本的兼容性变得日益重要。本文档旨在指导用户如何在安卓14/15系统上使用特定的功能。 2. 系统兼容性更新 2.1 支持安卓14/15：更新了对安卓14/15版本的支持，确保了软件的兼容性。 2.2 路…...

编程日记 2024/7/7 14:15:59

大数据面试题之Presto[Trino](5)

目录 Presto的扩展性如何？ Presto如何与Hadoop生态系统集成？ Presto是否可以连接到NoSQL数据库？ 如何使用Presto查询Kafka中的数据？ Presto与Spark SQL相比有何优势和劣势？ Presto如何与云服务集成&#xff1…...

编程日记 2024/7/7 14:14:58

对编程开发人员在今年的一些建议

一、今年的大环境这几天身体不太好，又不断看到地狱级的就业问题。所以有些想法想和大家分享一下，并提出自己的一些想法和建议。今年的大环境不好，做为非专业人士，咱们也不分析，以免贻笑大方。但针对大环境下的计算机…...

编程日记 2024/7/7 14:13:56

VSCode设置好看清晰的字体！中文用鸿蒙，英文用Jetbrains Mono

一、中文字体——HarmonyOS Sans SC 1、下载字体官网地址：https://developer.huawei.com/consumer/cn/design/resource/ 直接下载：https://communityfile-drcn.op.dbankcloud.cn/FileServer/getFile/cmtyPub/011/111/111/0000000000011111111.20230517…...

编程日记 2024/7/7 14:12:53

SpringBoot新手快速入门系列教程四：创建第一个SringBoot的API

首先我们用IDEA新建一个项目，请将这些关键位置按照我的设置设置一下接下来我将要带着你一步一步创建一个Get请求和Post请求，通过客户端请求的参数，以json格式返回该参数{“message”:"Hello"} 1,先在IDE左上角把这里改为文件模式…...

编程日记 2024/7/7 14:10:50

第1集《修习止观坐禅法要》

《修习止观坐禅法要》诸位法师，诸位学员，阿弥院佛！ 我们今天能够暂时放下世间的尘劳，大家在一起研究佛法的课程，这件事情在我们的生命当中是非常的稀有难得。基本上，我们佛法的修习目的是追求身心的安乐…...

编程日记 2024/7/7 14:09:49

markdown变量引用

格式变量定义通常是路径或网络链接变量测试...

编程日记 2024/7/7 14:08:48

如何使用echart做K线图

使用ECharts制作K线图需要先引入ECharts的库文件，然后通过调用相应的API来配置和渲染K线图。以下是一个简单的示例代码： // 引入ECharts库文件 <script src"https://cdn.jsdelivr.net/npm/echarts5.0.0/dist/echarts.min.js"></scri…...

编程日记 2024/7/7 14:06:45

Spring Boot应用使用GraalVM本地编译相关配置

1. 介绍 Java应用程序可以通过Graalvm Native Image提前编译生成与本地机器相关的可执行文件。与在JVM执行java程序相比，Native Image占用内存更小和启动速度更快。从spring boot3开始支持GraalVM Native Image，因此要使用此特性，需要把sp…...

编程日记 2024/7/7 14:04:43

代码的坏味道——长函数

前言：一个函数应该尽量做一件事情，如果非要做多个事情，要做函数提取，每次迭代应该考虑到是否有重复代码或者可以优化的代码。长函数：长函数的产生： 逻辑是平铺直叙的需求迭代没有考虑优化，一次…...

编程日记 2024/7/7 14:02:41

【机器学习】基于密度的聚类算法：DBSCAN详解

🌈个人主页: 鑫宝Code 🔥热门专栏: 闲话杂谈｜ 炫酷HTML | JavaScript基础 💫个人格言: "如无必要，勿增实体" 文章目录基于密度的聚类算法：DBSCAN详解引言DBSCAN的基本概念点的分类聚类过…...

编程日记 2024/7/7 13:59:37

Qt 网络编程网络信息获取操作

学习目标：网络信息获取操作前置环境运行环境:qt creator 4.12 学习内容一、Qt 网络编程基础 Qt 直接提供了网络编程模块,包括基于 TCP/IP 的客户端和服务器相关类,如 QTcpSocket/QTcpServer 和 QUdpSocket,以及实现 HTTP、FTP 等协议的高级类,如 QNetworkRe…...

编程日记 2024/7/7 13:58:36

linux中的进程以及进程管理

程序和进程的区别和联系程序（Program）： 程序是一组指令的集合，通常存储在磁盘或其他存储设备上，是一种静态的概念。程序本身并没有运行，它只是一个可执行的文件或脚本，包含了一系列的指令和数…...

编程日记 2024/7/7 13:57:35

pyecharts可视化案例大全（11~20）

pyecharts可视化案例大全（11~20）十一、设置动画效果十二、直方图带视觉组件十三、设置渐变色(线性渐变)十四、设置渐变色(径向渐变)十五、设置分割线十六、设置分隔区域十七、面积图十八、堆叠面积图十九、自定义线样式二十、折线图平滑处理十一、设置动画效果在图表加载前…...

编程日记 2024/7/7 13:56:33

Docker在人工智能领域的应用与实战

摘要人工智能（AI）技术的快速发展带来了对高效开发和部署工具的需求。Docker作为一个创新的容器化平台，为AI领域提供了强大的支持。本文详细介绍了Docker在AI模型开发、训练、部署以及服务器集群管理等方面的应用，并探讨了其在数…...

编程日记 2024/7/7 13:55:32

python基础篇（8）：异常处理

在Python编程中，异常是程序运行时发生的错误，它会中断程序的正常执行流程。异常处理机制使得程序能够捕获这些错误，并进行适当的处理，从而避免程序崩溃。 1 错误类型代码的错误一般会有语法错误和异常错误两种，语法错…...

编程日记 2024/7/7 13:54:31

FortiClient 用IPsec VPN 远程拨号到FortiGate说明文档

说明：本文档针对IPsec VPN 中的Remote VPN 进行说明，即远程用户使用PC中的FortiClient软件，通过VPN拨号的方式连接到公司总部FortiGate设备，访问公司内部服务器。在配置之前需要统一VPN策略和参数，如模式… 说明&#…...

编程日记 2024/7/7 13:53:29

Git-Unity项目版本管理

目录准备GitHub新建项目并添加ssh密钥Unity文件夹本文记录如何用git对unity 项目进行版本管理，并可传至GitHub远端。准备名称版本windows11Unity2202.3.9.f1gitN.A.githubN.A. GitHub新建项目并添加ssh密钥 GitHub新建一个repositorywindows11 生成ssh-key&…...

编程日记 2024/7/7 13:52:28

每日一题~ leetcode 402 (贪心+单调栈)

click me! 这个贪心的推导在leetcode上已经很明确了。 click me! 删除k个数，可以先考虑删除一个数。这也是一种常见的思路。（如果进行同样的操作多次，可以先只考虑一次操作如何实现，或者他的影响。完成这一次操作后，…...

编程日记 2024/7/7 13:50:26

设计模式之模版方法

模版方法介绍模版方法（Template Method）模式是一种行为型设计模式，它定义了一个操作（模板方法）的基本组合与控制流程，将一些步骤（抽象方法）推迟到子类中，使得子类可以在…...

编程日记 2024/7/7 13:46:21

docker部署redis/mongodb/

一、redis 创建/root/redis/conf/redis.conf 全部执行命令如下 docker run -it -d --name redis -p 6379:6379 --net mynet --ip 172.18.0.9 -m 400m -v /root/redis/conf:/usr/local/etc/redis -e TXAsia/Shangehai redis redis-server /usr/local/etc/redis/redis.conf 部署…...

编程日记 2024/7/7 13:45:19

LeetCode 581. 最短无序连续子数组

更多题解尽在 https://sugar.matrixlab.dev/algorithm 每日更新。组队打卡，更多解法等你一起来参与哦！ LeetCode 581. 最短无序连续子数组，难度中等。排序解题思路：首先对数组排序，然后找出两侧顺序的数组&#x…...

编程日记 2024/7/7 13:44:18

数据库可视化管理工具dbeaver试用及问题处理。

本文记录了在内网离线安装数据库可视化管理工具dbeaver的过程和相关问题处理方法。一、下载dbeaver https://dbeaver.io/download/ 笔者测试时Windows平台最新版本为：dbeaver-ce-24.1.1-x86_64-setup.exe 二、安装方法一路“下一步”即可三、问题处理 1、问…...

编程日记 2024/7/7 13:41:15

29、php实现和为S的两个数字（含源码）

题目：php 实现和为S的两个数字描述： 输入一个递增排序的数组和一个数字S，在数组中查找两个数， 是的他们的和正好是S，如果有多对数字的和等于S，输出两个数的乘积最小的。输出描述： 对应每个测…...

编程日记 2024/7/7 13:39:12

Spring Boot中的全局异常处理

Spring Boot中的全局异常处理大家好，我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编，也是冬天不穿秋裤，天冷也要风度的程序猿！今天我们将探讨如何在Spring Boot应用中实现全局异常处理，这是保证应用…...

编程日记 2024/7/7 13:38:11

中英双语介绍美国苹果公司（Apple Inc.）

中文版苹果公司简介苹果公司（Apple Inc.）是一家美国跨国科技公司，总部位于加利福尼亚州库比蒂诺。作为全球最有影响力的科技公司之一，苹果以其创新的产品和设计引领了多个科技领域的变革。以下是对苹果公司发展历史、主要产品…...

编程日记 2024/7/7 13:37:10

C语言牢大坠机

目录开头程序程序的流程图《牢大坠机》结尾开头大家好，我叫这是我58，今天，我们要来看关于牢大坠机的一些东西。程序 #define _CRT_SECURE_NO_WARNINGS 1 #define HIGH 66 #include <stdio.h> #include <Windows.h> int ma…...

编程日记 2024/7/7 13:36:09

zdppy+vue3+antd 实现表格单元格编辑功能

初步实现 <template><a-button class"editable-add-btn" style"margin-bottom: 8px" click"handleAdd">Add</a-button><a-table bordered :data-source"dataSource" :columns"columns"><templa…...

编程日记 2024/7/7 13:34:06

elasticsearch索引怎么设计

Primary Shard（主分片） Primary Shard（主分片）是索引数据存储的基本单位，承担着数据写入和查询的职责。以下是关于Primary Shard的一些关键点： 1. 数据分布：每个索引在创建时会被分成多个主分…...

编程日记 2024/7/7 13:29:00

React 中 useState 和 useReducer 的联系和区别

文章目录使用场景使用 useState使用 useReducer 联系区别用法状态更新逻辑适用场景可读性和可维护性使用场景使用 useState 状态逻辑简单。只涉及少量的状态更新。需要快速和简单的状态管理。使用 useReducer 状态逻辑复杂。涉及多个子状态或多种状态更新逻辑。需要更好…...

编程日记 2024/7/7 13:27:59