当前位置：首页 > news >正文

深圳网站建设网页推广网站设计/长沙seo培训班

news 文章来源：https://blog.csdn.net/m0_74261473/article/details/134150713 2025/2/27 1:07:36

深圳网站建设网页推广网站设计,长沙seo培训班,全国新冠疫情最新通告,西安建筑科技大学使用K-Nearest Neighbors (KNN)算法进行分类。首先加载一个数据集，然后进行预处理，选择最佳的K值，并训练一个KNN模型。 # encodingutf-8 import numpy as np datas np.loadtxt(datingTestSet2.txt) # 加载数据集，返回一个numpy数…

使用K-Nearest Neighbors (KNN)算法进行分类。首先加载一个数据集，然后进行预处理，选择最佳的K值，并训练一个KNN模型。

# encoding=utf-8

import numpy as np

datas = np.loadtxt('datingTestSet2.txt') # 加载数据集，返回一个numpy数组

# 提取特征和标签
x_data = datas[:, 0:3] # 提取前三列数据作为特征
y_data = datas[:, 3] # 提取第四列数据作为标签

print('标准化前：', x_data) # 特征矩阵
print(y_data) # 标签向量

# 数据maxmin标准化
from sklearn.preprocessing import MinMaxScaler # 用于数据的标准化

std = MinMaxScaler() # 创建一个MinMaxScaler对象
x_data = std.fit_transform(x_data) # 标准化
print('标准化:', x_data)

# 拆分数据集（训练集和测试集）
from sklearn.model_selection import train_test_split

x_train, x_test, y_train, y_test = train_test_split(x_data, y_data, test_size=0.2,
                                                    random_state=123) # 测试集占总数据的20%，随机种子设为123以保证结果的可重复性

# 建立KNN模型
from sklearn.neighbors import KNeighborsClassifier
# 使用交叉验证法评估模型性能
from sklearn.model_selection import cross_val_score

k_range = range(1, 31) # 创建一个范围从1到30的序列，用于试验不同的K值。
k_error = [] # 创建一个空列表，用于存储每个K值对应的错误率。

# 找最合适的k，既平均值最高
for k in k_range:
    model_kun = KNeighborsClassifier(n_neighbors=k)
    scores = cross_val_score(model_kun, x_train, y_train, cv=6, scoring="accuracy")

    # 将数据集分成6个子集
    # 估计方法对象数据特征数据标签几折交叉验证
    meanscores = scores.mean() # 平均值
    k_error.append(1 - meanscores) # 将准确率的平均值转换为错误率
    print("k=", k, "meanscores=", meanscores)

# 可视化K值和错误率的关系
import matplotlib.pyplot as plt

plt.plot(k_range, k_error) # 绘制K值与错误率的图像
plt.show()

# 建立KNN分类器模型，并使用训练集进行训练
model_kun = KNeighborsClassifier(n_neighbors=9) # n_neighbors=9表示在预测时，KNN分类器将考虑最近的9个邻居，并根据这9个邻居中最常见的类别来预测输入样本的类别

model_kun.fit(x_train, y_train) # 使用训练集对模型进行训练
scores = model_kun.score(x_test, y_test) # 使用测试集评估模型性能，返回准确率
print('准确率为：', scores)

使用KNN算法加载鸢尾花数据集

# 加载鸢尾花数据集
from sklearn.datasets import load_irisiris = load_iris()
print(iris)
x_data = iris.data  # 样本数据
y_data = iris.target  # 标签数据
print("标准化前：", x_data)# 数据maxmin标准化
from sklearn.preprocessing import MinMaxScalermms = MinMaxScaler()
x_data = mms.fit_transform(x_data)
print(x_data)# 拆分数据集（训练集和测试集）
from sklearn.model_selection import train_test_splitx_train, x_test, y_train, y_test = train_test_split(x_data, y_data,   test_size=0.2,random_state=123)# 建立knn模型
from sklearn.neighbors import KNeighborsClassifierfrom sklearn.model_selection import cross_val_scorek_range=range(1,31)
k_error=[] #错误率# 找最合适的k，既平均值最高
for k in k_range:model_kun=KNeighborsClassifier(n_neighbors=k)scores=cross_val_score(model_kun,x_train,y_train,cv=6,scoring="accuracy")# 估计方法对象 数据特征 数据标签 几折交叉验证meanscores=scores.mean()    # 平均值k_error.append(1-meanscores)    # 错误率print("k=",k,"meanscores=",meanscores)# 将k的值和错误率可视化出来，比较好找
import matplotlib.pyplot as plt
plt.plot(k_range,k_error)
plt.show()model_knn = KNeighborsClassifier(n_neighbors=10)model_knn.fit(x_train, y_train)
scores = model_knn.score(x_test, y_test)  # 准确率
print(scores)

KNN模型

使用K-Nearest Neighbors (KNN)算法进行分类。首先加载一个数据集，然后进行预处理，选择最佳的K值，并训练一个KNN模型。 # encodingutf-8 import numpy as np datas np.loadtxt(datingTestSet2.txt) # 加载数据集，返回一个numpy数…...

编程日记 2023/11/1 0:52:45

Python 学习1 基础

文章目录基础字符串字面量常用的值类型注释变量print语句数据类型数据类型转换标识符运算符字符串拓展小结 2023.10.28 周六最近打算学一下Python，毕竟确实简单方便，而且那个编程语言排名还是在第一。不过不打算靠它吃饭，深不深入暂且不说…...

编程日记 2023/11/1 0:51:44

网络协议--TCP的超时与重传

21.1 引言 TCP提供可靠的运输层。它使用的方法之一就是确认从另一端收到的数据。但数据和确认都有可能会丢失。TCP通过在发送时设置一个定时器来解决这种问题。如果当定时器溢出时还没有收到确认，它就重传该数据。对任何实现而言，关键之处就在于超时和重…...

编程日记 2023/11/1 0:50:42

Thread

Thread 线程启动线程第一种创建线程线程的第二种创建方式使用匿名内部类完成线程的两种创建 Thread API线程的优先级线程提供的静态方法守护线程用户线程和守护线程的区别体现在进程结束时多线并发安全问题同步块线程启动线程启动线程:调用线程的start方法,而不是直接调用…...

编程日记 2023/11/1 0:49:40

FOC系列（二）----继续学习DRV8301芯片

一、程序框图跟随上篇博客咱们继续往下看，下面是芯片内部的程序框图： 1.1 BUCK电路 1.2 内部各电源 1.3 SPI通信、栅极驱动器和时序控制器 1.4 MOSFET驱动电路 1.5 电流采样放大电路数据手册只是给出了这一部分框图，但是没有更加详细的介…...

编程日记 2023/11/1 0:48:39

A. Directional Increase -前缀和与差分理解 + 思维

题面分析观察指针移动的性质，可以发现每一段都是从起点走到终点，在原路返回，这样每一段也就表示，在起点处加一，在终点处减一，形成了很明显的差分结构，思考能否构造出a数组的关键就是他的前缀…...

编程日记 2023/11/1 0:47:36

openpnp - java调试环境 - 最好只保留一套jdk环境

文章目录 openpnp - java调试环境 - 最好只保留一套jdk环境概述END openpnp - java调试环境 - 最好只保留一套jdk环境概述没注意做了啥操作, 前天好好的, 昨天下午开始, 编译好的openpnp程序就无法正常打开了. 故障表现: 程序运行后, 最多只能看到欢迎对话框(显示版本和发…...

编程日记 2023/11/1 0:46:34

AI技术的钓鱼邮件有多强

如今，人工智能技术的迅猛发展给各个领域都带来了前所未有的变革和进步。2023年上半年ChatGPT的火爆出圈，让人们看到了AI惊艳表现的光彩一面，但同时黑暗的一面也正在暗自发力，野蛮生长。 AI技术不仅可用于维护网络安全&#xff0c…...

编程日记 2023/11/1 0:45:33

vue/react项目刷新页面出现404报错的原因及解决办法

Vue项目打包部署到线上后,刷新页面会提示404,下面这篇文章主要给大家介绍了关于vue/react项目刷新页面出现404报错的原因及解决办法,文中将解决的办法介绍的很详细,需要的朋友可以参考下背景解决办法法1：将vue/react路由模式由history路由改为has…...

编程日记 2023/11/1 0:43:31

黑客技术（网络安全）——如何高效学习

前言前几天发布了一篇网络安全（黑客）自学没想到收到了许多人的私信想要学习网安黑客技术！却不知道从哪里开始学起！怎么学今天给大家分享一下，很多人上来就说想学习黑客，但是连方向都没搞清楚就开始学习…...

编程日记 2023/11/1 0:42:29

53.MongoDB分片集群高级集群架构详解

MongoDB分片集群架构详解为什么要使用分片分片（shard）是指在将数据进行水平切分之后，将其存储到多个不同的服务器节点上的一种扩展方式。一个复制集能承载的容量和负载是有限的，遇到以下场景就需要考虑使用分片存储容量需…...

编程日记 2023/11/1 0:41:28

Servlet 上下文参数

7)Servlet上下文对象：ServletContext生活中的例子：张三和李四在不远处窃窃私语，并且频繁的对着你坏笑。你肯定会跑过去问：你们俩在聊什么？注意：此处的聊什么，其实就是你在咨询他们聊天的上下文&…...

编程日记 2023/11/1 0:40:27

ChatGPT正在测试原生文件分析功能，DALL·E 3能P图啦！

10月29日，有部分用户在社交平台上分享，ChatGPT Plus正在测试原生文件上传、分析功能，可以通过文本问答的方式，对上传的PDF等数据文件进行提问、搜索。例如，上传一份50页的员工手册PDF文件，然后向ChatGPT提…...

编程日记 2023/11/1 0:39:26

三相马达的电机故障维护

目录电机故障维护编辑更换电机操作三相电路热继电器今天继续小编的工作经验的分享，今天就说说遇到的问题吧，今天组立熔接机出现故障，后面部分出现了“咕噜噜”的杂声，走到后面一听是电机发出的声音。没有办法了就开始拆…...

编程日记 2023/11/1 0:37:24

【易售小程序项目】后端部署、Uniapp项目Web部署

文章目录 Uniapp项目Web打包部署为什么不部署小程序Web打包前对项目进行调整网站、小程序切换增加constant.js来控制常量将js绑定到main.js的全局变量中 WebSocket差异监听键盘呼出导航条打包部署后端项目打包部署打包前准备打包部署 Uniapp项目Web打包部署为什么不部署小程…...

编程日记 2023/11/1 0:36:22

prometheus监控kafka

一、前言关于对kafka的监控，要求高的话可以使用kafka-exorter和jmx-exporter一起收集监控数据，要求不高的情况下可以使用kafka-exporter收集监控数据即可二、部署 kafka-exporter 部署kafka-exporter，我是在k8s集群中部署的编辑yaml文件…...

编程日记 2023/11/1 0:35:21

【STL】：list用法详解

朋友们、伙计们，我们又见面了，本期来给大家解读一下有关list的使用，如果看完之后对你有一定的启发，那么请留下你的三连，祝大家心想事成！ C 语言专栏：C语言：从入门到精通数据结构…...

编程日记 2023/11/1 0:34:20

SQL Wildcards 通配符

SQL Wildcards 通配符通配符用于替换字符串中的任何其他字符。通配符与 SQL LIKE 运算符一起使用。在 WHERE 子句中使用LIKE运算符来搜索列中的指定模式。有两个通配符与 LIKE 运算符一起使用： ％ - 百分号表示零个，一个或多个字符_ - 下…...

编程日记 2023/11/1 0:33:18

入门必学 | R语言for循环的常规应用

文章目录何为判断语句在for循环中添加判断语句嵌套循环在上一节中，我们介绍了迭代与for循环，并对for循环的结构与原理进行了深入的介绍。在这一节中，我们将分享for循环的常规应用，包括在其中加入判断语句与嵌套循环。何为判断语…...

编程日记 2023/11/1 0:32:17

metaRTC集成flutter ui demo编译指南

概要 Flutter是由Google开发的开源UI工具包，用于构建跨平台应用程序，支持linux/windows/mac/android/ios等操作系统。 metaRTC新增flutter demo，支持linux/windows/mac/android/ios操作系统，此demo在ubuntu桌面环境下测试成功。…...

编程日记 2023/11/1 0:31:16

int怎么转成QString？

2023年10月31日，周二晚上要将 int 类型转换为 QString，可以使用 QString::number() 方法。下面是一个示例代码： int number 123; QString str QString::number(number);还可以在转换时指定进制，比如将整数转换为十六进制的字…...

编程日记 2023/11/1 0:30:15

JavaScript进阶（二十九）：走近 es6 之 new.target

文章目录一、前言二、new.target 重写三、拓展阅读一、前言源码阅读过程中，发现以下语句 new.target.prototype鉴于该语法为es6所有，项目在编译过程中，控制台报Unexpected token: punc(.)错误。按照常规处理，应用babel-loade…...

编程日记 2023/11/1 0:29:14

JVM虚拟机：堆结构的逻辑分区

堆内存的逻辑分区堆内存的逻辑分区如下所示：堆内存中分为新生代和老年代，二者空间大小1：3。在新生代里面分为两类区域（eden、survivor），三个区域（eden、survivor、survivor），三个区大小比例为8：1：1。对象存放的位置栈当我们new一个对象的时候，首先会将对象…...

编程日记 2023/11/1 0:27:10

RabbitMQ学习02

Hello World（Java） 1.导入依赖 <build><plugins><plugin><groupId>org.apache.maven.plugins</groupId><artifactId>maven-compiler-plugin</artifactId><configuration&g…...

编程日记 2023/11/1 0:26:08

android中的Package安装、卸载、更新替换流程

android系统在安装，删除，替换，清除数据等与应用相关的动作时，会发出对应的Broadcast，上层的应用通过注册相应的广播事件来做相应的处理。官方文档中给出了详尽的罗列： ACTION_PACKAGE_ADDED 一个新应用包已…...

编程日记 2023/11/1 0:25:07

思维训练第三课反意疑问句

系列文章目录文章目录系列文章目录前言一、什么是反意疑问句二、反意疑问句的回答💚主系表/主谓宾（肯定），否定提问1、一般现在时2、一般过去时3、一般将来时4、现在完成时 💛 主谓宾1、一般现在2、一般过去3、一般将…...

编程日记 2023/11/1 0:24:06

nvm安装步骤

注意事项不要安装任何版本的node.js，有的话卸载干净！注意：要卸载干净了！ 安装步骤： nvm下载点击exe文件安装安装目录选择：D:\NVM 下一步创建nodejs文件放在D:\NVM 下，然后一直next到最后 …...

编程日记 2023/11/1 0:23:05

关于比较级（内含名词比较级）

在比较级中，修饰形容词一般使用more 或者-er的变体，但是怎么修饰名词呢？ 即，如果我们想表达：你能不能表现得更马屁精一点？这种针对一个具体名词的程度升级怎么表达呢？ 使用be more of 名词的…...

编程日记 2023/11/1 0:22:04

【算法|动态规划 | 线性dp | 最长上升子序列模型No.1】AcWing1017.怪盗基德的滑翔翼 AcWing1014.登山

个人主页：兜里有颗棉花糖欢迎点赞👍 收藏✨ 留言✉ 加关注💓本文由兜里有颗棉花糖原创收录于专栏【AcWing算法提高学习专栏】 🍔本专栏旨在提高自己算法能力的同时，记录一下自己的学习过程，希望对大家…...

编程日记 2023/11/1 0:21:03

2023年道路运输企业主要负责人证模拟考试题库及道路运输企业主要负责人理论考试试题

题库来源：安全生产模拟考试一点通公众号小程序 2023年道路运输企业主要负责人证模拟考试题库及道路运输企业主要负责人理论考试试题是由安全生产模拟考试一点通提供，道路运输企业主要负责人证模拟考试题库是根据道路运输企业主要负责人最新版教材&#…...

编程日记 2023/11/1 0:20:02

使用K-Nearest Neighbors (KNN)算法进行分类。首先加载一个数据集，然后进行预处理，选择最佳的K值，并训练一个KNN模型。

# encoding=utf-8

import numpy as np

datas = np.loadtxt('datingTestSet2.txt') # 加载数据集，返回一个numpy数组

# 提取特征和标签 x_data = datas[:, 0:3] # 提取前三列数据作为特征 y_data = datas[:, 3] # 提取第四列数据作为标签

print('标准化前：', x_data) # 特征矩阵 print(y_data) # 标签向量

# 数据maxmin标准化 from sklearn.preprocessing import MinMaxScaler # 用于数据的标准化

std = MinMaxScaler() # 创建一个MinMaxScaler对象 x_data = std.fit_transform(x_data) # 标准化 print('标准化:', x_data)

# 拆分数据集（训练集和测试集） from sklearn.model_selection import train_test_split

x_train, x_test, y_train, y_test = train_test_split(x_data, y_data, test_size=0.2, random_state=123) # 测试集占总数据的20%，随机种子设为123以保证结果的可重复性

# 建立KNN模型 from sklearn.neighbors import KNeighborsClassifier # 使用交叉验证法评估模型性能 from sklearn.model_selection import cross_val_score

k_range = range(1, 31) # 创建一个范围从1到30的序列，用于试验不同的K值。 k_error = [] # 创建一个空列表，用于存储每个K值对应的错误率。

# 找最合适的k，既平均值最高 for k in k_range: model_kun = KNeighborsClassifier(n_neighbors=k) scores = cross_val_score(model_kun, x_train, y_train, cv=6, scoring="accuracy")

# 将数据集分成6个子集 # 估计方法对象 数据特征 数据标签 几折交叉验证 meanscores = scores.mean() # 平均值 k_error.append(1 - meanscores) # 将准确率的平均值转换为错误率 print("k=", k, "meanscores=", meanscores)

# 可视化K值和错误率的关系 import matplotlib.pyplot as plt

plt.plot(k_range, k_error) # 绘制K值与错误率的图像 plt.show()

# 建立KNN分类器模型，并使用训练集进行训练 model_kun = KNeighborsClassifier(n_neighbors=9) # n_neighbors=9表示在预测时，KNN分类器将考虑最近的9个邻居，并根据这9个邻居中最常见的类别来预测输入样本的类别

model_kun.fit(x_train, y_train) # 使用训练集对模型进行训练 scores = model_kun.score(x_test, y_test) # 使用测试集评估模型性能，返回准确率 print('准确率为：', scores)

使用KNN算法加载鸢尾花数据集

相关文章：

# 提取特征和标签
x_data = datas[:, 0:3] # 提取前三列数据作为特征
y_data = datas[:, 3] # 提取第四列数据作为标签

print('标准化前：', x_data) # 特征矩阵
print(y_data) # 标签向量

# 数据maxmin标准化
from sklearn.preprocessing import MinMaxScaler # 用于数据的标准化

std = MinMaxScaler() # 创建一个MinMaxScaler对象
x_data = std.fit_transform(x_data) # 标准化
print('标准化:', x_data)

# 拆分数据集（训练集和测试集）
from sklearn.model_selection import train_test_split

x_train, x_test, y_train, y_test = train_test_split(x_data, y_data, test_size=0.2,
random_state=123) # 测试集占总数据的20%，随机种子设为123以保证结果的可重复性

# 建立KNN模型
from sklearn.neighbors import KNeighborsClassifier
# 使用交叉验证法评估模型性能
from sklearn.model_selection import cross_val_score

k_range = range(1, 31) # 创建一个范围从1到30的序列，用于试验不同的K值。
k_error = [] # 创建一个空列表，用于存储每个K值对应的错误率。

# 找最合适的k，既平均值最高
for k in k_range:
model_kun = KNeighborsClassifier(n_neighbors=k)
scores = cross_val_score(model_kun, x_train, y_train, cv=6, scoring="accuracy")

# 将数据集分成6个子集
# 估计方法对象数据特征数据标签几折交叉验证
meanscores = scores.mean() # 平均值
k_error.append(1 - meanscores) # 将准确率的平均值转换为错误率
print("k=", k, "meanscores=", meanscores)

# 可视化K值和错误率的关系
import matplotlib.pyplot as plt

plt.plot(k_range, k_error) # 绘制K值与错误率的图像
plt.show()

# 建立KNN分类器模型，并使用训练集进行训练
model_kun = KNeighborsClassifier(n_neighbors=9) # n_neighbors=9表示在预测时，KNN分类器将考虑最近的9个邻居，并根据这9个邻居中最常见的类别来预测输入样本的类别

model_kun.fit(x_train, y_train) # 使用训练集对模型进行训练
scores = model_kun.score(x_test, y_test) # 使用测试集评估模型性能，返回准确率
print('准确率为：', scores)