当前位置: 首页 > news >正文

【手撕算法系列】k-means

k-means

  • k-means算法介绍

k-means算法介绍

K-means算法是一种用于聚类的迭代算法,它将数据集划分为K个簇,其中每个数据点属于与其最近的簇的中心。这个算法的目标是最小化簇内的平方和误差(簇内数据点与簇中心的距离的平方和)。

以下是K-means算法的基本步骤:

  • 初始化中心点: 随机选择K个数据点作为初始的簇中心点。

  • 分配数据点: 对于每个数据点,计算它与各个簇中心的距离,并将其分配给距离最近的簇。

  • 更新簇中心: 对每个簇,计算其所有数据点的平均值,将该平均值作为新的簇中心。

重复步骤2和步骤3: 重复执行步骤2和步骤3,直到簇中心不再发生显著变化或达到预定的迭代次数。

收敛: 算法收敛于一组簇中心,每个数据点属于与其最近的中心。

import numpy as np
import matplotlib.pyplot as pltdef kmeans(X, k, max_iters=100, tol=1e-4):# 初始化簇中心centroids = X[np.random.choice(len(X), k, replace=False)]for _ in range(max_iters):# 计算每个点到簇中心的距离distances = np.linalg.norm(X[:, np.newaxis] - centroids, axis=2)# 分配每个点到最近的簇labels = np.argmin(distances, axis=1)# 计算新的簇中心new_centroids = np.array([X[labels == z].mean(axis=0) for z in range(k)])# 判断是否收敛if np.linalg.norm(new_centroids - centroids) < tol:breakcentroids = new_centroidsreturn centroids, labels# 生成一些随机样本数据
np.random.seed(42)
X, _ = make_blobs(n_samples=300, centers=4, random_state=42, cluster_std=1.0)# 使用自己实现的K-means算法进行聚类
centroids, labels = kmeans(X, k=4)# 绘制原始数据和簇中心
plt.scatter(X[:, 0], X[:, 1], c=labels, cmap='viridis', edgecolors='k', s=50, alpha=0.7)
plt.scatter(centroids[:, 0], centroids[:, 1], marker='X', s=200, linewidths=3, color='r', label='Centroids')
plt.title('K-means Clustering (Implemented)')
plt.legend()
plt.show()

相关文章:

【手撕算法系列】k-means

k-means k-means算法介绍 k-means算法介绍 K-means算法是一种用于聚类的迭代算法&#xff0c;它将数据集划分为K个簇&#xff0c;其中每个数据点属于与其最近的簇的中心。这个算法的目标是最小化簇内的平方和误差&#xff08;簇内数据点与簇中心的距离的平方和&#xff09;。 …...

D33|动态规划!启程!

1.动态规划五部曲&#xff1a; 1&#xff09;确定dp数组&#xff08;dp table&#xff09;以及下标的含义 2&#xff09;确定递推公式 3&#xff09;dp数组如何初始化 4&#xff09;确定遍历顺序 5&#xff09;举例推导dp数组 2.动态规划应该如何debug 找问题的最好方式就是把…...

C语言----文件操作(二)

在上一篇文章中我们简单介绍了在C语言中文件是什么以及文件的打开和关闭操作&#xff0c;在实际工作中&#xff0c;我们不仅仅是要打开和关闭文件&#xff0c;二是需要对文件进行增删改写。本文将详细介绍如果对文件进行安全读写。 一&#xff0c;以字符形式读写文件&#xff…...

oracle 10046事件跟踪

10046事件是一个很好的排查sql语句执行缓慢的内部事件&#xff0c;具体设置方式如下&#xff1a; 根据10046事件跟踪SQL语句 1、 alter session set events 10046 trace name context forever,level 12; 2、执行SQL语句 3、关闭10046事件 alter session set events 10046 trace…...

微软自带浏览器Edge,无法关闭“保存历史记录网站的屏幕截图”解决方案

微软自带浏览器Edge&#xff0c;无法关闭“保存历史记录网站的屏幕截图”解决方案 吐槽1&#xff1a;Windows自带的Chrome内核版本的浏览器Microsofg Edge刚发布时可谓一股清流&#xff0c;启动速度快&#xff0c;占用内存较小&#xff0c;相信很多人也开始抛弃正代Chrome&…...

讲座 | 颠覆传统摄像方式乃至计算机视觉的“脉冲视觉”

传统相机拍摄视频时其实是以一定帧率进行采样&#xff0c;视频其实还是一串图片的集合&#xff0c;因此低帧率时会觉得视频卡&#xff0c;拍摄高速运动物体时会有运动模糊等等问题。然而你能想象这一切都可以被“脉冲视觉”这一前沿技术改变吗&#xff1f; 今天下午听了北京大学…...

uniGUI学习之UniHTMLMemo1富文本编辑器

1]系统自带的富文本编辑器 2]jQueryBootstarp富文本编辑器插件summernote.js 1]系统自带的富文本编辑器 1、末尾增加<p> 2、增加字体 3、解决滚屏问题 4、输入长度限制问题 5、显示 并 编辑 HTML源代码(主要是图片处理) 1、末尾增加<p> UniHTMLMemo1.Lines…...

详细教程 - 从零开发 鸿蒙harmonyOS应用 第四节 (鸿蒙Stage模型 登录页面 ArkTS版 推荐使用)

在鸿蒙OS中&#xff0c;Ability是应用程序提供的抽象功能&#xff0c;可以理解为一种功能。在应用程序中&#xff0c;一个页面即一种能力&#xff0c;如登录页面&#xff0c;即具有登录功能的能力。以下是对鸿蒙新建项目的登录代码功能的详细解读和工作流程的描述&#xff1a; …...

uniapp怎么实现授权登录

在Uniapp中实现授权登录通常涉及以下几个步骤&#xff1a; 创建登录按钮&#xff1a;在页面中创建一个按钮&#xff0c;用于触发登录操作。 获取用户授权&#xff1a;当用户点击登录按钮时&#xff0c;调用uni.login或uni.getUserInfo等API获取用户授权。 处理授权回调&#…...

从零开始:前端架构师的基础建设和架构设计之路

文章目录 一、引言二、前端架构师的职责三、基础建设四、架构设计思想五、总结《前端架构师&#xff1a;基础建设与架构设计思想》编辑推荐内容简介作者简介目录获取方式 一、引言 在现代软件开发中&#xff0c;前端开发已经成为了一个不可或缺的部分。随着互联网的普及和移动…...

椋鸟C语言笔记#26:数据在内存中的存储(大小端字节序)、浮点数的存储(IEEE754)

萌新的学习笔记&#xff0c;写错了恳请斧正。 目录 大小端字节序 什么是大小端 写一个判断大小端的程序 浮点数在内存中的存储&#xff08;IEEE 754规则&#xff09; 引入 存储规则解释 读取规则解释 1.阶码不全为0或全为1&#xff08;规格化数&#xff09; 2.阶码全为…...

设计模式——组合模式(结构型)

引言 组合模式是一种结构型设计模式&#xff0c; 你可以使用它将对象组合成树状结构&#xff0c; 并且能像使用独立对象一样使用它们。 问题 如果应用的核心模型能用树状结构表示&#xff0c; 在应用中使用组合模式才有价值。 例如&#xff0c; 你有两类对象&#xff1a; ​…...

鸿蒙小车之多任务调度实验

说到鸿蒙我们都会想到华为mate60&#xff1a;遥遥领先&#xff01;我们一直领先&#xff01; 我们这个小车也是采用的是鸿蒙操作系统&#xff0c;学习鸿蒙小车&#xff0c;让你遥遥领先于你的同学。 文章目录 前言一、什么是任务&#xff1f;为什么要有任务二、任务的状态三、任…...

【报错栏】(vue)Module not found: Error: Can‘t resolve ‘element-ui‘ in xxx

Module not found: Error: Cant resolve element-ui in xxx 报错原因是&#xff1a; 未安装 element-ui 依赖 解决&#xff1a; npm install element-ui 运行...

seaborn库图形进行数据分析(基于tips数据集)

Seaborn 是一个基于 matplotlib 的数据可视化库&#xff0c;可以用来绘制各种统计图表&#xff0c;包括散点图、条形图、折线图、箱线图等。Seaborn 提供了一些用于美化图表的默认样式和颜色主题&#xff0c;使得生成的图表更具有吸引力。下面是一些 Seaborn 库的常用功能和用法…...

AC843. n皇后问题--60

我们只需要把蓝色的往上移动就行了 if(!col[i][j]&&!dg[ui]&&!udg[])//1y&#xff08;i&#xff09;向下&#xff0c;x&#xff08;u&#xff09;向右为正。yxb的by-x一定>0,y-xb的bxy可能>0,这个不考虑&#xff0c;只看-bxy....

Js WebSocket类,收发Json,带心跳,断线重连

如题 心跳&#xff1a;4秒发一次 断线&#xff1a;2秒后自动重连 收发&#xff1a;发送和返回json&#xff0c;处理粘包断包等情况&#xff0c;json字符串最大长度9999 缓存&#xff1a;未连接时&#xff0c;自动缓存100个包&#xff0c;当连接时会自动发出 JS代码 var MyWeb…...

VBA技术资料MF96:单字段多条件高级筛选

我给VBA的定义&#xff1a;VBA是个人小型自动化处理的有效工具。利用好了&#xff0c;可以大大提高自己的工作效率&#xff0c;而且可以提高数据的准确度。我的教程一共九套&#xff0c;分为初级、中级、高级三大部分。是对VBA的系统讲解&#xff0c;从简单的入门&#xff0c;到…...

电子取证中Chrome各版本解密Cookies、LoginData账号密码、历史记录

文章目录 1.前置知识点2.对于80.X以前版本的解密拿masterkey的几种方法方法一 直接在目标机器运行Mimikatz提取方法二 转储lsass.exe 进程从内存提取masterkey方法三 导出SAM注册表 提取user hash 解密masterkey文件&#xff08;有点麻烦不太推荐&#xff09;方法四 已知用户密…...

Axure元件基本介绍进阶

Axure元件基本介绍进阶 1.Axure元件基本介绍1.在 Axure 中&#xff0c;元件是构建原型的基本构成单元&#xff0c;能够帮助设计师快速创建、重复使用和管理设计元素。以下是 Axure 中元件的基本介绍&#xff1a;1.基本元件&#xff1a; 2.基本元件的使用一.【举例说明】积木&am…...

AtCoder Beginner Contest 450 复盘

总结这是第一次打Atcode Beginner的网赛&#xff0c;以前一直打codeforce的网赛&#xff0c;总体来说题目比codeforce的难度梯度还是明显&#xff0c;比codeforce的题目相对还是有点难&#xff0c;恐怕是看不懂题目&#xff0c;题目描述和codeforce有比较大的区别&#xff0c;第…...

web安全主要包括哪些方面的安全

web安全主要包括哪些方面的安全 web安全主要包括哪些方面的安全&#xff1a;web安全主要分为保护服务器及其数据的安全、保护服务器和用户之间传递的信息的安全、保护web应用客户端及其环境安全这三个方面。 web安全介绍 Web应用安全问题本质上源于软件质量问题。但Web应用相较…...

Word批量更改公式字体为Times New Roman:一键将公式字母变斜体,数字保持正体!

还在为论文中几十个公式的字体格式烦恼吗&#xff1f;这个VBA宏代码让你的排版效率提升100倍&#xff01; 在撰写理工科论文时&#xff0c;我们常常遇到一个令人头疼的问题&#xff1a;论文要求公式中的英文字母必须为斜体&#xff0c;数字保持正体&#xff0c;并且全部使用Tim…...

贝叶斯岭回归 vs 传统岭回归:5个真实数据集对比测试结果

贝叶斯岭回归与传统岭回归&#xff1a;5个真实数据集下的深度性能剖析 当数据科学家面对高维数据集时&#xff0c;正则化回归技术往往是工具箱中的首选武器。在众多选项中&#xff0c;岭回归因其稳定性和简单性长期占据主导地位&#xff0c;而贝叶斯岭回归则以其自动化特性逐渐…...

UE5 + AirSim + ROS联合开发:如何在WSL2中实现无缝通信(保姆级教程)

UE5 AirSim ROS联合开发&#xff1a;WSL2环境下的高效通信实战指南 机器人仿真与自动驾驶研究正迎来技术融合的新阶段。当虚幻引擎5&#xff08;UE5&#xff09;的高保真渲染能力遇上AirSim的物理仿真特性&#xff0c;再结合ROS的机器人控制框架&#xff0c;开发者能够构建出…...

SEO_掌握关键词研究的正确方法,驱动SEO流量增长

SEO流量增长的关键&#xff1a;掌握关键词研究的正确方法在当前竞争激烈的互联网市场中&#xff0c;掌握关键词研究的正确方法是推动SEO流量增长的核心。掌握关键词研究不仅能帮助你更好地了解用户需求&#xff0c;还能让你在搜索引擎中获得更高的排名。本文将从问题分析、原因…...

电阻选型实战指南

一、 选型前的三个核心设计理念 在进入具体场景之前,先建立三个贯穿始终的思维框架: 1. 降额设计是可靠性的底线 核心原则:任何电阻都不要工作在极限状态。 量化标准: 功率降额:实际功耗 ≤ 额定功率 50%(消费级)或 30%(工业/车载) 电压降额:实际工作电压 ≤ 极…...

CLIP-GmP-ViT-L-14惊艳案例:X光片→放射科报告关键句/异常部位定位文本

CLIP-GmP-ViT-L-14惊艳案例&#xff1a;X光片→放射科报告关键句/异常部位定位文本 1. 医疗影像分析新突破 在医疗影像诊断领域&#xff0c;医生每天需要分析大量X光片并撰写专业报告。传统流程中&#xff0c;放射科医生需要反复比对影像与报告内容&#xff0c;耗时耗力。CLI…...

Vivado+VCS+Verdi三件套实战:如何快速搭建高效仿真环境(附详细配置步骤)

VivadoVCSVerdi三件套实战&#xff1a;如何快速搭建高效仿真环境 在FPGA开发流程中&#xff0c;功能仿真是验证设计正确性的关键环节。传统单一工具链往往面临仿真速度慢、波形分析效率低等痛点。本文将分享如何通过Vivado、VCS和Verdi三款工具的协同使用&#xff0c;构建一个高…...

别只让Qwen2.5-VL看图说话!实战:用Python脚本调用它处理本地图片和PDF文档

解锁Qwen2.5-VL的工业级文档处理能力&#xff1a;Python实战指南 当开发者成功部署Qwen2.5-VL多模态模型后&#xff0c;真正的挑战才刚刚开始——如何将这个视觉理解引擎转化为生产力工具&#xff1f;本文将带您突破Demo级应用&#xff0c;构建可集成到实际工作流中的自动化文档…...