当前位置：首页 > news >正文

机器学习：逻辑回归处理手写数字的识别

news 2026/2/8 3:40:33

1、获取数据, 图像分割该数据有50行100列，每个数字占据20*20个像素点，可以进行切分,划分出训练集和测试集。

import numpy as np
import pandas as pd
import cv2
img=cv2.imread("digits.png")#读取文件
gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)#变成灰度图
#切分数据
x=np.array([np.hsplit(i,100) for i in np.vsplit(gray,50)])
train=x[:,:50]
test=x[:,50:100]

2、每个数据的像素点为2020，将其全部变成一列1400格式，转换成数值特征

train_new=train.reshape(-1,400).astype(np.float32)
test_new=test.reshape(-1,400).astype(np.float32)

3、总共有2500行特征对应着2500个标签，从0到9每个数字有250个

k=np.arange(10)
train_labels=np.repeat(k,250)[:,np.newaxis].ravel()
test_labels=np.repeat(k,250)[:,np.newaxis].ravel()

4、导入逻辑回归库，采用交叉验证的方法找到最佳C值

#导入逻辑回归和交叉验证库
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import cross_val_score
scores=[]
# 设置C的值进行交叉验证，找到最佳C
c_param_range=[0.01,0.1,1,10,100]
for i in c_param_range:lr = LogisticRegression(C=i, penalty='l2', solver='lbfgs', max_iter=10000)score = cross_val_score(lr, train_new, train_labels, cv=10, scoring='recall_macro')score_mean = sum(score) / len(score)scores.append(score_mean)
# 选择使得平均分数最高的C值
best_c = c_param_range[np.argmax(scores)]
lr = LogisticRegression(C=best_c, penalty='l2', max_iter=10000)
#使用最佳C值初始化逻辑回归模型并训练
lr.fit(train_new, train_labels)

5、使用训练好的模型对测试集进行预测

from sklearn import metrics
train_predicted=lr.predict(test_new)
print(metrics.classification_report(test_labels,train_predicted))

6、打印的分类报告

7、读取手写数字图像，并进行预测

p1=cv2.imread("p1.png")
gray_p1=cv2.cvtColor(p1,cv2.COLOR_BGR2GRAY)
tess=np.array(gray_p1)
tess_new=tess.reshape(-1,400).astype(np.float32)
# 使用训练好的模型进行预测
predicted_shouxie=lr.predict(tess_new)
print(predicted_shouxie)

8、书写预测结果

完整代码

import numpy as np
import pandas as pd
import cv2
img=cv2.imread("digits.png")#读取文件
gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)#变成灰度图
#切分数据
x=np.array([np.hsplit(i,100) for i in np.vsplit(gray,50)])
train=x[:,:50]
test=x[:,50:100]
train_new=train.reshape(-1,400).astype(np.float32)
test_new=test.reshape(-1,400).astype(np.float32)
k=np.arange(10)
train_labels=np.repeat(k,250)[:,np.newaxis].ravel()
test_labels=np.repeat(k,250)[:,np.newaxis].ravel()#导入逻辑回归和交叉验证库
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import cross_val_score
scores=[]
# 设置C的值进行交叉验证，找到最佳C
c_param_range=[0.01,0.1,1,10,100]
for i in c_param_range:lr = LogisticRegression(C=i, penalty='l2', solver='lbfgs', max_iter=10000)score = cross_val_score(lr, train_new, train_labels, cv=10, scoring='recall_macro')score_mean = sum(score) / len(score)scores.append(score_mean)
# 选择使得平均分数最高的C值
best_c = c_param_range[np.argmax(scores)]
lr = LogisticRegression(C=best_c, penalty='l2', max_iter=10000)
lr.fit(train_new, train_labels)
#使用最佳C值初始化逻辑回归模型并训练
from sklearn import metrics
train_predicted=lr.predict(test_new)
print(metrics.classification_report(test_labels,train_predicted))
# 读取新的手写数字图像，并进行预测
p1=cv2.imread("p1.png")
gray_p1=cv2.cvtColor(p1,cv2.COLOR_BGR2GRAY)
tess=np.array(gray_p1)
tess_new=tess.reshape(-1,400).astype(np.float32)
# 使用训练好的模型进行预测
predicted_shouxie=lr.predict(tess_new)
print(predicted_shouxie)

机器学习：逻辑回归处理手写数字的识别

1、获取数据, 图像分割该数据有50行100列，每个数字占据20*20个像素点，可以进行切分,划分出训练集和测试集。 import numpy as np import pandas as pd import cv2 imgcv2.imread("digits.png")#读取文件 graycv2.cvtColor(img,cv2.COLOR_BGR2G…...

编程日记 2024/8/21 21:34:48

一、SpringMVC实现文件上传 1.1.项目结构 1.1.2 控制器方法 RequestMapping("/upload1.do")public ModelAndView upload1(RequestParam("file1") MultipartFile f1) throws IOException {//获取文件名称String originalFilename f1.getOriginalFilename(…...

编程日记 2024/8/21 21:33:47

精益管理｜介绍一本专门研究防错法(Poka-Yoke)的书

在现代制造业中，如何确保产品在每个生产环节中不出现错误是企业追求的目标之一。而实现这一目标的关键技术之一就是防错法（Poka-Yoke）。作为一种简单而有效的精益管理、六西格玛管理工具，防错法帮助企业避免因人为错误或工艺不当导…...

编程日记 2024/8/21 21:32:46

面试题目：(4)给表达式添加运算符

目录题目代码思路解析例子题目题目给定一个仅包含数字 0-9 的字符串 num 和一个目标值整数 target ，在 num 的数字之间添加二元运算符（不是一元）、- 或 * ，返回所有能够得到 target 的表达式。1 < num.length &…...

编程日记 2024/8/21 21:28:43

[C#]将opencvsharp的Mat对象转成onnxruntime的inputtensor的3种方法

第一种方法：在创建tensor时候直接赋值改变每个tensor的值，以下是伪代码： var image new Mat(image_path);inpWidth image.Width;inpHeight image.Height;//将图片转为RGB通道Mat image_rgb new Mat();Cv2.CvtColor(image, image_rgb, Col…...

编程日记 2024/8/21 21:23:38

CTF入门教程（非常详细）从零基础入门到竞赛，看这一篇就够了！

一、CTF简介 CTF（Capture The Flag）中文一般译作夺旗赛，在网络安全领域中指的是网络安全技术人员之间进行技术竞技的一种比赛形式。CTF起源于1996年DEFCON全球黑客大会，以代替之前黑客们通过互相发起真实攻击进行技术比拼的方式。…...

编程日记 2024/8/21 21:22:37

数据链路层 I（组帧、差错控制）【★★★★★】

（★★）代表非常重要的知识点，（★）代表重要的知识点。为了把主要精力放在点对点信道的数据链路层协议上，可以采用下图（a）所示的三层模型。在这种三层模型中，不管在哪一段…...

编程日记 2024/8/21 21:20:35

悟空降世撼动全球

文｜琥珀食酒社作者 | 积溪一只猴子能值多少钱？ 答案是：13个小目标这两天只要你家没有断网一定会被这只猴子刷屏它就是咱国产的3A游戏《黑神话：悟空》这只猴子到底有多火？ 这么跟你说吧茅台见了它都…...

编程日记 2024/8/21 21:19:34

Swoole 和 Java 哪个更有优势呢

Swoole 和 Java 各有优势，在性能上不能简单地说哪一个更好，需要根据具体的应用场景来分析。 Swoole 优势：高并发：Swoole 是一个基于 PHP 的异步、协程框架，专为高并发场景设计，适用于 I/O 密集型应用&…...

编程日记 2024/8/21 21:18:33

Salesforce 发布开源大模型 xGen-MM

xGen-MM 论文在当今 AI 技术飞速发展的时代，一个新的多模态 AI 模型悄然崛起，引起了业界的广泛关注。这个由 Salesforce 推出的开源模型—— xGen-MM，正以其惊人的全能特性和独特优势，在 AI 领域掀起一阵旋风。那么，x…...

编程日记 2024/8/21 21:17:31

冒泡排序

今天咱们单独拎出一小节来聊一聊冒泡排序昂冒泡排序的核心思想就是：两两相邻的元素进行比较（理解思路诸君可看下图） 接下来我们上代码演示： 以上就是我们初步完成的冒泡排序，大家不难发现，不管数组中的元…...

编程日记 2024/8/21 21:15:29

采用先进的人工智能视觉分析技术，能够精确识别和分析，提供科学、精准的数据支持的智慧物流开源了。

智慧物流视频监控平台是一款功能强大且简单易用的实时算法视频监控系统。它的愿景是最底层打通各大芯片厂商相互间的壁垒，省去繁琐重复的适配流程，实现芯片、算法、应用的全流程组合，从而大大减少企业级应用约95%的开发成本可通过边缘计算技术…...

编程日记 2024/8/21 21:14:28

IAA游戏APP如何让合理地让用户观看更多广告，提高广告渗透率

广告变现已经成为休闲游戏开发者重要的收益方式之一，超50%国内休闲游戏已经采用广告变现的方式，游戏广告预算是游戏行业开发者广告变现的主要预算来源。 #深度好文计划#如何合理地提高广告渗透率？ 广告渗透率能直接反映游戏中有广告行为用户…...

编程日记 2024/8/21 21:13:27

环网交换机的特殊作用是什么？

环网交换机作为现代网络建设的重要组成部分，具有独特而特殊的作用。在信息技术迅猛发展的今天，各类数据传输和网络连接需求日益增加，环网交换机的出现为解决这些问题提供了理想的方案。环网交换机通常将多个网络节点通过环形结构连接起来&…...

编程日记 2024/8/21 21:11:26

mac电脑安装Zsh并启用

安装 Zsh 1. 安装 Zsh 新版mac系统会默认安装并使用zsh，如没用，需在终端中安装： brew install zsh2. 安装 Oh My Zsh 克隆Oh My Zsh到你的目录： git clone https://github.com/robbyrussell/oh-my-zsh.git ~/.oh-my-zsh3. 复…...

编程日记 2024/8/21 21:09:22

【后续更新】python搜集上海二手房数据

源码如下： import asyncio import aiohttp from lxml import etree import logging import datetime import openpyxlwb = openpyxl.Workbook() sheet = wb.active sheet.append([房源, 房子信息, 所在区域, 单价, 关注人数和发布时间, 标签]) logging.basicConfig(level=log…...

编程日记 2024/8/21 21:08:20

创建GPTs，打造你的专属AI聊天机器人

在2023年11月的「OpenAI Devday」大会上，OpenAI再度带来了一系列令人瞩目的新功能，其中ChatGPT方面的突破尤为引人关注。而GPTs的亮相，不仅标志着个性化AI时代的到来，更为开发者和普通用户提供了前所未有的便利。接下来&#xff0…...

编程日记 2024/8/21 21:07:20

深度学习 vector 之模拟实现 vector (C++)

1. 基础框架这里我们有三个私有变量，使用 _finish - _start 代表 _size，_end_of_storage - _start 代表 _capacity，并且使用到了模版，可以灵活定义存储不同类型的 vector，这里将代码量较小的函数直接定义在类的内部使…...

编程日记 2024/8/21 21:06:15

关于LLC知识10

在LLC谐振腔中能够变化的量 1、输入电压 2、Rac（负载） 所以增益曲线为红色（Rac无穷大）已经是工作的最大极限了，LLC不可能工作在红色曲线之外负载越重时，增益曲线越往里面假设： 输入电压…...

编程日记 2024/8/21 21:05:10

最长的严格递增或递减子数组

给你一个整数数组 nums 。返回数组 nums 中严格递增或严格递减的最长非空子数组的长度。示例 1： 输入：nums [1,4,3,3,2] 输出：2 解释： nums 中严格递增的子数组有[1]、[2]、[3]、[3]、[4] 以及 [1,4] 。 nums 中…...

编程日记 2024/8/21 21:03:51

突破不可导策略的训练难题：零阶优化与强化学习的深度嵌合

强化学习（Reinforcement Learning, RL）是工业领域智能控制的重要方法。它的基本原理是将最优控制问题建模为马尔可夫决策过程，然后使用强化学习的Actor-Critic机制（中文译作“知行互动”机制），逐步迭代求解…...

编程新知 2026/2/5 4:17:42

Linux简单的操作

ls ls 查看当前目录 ll 查看详细内容 ls -a 查看所有的内容 ls --help 查看方法文档 pwd pwd 查看当前路径 cd cd 转路径 cd .. 转上一级路径 cd 名转换路径 …...

编程新知 2026/1/20 14:36:39

生成 Git SSH 证书

🔑 1. 生成 SSH 密钥对在终端（Windows 使用 Git Bash，Mac/Linux 使用 Terminal）执行命令： ssh-keygen -t rsa -b 4096 -C "your_emailexample.com" 参数说明： -t rsa&#x…...

编程新知 2025/9/18 11:31:13

AI书签管理工具开发全记录（十九）：嵌入资源处理

1.前言 📝 在上一篇文章中，我们完成了书签的导入导出功能。本篇文章我们研究如何处理嵌入资源，方便后续将资源打包到一个可执行文件中。 2.embed介绍 🎯 Go 1.16 引入了革命性的 embed 包，彻底改变了静态资源管理的…...

编程新知 2026/1/30 16:24:23

Unsafe Fileupload篇补充-木马的详细教程与木马分享（中国蚁剑方式）

在之前的皮卡丘靶场第九期Unsafe Fileupload篇中我们学习了木马的原理并且学了一个简单的木马文件本期内容是为了更好的为大家解释木马（服务器方面的）的原理，连接，以及各种木马及连接工具的分享文件木马：https://w…...

编程新知 2026/1/25 10:13:29

免费PDF转图片工具

免费PDF转图片工具一款简单易用的PDF转图片工具，可以将PDF文件快速转换为高质量PNG图片。无需安装复杂的软件，也不需要在线上传文件，保护您的隐私。工具截图主要特点 🚀 快速转换：本地转换，无需等待上…...

编程新知 2026/1/26 9:07:56

什么是VR全景技术

VR全景技术，全称为虚拟现实全景技术，是通过计算机图像模拟生成三维空间中的虚拟世界，使用户能够在该虚拟世界中进行全方位、无死角的观察和交互的技术。VR全景技术模拟人在真实空间中的视觉体验，结合图文、3D、音视频等多媒体元素…...

编程新知 2026/2/5 19:40:10

pycharm 设置环境出错

pycharm 设置环境出错 pycharm 新建项目，设置虚拟环境，出错 pycharm 出错 Cannot open Local Failed to start [powershell.exe, -NoExit, -ExecutionPolicy, Bypass, -File, C:\Program Files\JetBrains\PyCharm 2024.1.3\plugins\terminal\shell-int…...

编程新知 2026/1/16 15:03:10

GraphQL 实战篇：Apollo Client 配置与缓存

GraphQL 实战篇：Apollo Client 配置与缓存上一篇：GraphQL 入门篇：基础查询语法依旧和上一篇的笔记一样，主实操，没啥过多的细节讲解，代码具体在： https://github.com/GoldenaArcher/graphql…...

编程新知 2026/2/6 5:45:36

阿里云Ubuntu 22.04 64位搭建Flask流程（亲测）

cd /home 进入home盘安装虚拟环境： 1、安装virtualenv pip install virtualenv 2.创建新的虚拟环境： virtualenv myenv 3、激活虚拟环境（激活环境可以在当前环境下安装包） source myenv/bin/activate 此时，终端…...

编程新知 2026/1/29 20:04:46