当前位置：首页 > news >正文

numpy实现神经网络

news 文章来源：https://blog.csdn.net/2201_75381449/article/details/134761722 2025/4/30 13:51:56

numpy实现神经网络

首先讲述的是神经网络的参数初始化与训练步骤

随机初始化

任何优化算法都需要一些初始的参数。到目前为止我们都是初始所有参数为0，这样的初始方法对于逻辑回归来说是可行的，但是对于神经网络来说是不可行的。如果我们令所有的初始参数都为0，这将意味着我们第二层的所有激活单元都会有相同的值。同理，如果我们初始所有的参数都为一个非0的数，结果也是一样的。

我们通常初始参数为正负ε之间的随机值

训练神经网络一般步骤

参数的随机初始化
利用正向传播方法计算所有的 $h_{\theta}(x)$
编写计算代价函数 $J$ 的代码
利用反向传播方法计算所有偏导数
利用数值检验方法检验这些偏导数
使用优化算法来最小化代价函数

激活函数和参数初始化

sigmoid函数
在这里插入图片描述
relu函数：

import numpy as np# sigmoid激活函数
def sigmoid(x):return 1/(1+np.exp(-x))# relu激活函数
def relu(x):return np.maximum(0, x)# sigmoid反向传播函数
def sigmoid_back(x):return x*(1-x)# relu反向传播函数
def relu_back(x):return np.where(x > 0, 1, 0)#初始化参数
def initialize(input_size,hidden_size,output_size):'''input_size 输入层列数hidden_size 隐藏层列数output_size 输出层列数'''np.random.seed(42)input_hidden_weights=np.random.randn(input_size,hidden_size)input_hidden_bias=np.zeros((1,hidden_size))hidden_out_weights=np.random.randn(hidden_size,output_size)hidden_out_bias=np.zeros((1,output_size))return input_hidden_weights,input_hidden_bias,hidden_out_weights,hidden_out_bias

前向传播和反向传播函数

# 前向传播
def forward(inputs,input_hidden_weights,input_hidden_bias,hidden_out_weights,hidden_out_bias):hidden_input=np.dot(inputs,input_hidden_weights)+input_hidden_biashidden_output=relu(hidden_input)final_input=np.dot(hidden_output,hidden_out_weights)+hidden_out_biasfinal_output=sigmoid(final_input)return hidden_output,final_output# 后向传播
def backward(inputs,hidden_output,final_output,target,hidden_out_weights):output_error = target - final_outputoutput_delta = output_error * sigmoid_back(final_output)hidden_error = output_delta.dot(hidden_out_weights.T)hidden_delta = hidden_error * relu_back(hidden_output)return output_delta,hidden_delta

更新参数

# 更新参数
def update(inputs, hidden_output, output_delta, hidden_delta, input_hidden_weights, input_hidden_bias,hidden_output_weights, hidden_output_bias, learning_rate):hidden_output_weights =hidden_output_weights+ hidden_output.T.dot(output_delta) * learning_ratehidden_output_bias = hidden_output_bias+ np.sum(output_delta, axis=0, keepdims=True) * learning_rateinput_hidden_weights = input_hidden_weights+ inputs.T.dot(hidden_delta) * learning_rateinput_hidden_bias = input_hidden_bias+ np.sum(hidden_delta, axis=0, keepdims=True) * learning_ratereturn input_hidden_weights,input_hidden_bias,hidden_output_weights,hidden_output_bias

训练及预测模型

#训练模型
def train(inputs, target, input_size, hidden_size, output_size, learning_rate, epochs):input_hidden_weights,input_hidden_bias,hidden_output_weights,hidden_output_bias=initialize(input_size,hidden_size,output_size)# 梯度下降优化模型for epoch in range(epochs):hidden_output,final_output=forward(inputs,input_hidden_weights,input_hidden_bias,hidden_output_weights,hidden_output_bias)output_delta,hidden_delta=backward(inputs,hidden_output,final_output,target,hidden_output_weights)input_hidden_weights,input_hidden_bias,hidden_output_weights,hidden_output_bias=update(inputs,hidden_output,output_delta,hidden_delta,input_hidden_weights,input_hidden_bias,hidden_output_weights,hidden_output_bias,learning_rate)# 计算损失loss = np.mean(np.square(targets - final_output))if epoch % 100 == 0:print(f"Epoch {epoch}: Loss {loss}")return input_hidden_weights,input_hidden_bias,hidden_output_weights,hidden_output_bias# 预测模型
def predict(inputs, input_hidden_weights, input_hidden_bias, hidden_output_weights,hidden_output_bias):_, result = forward(inputs, input_hidden_weights, input_hidden_bias, hidden_output_weights, hidden_output_bias)return [1 if y_hat>0.5 else 0  for y_hat in result]

检验模型

# 定义训练数据和目标
inputs = np.array([[0, 0], [0, 1], [1, 0], [1, 1]])
target = np.array([[0], [1], [1], [0]])# 定义神经网络参数
input_size = 2
hidden_size = 4
output_size = 1
learning_rate = 0.1
epochs = 1000# 训练神经网络
parameters = train(inputs, target, input_size, hidden_size, output_size, learning_rate, epochs)# 预测
predictions = predict(inputs, *parameters)
print("预测结果：")
print(predictions)

最终结果

在这里插入图片描述

numpy实现神经网络

numpy实现神经网络首先讲述的是神经网络的参数初始化与训练步骤随机初始化任何优化算法都需要一些初始的参数。到目前为止我们都是初始所有参数为0，这样的初始方法对于逻辑回归来说是可行的，但是对于神经网络来说是不可行的。如果我们令所有的初始…...

编程日记 2023/12/3 23:12:35

Bean的加载控制文章目录 Bean的加载控制编程式注解式ConditionalOn*** 编程式 public class MyImportSelector implements ImportSelector {Overridepublic String[] selectImports(AnnotationMetadata annotationMetadata) {try {Class<?> clazz Class.forName("…...

编程日记 2023/12/3 23:11:34

使用 OpenCV 识别和裁剪黑白图像上的白色矩形--含源码

为了仅获取具有特定边框颜色的矩形，我寻求一种替代识别图像中的轮廓和所有矩形的传统方法。如示例图片所示，我有兴趣使用 opencv 仅获取白色边框矩形的坐标。任何这方面的建议将不胜感激。到目前为止，我的代码已产生如下所示的输出。我的下一个目标是将图像裁剪到大的中心框…...

编程日记 2023/12/3 23:08:32

LeetCode 每日一题 Day1

1094. 拼车车上最初有 capacity 个空座位。车只能向一个方向行驶（也就是说，不允许掉头或改变方向） 给定整数 capacity 和一个数组 trips , trip[i] [numPassengersi, fromi, toi] 表示第 i 次旅行有 numPassengersi 乘客，接…...

编程日记 2023/12/3 23:07:31

【hacker送书活动第7期】Python网络爬虫入门到实战

第7期图书推荐内容简介作者简介大咖推荐图书目录概述参与方式内容简介本书介绍了Python3网络爬虫的常见技术。首先介绍了网页的基础知识，然后介绍了urllib、Requests请求库以及XPath、Beautiful Soup等解析库，接着介绍了selenium对动态网站的爬取和S…...

编程日记 2023/12/3 23:05:29

【算法】希尔排序

目录 1. 说明2. 举个例子3. java代码示例4. java示例截图 1. 说明 1.希尔排序是直接插入排序的一种改进，其本质是一种分组插入排序 2.希尔排序采取了分组排序的方式 3.把待排序的数据元素序列按一定间隔进行分组，然后对每个分组进行直接插入排序 4.随着间…...

编程日记 2023/12/3 22:59:23

四、Zookeeper节点类型

目录 1、临时节点 2、永久节点 Znode有两种，分别为临时节点和永久节点。节点的类型在创建时即被确定，并且不能改变。 1、临时节点临时节点的生命周期依赖于创建它们的会话。一旦会话结束，临时节点将被自动删除，...

编程日记 2023/12/3 22:57:22

arcgis导出某个属性的栅格

选中栅格特定属性想要导出时，无法选中“所选图形” 【方法】spatial analyst 工具——提取分析——按属性提取...

编程日记 2023/12/3 22:55:20

计算机网络——传输层

传输层的基本单位是报文； 一、传输层的基本概念传输层提供端到端的服务； 从通信和信息处理的角度看，传输层向上层应用层提供通信服务； （一）端口号协议作用端口号FTP文件传输协议21连接；2…...

编程日记 2023/12/3 22:54:20

策略设计模式

package com.jmj.pattern.strategy;public interface Strategy {void show(); }package com.jmj.pattern.strategy;public class StrategyA implements Strategy{Overridepublic void show() {System.out.println("买一送一");} }package com.jmj.pattern.strategy;p…...

编程日记 2023/12/3 22:48:15

Golang中rune和Byte，字符和字符串有什么不一样

Rune和Byte，字符和字符串有什么不一样 String Go语言中， string 就是只读的采用 utf8 编码的字节切片(slice) 因此用 len 函数获取到的长度并不是字符个数，而是字节个数。 for循环遍历输出的也是各个字节。 Rune rune 是 int32 …...

编程日记 2023/12/3 22:47:14

实施工程师运维工程师面试题

Linux 1.请使用命令行拉取SFTP服务器/data/20221108/123.csv 文件，到本机一/data/20221108目录中。使用命令行拉取SFTP服务器文件到本机指定目录，可以使用sftp命令。假设SFTP服务器的IP地址为192.168.1.100，用户名为username，密…...

编程日记 2023/12/3 22:46:14

6-13连接两个字符串

#include<stdio.h> int main(){int i0,j0;char s1[222],s2[333];printf("请输入第一个字符串：\n");gets(s1);//scanf("%s",s1);printf("请输入第二个字符串：\n");gets(s2);while(s1[i]!\0)i;while(s2[j]!\0)s1[i]s2…...

编程日记 2023/12/3 22:45:13

Linux中的文件IO

文章目录 C语言文件操作系统文件I/O接口介绍 open函数返回值文件描述符fd0 & 1 & 2文件描述符的分配规则重定向使用 dup2 系统调用 FILE理解文件系统理解硬链接软链接acm 动态库和静态库静态库与动态库生成静态库生成动态库： C语言文件操作先来段代码回顾…...

编程日记 2023/12/3 22:40:09

深度学习记录--初识向量化

什么是向量化？ 之前计算logistic回归损失函数时，在代码实现时，讨论了for循环：过多的for循环会拖慢计算的速度(尤其当数据量很大时) 因此，为了加快计算，向量化是一种手段运用python的numpy库&#xff0c…...

编程日记 2023/12/3 22:37:05

树与二叉树堆：经典OJ题集（2）

目录二叉树的性质及其问题： 二叉树的性质问题： 一、对称的二叉树： 题目： 解题思路： 二、另一棵树： 题目： 解题思路： 三、翻转二叉树： 题目：…...

编程日记 2023/12/3 22:35:04

Java面试题（每天10题）-------连载（40）

目录 Mysql篇 1、表中有大字段X（例如：text类型），且字段X不会经常更新，将该字段拆成子表好处是什么？ 2、Mysql中InnoDB引擎的行锁是通过加载什么上完成的？ 3、Mysql中控制内存分配的全局参数…...

编程日记 2023/12/3 22:33:02

2023年【起重机司机(限桥式起重机)】报名考试及起重机司机(限桥式起重机)考试资料

题库来源：安全生产模拟考试一点通公众号小程序 2023年【起重机司机(限桥式起重机)】报名考试及起重机司机(限桥式起重机)考试资料，包含起重机司机(限桥式起重机)报名考试答案和解析及起重机司机(限桥式起重机)考试资料练习。安全生产模拟考试一点通结合…...

编程日记 2023/12/3 22:29:59

Linux的基本指令（3）

目录制作小文件&查看 nano指令 cat指令 tac指令制作大文件&查看一切皆文件 echo指令 > 输出重定向以写"w"的形式打开文件以追加"a"的形式打开文件 cat指令 < 输入重定向创建big.txt more指令 less指令（推…...

编程日记 2023/12/3 22:27:56

C语言memcpy，memmove的介绍及模拟实现

文章目录每日一言memcpy介绍模拟实现 memmove介绍模拟实现思路代码结语每日一言 If you want to lift yourself up, lift up someone else. 如果你想振奋自己， 先振奋周遭的人。 memcpy 介绍函数原型： void *memcpy(void *dest, const void *sr…...

编程日记 2023/12/3 22:26:55

克服.360勒索病毒：.360勒索病毒的解密和预防

导言: 在数字化的今天，数据安全问题变得愈发棘手。.360勒索病毒是当前网络空间的一场潜在灾难，对于这个威胁，了解应对之道和采取切实的预防措施至关重要。如果您正在经历勒索病毒的困境，欢迎联系我们的vx技术服务号（s…...

编程日记 2023/12/3 22:23:52

21、Resnet50 中包含哪些算法？

（本文已加入“计算机视觉入门与调优”专栏，点击专栏查看更多文章信息）这一节汇总一下resnet50 中包含的算法，并且简单介绍。总共卷积算法、激活算法（relu）、最大池化算法、加法（主要是为了实现残差结构）、全局平均池化、全连接和 softmax 算法这几种算法。卷积卷…...

编程日记 2023/12/3 22:22:51

pybind11教程

pybind11教程文章目录 pybind11教程1. pybind11简介2. cmake使用pybind11教程3. pybind11的历史 1. pybind11简介项目的GitHub地址为： pybind11 pybind11 是一个轻量级的头文件库，用于在 Python 和 C 之间进行互操作。它允许 C 代码被 Python 调用&am…...

编程日记 2023/12/3 22:19:48

Java基础- 自定义类加载器

自定义类加载器在 Java 中实现自定义类加载器通常涉及继承 ClassLoader 类并重写其 findClass 方法。自定义类加载器允许我们从非标准来源（如网络、加密文件或其他媒体）加载类。下面是实现自定义类加载器的基本步骤： 1. 继承 ClassLoader …...

编程日记 2023/12/3 22:17:47

2022年高校大数据挑战赛A题工业机械设备故障预测求解全过程论文及程序

2022年高校大数据挑战赛 A题工业机械设备故障预测原题再现： 制造业是国民经济的主体，近十年来，嫦娥探月、祝融探火、北斗组网，一大批重大标志性创新成果引领中国制造业不断攀上新高度。作为制造业的核心，机械设备在…...

编程日记 2023/12/3 22:14:44

洛谷 P1998 阶乘之和 C++代码

前言今天我们来做洛谷上的一道题目。网址：[NOIP1998 普及组] 阶乘之和 - 洛谷西江月夜行黄沙道中【宋】辛弃疾明月别枝惊鹊，清风半夜鸣蝉。稻花香里说丰年，听取WA声一片。七八个星天外，两三点雨山前。旧时茅店社林边&…...

编程日记 2023/12/3 22:13:43

洛谷 B2006 地球人口承载力估计 C++代码

目录前言思路点拨 AC代码结尾前言今天我们来做洛谷上的一道题目。网址：地球人口承载力估计 - 洛谷题目： 思路点拨经典牛吃草问题。解设一个人一年吃一份草。则x*a-y*b为会多出的草，为什么会多呢？是因为每年都有…...

编程日记 2023/12/3 22:12:43

少走弯路：OpenCV、insightface 等多方案人脸推理和识别

脑壳有包又花时间折腾了一下，其实之前也折腾过，主要是新看了一个方法在下图中查找脸部第一种方案： 使用了opencv 的cv2.FaceDetectorYN. ，完整代码如下： import numpy as np import cv2imgcv2.imread("00000…...

编程日记 2023/12/3 22:11:42

github代码连接vercel 建立一个公用网站

Deploying to the Cloud using Vercel 前置任务建立一个基于flask的web app代码库并上传至github repo Vercel用途 vercel有点像一个免费的cloud server，帮助你将flask框架下的程序运行在云端。可以public访问。 deploy流程在主文件夹中建立requirements.tx…...

编程日记 2023/12/3 22:10:41

使用pandas将字符串格式数据转换为单独的行

有时在处理数据时，可能会遇到这样的情况，即数据框中的整个字符串条目需要拆分到不同的行中。这可能是一项具有挑战性的任务，特别是当数据庞大而复杂时。尽管如此，一个名为pandas的Python库提供了各种函数，使用这些函数…...

编程日记 2023/12/3 22:09:40

numpy实现神经网络

随机初始化

训练神经网络一般步骤

激活函数和参数初始化

前向传播和反向传播函数

更新参数

训练及预测模型

检验模型

最终结果

相关文章：