当前位置：首页 > news >正文

02 Deep learning algorithm

news 文章来源：https://blog.csdn.net/asdfasaa/article/details/135349561 2025/4/27 4:02:59

Neural Networks target：

inference（prediction）
training my own model
practical advice for building machine learning system
decision Tress

application: speech（语音识别） ----> images(计算机视觉)—> text(NLP)

一、Neural Networks

1.神经元和大脑

1） Demand Prediction（需求预测）

a) some notion

neuron（神经元）：可以将一个简单的模型例如logistic regression 看作一个简单的neuron
layer(层) ： some neuron or single，输入equal or similar feature and out put some data together
activation(激活) ：将 input of neuron called activation
activation function:激活函数是代表能够输出激活值的函数
hidden layer： 知道输入和输出，中间的处理neuron叫做hidden layer

2) 神经网络的网络层

a) definition

输入一组数字向量，经过一系列层的处理，输出另一组数字向量

b) notion:

对于不同的层，w参数的角标也可以标识通过上标标识

c) complex 神经网络

在这里插入图片描述

《四层的神经网络》

input等于0层，123隐藏层，4 4为输出层

计算时候从左向右的方向进行计算

d ) Tensorflow的数据表现形式

因为tensorflow基本处理很大的数据集，都用矩阵表示来让计算更加高效

numpy表示数组方式：
- x = np.array( [ [ ] , [ ] ] ) （）内仅有一个【】代表一维数组，[ [ ] ] 代表二维数组
tensor数组表示方式：
- tensor([ [ ] , [ ] ] , shape( , ) , dtype = )

使用： 一般自己加载和操作数据的时候使用numpy，将数据转入tensorflow 时候会转化为tensor来方便计算和处理

3） build neural network

a ) build in tensorflow

过程：创建dense 隐藏层，将隐藏层顺序连接，编译，输入x和y，训练模型，模型拟合

b ) dense and forward prop in numpy （传播向量化）

4 ) A G I (artificial g eneral intelligence)

	definition： AI 可以做人类所做的一切事情

5 ） Martrix multiplication in numpy

definition

numpy库中中的用于两个矩阵之间的乘法，也可以等价于 AT @ W

optimization forward prop（优化传播向量）

2. use tensorflow build neuron

步骤： 1.指定模型（设置dense层） 2.compile编译模型 3.epoch 训练模型

i .模型训练细节

1）create the model

model= sequential( [ Dense() Dense() ] )

2）loss and cost function

对于分类问题使用 model.compile(loss = BinaryCrossentropy()) 二元交叉熵损失函数

对于线性回归：model.compile(loss = MeanSquareError ()) 均方差

3）gradient descent

使用反向传播 model.fit( X , y , epochs = 100 )

i i . sigmoid 替代函数

作用：有时不仅是0-1的概率，有不同的条件需要找不同的函数

1） reLU function

g(z) = max(0,z)

2）linear activation function

g(z) = z = wx + b

3 ) how to select activation function

可以在不同的神经元中选择不同的激活函数，根据需求选择
- output layer：如果分类 0，1 最好选择sigmoid函数，有正负的linear function 合适
- hidden layer： 主流的 relu function ，运算速度更加快，只有x负半轴平缓，梯度下降时更快

二、multiclass classification problem

1 . Softmax

i . softmax regression (N possible outputs)

i i. cost function

如果计算y = 某个值的cost function 则只需要带入对应的成本函数

在这里插入图片描述

i i i . implement in tensorflow

只需将最后一层换为 softmax
将损失函数换为：SparseCategoricalCrossentropy（密集分类交叉熵损失函数）

v i . improve softmax

当计算时，有时候式子之间有计算误差，所以在误差函数后加（from_logits = true）

2 . improve α algorithm

i . Adam algorithm

作用：如果梯度是一直稳定下降的时候就会适当的增大 α，当来一个值两边震荡时，会减小α

	**使用：**

3 . Convolutional layer （卷积层）

作用： 对于前一层的feature并不是全部选取，而是选取了一部分

三、Evaluate the performance of algorithm

1 . Evaluate the model

i . use test set

取出 70% 用来作training set，其余的30%用来作 test set评估model的泛化能力

但是只是用测试集来评估几次多项式也是不准确的

i i . Training / cross validation（交叉样本） / test set

60% training set 20% cross validation 20% test set

先用training set 和 cross validation 来选择最佳的模型，然后确定好了最佳模型以后我们将在最后的 test set模型测试最终的准确度

i i i . Bias / Variance (偏差和方差)

d 代表了多项式的次数

在这里插入图片描述

d越大，J-train越来越小，J-cv越来越大

high-bias（欠拟合）：在training set表现不好

high-variance（过拟合）：在验证集表现相比training set 差得多，增加training可以改善

vi . Regulartion (正则化)

当 **入** 越大最后拟合的曲线接近一条 y = b 的直线，y越小也会出现 overfit

可以使用交叉验证来选择合适的入

v i i . how to add regularization

2 . Iterative loop of ML development

i . add data

**data augmentation **:的一个技巧：对数据所作的改变或者扭曲，例如给语音加上噪音，给图片扭曲,但是最后得到的数据仍和测试集中得到的很相似。

i i. transfer learning（迁移学习）

作用：使用来自不同任务的数据来解决当前的任务，可以通过学习识别猫，狗，牛，人等，为前几个层学习了一些合理的参数，然后将参数transfer到新的神经网络中去

Why? 为什么通过识别其他的东西能够帮助识别类似手写数字一样的东西呢？

因为头几层的网络都在识别图像的基本特征，找到边角，曲线，基本形状等相似的特征，所以对于不同类型的图片效果都是一样的

四、倾斜数据集的误差指标

why：因为例如罕见病中，数据集很多都是不患病的，所以需要衡量一个算法好坏

1 . precision / recall（准确度和召回）

i . definition

i i . 权衡精确度和召回

设置一个高的阈值，会使精确度提高，但是召回下降，相反的话召回提高，但是精确度下降

i i i .F 1 Score ( f 1 指标 )

在这里插入图片描述

02 Deep learning algorithm

Neural Networks target： inference（prediction）training my own modelpractical advice for building machine learning systemdecision Tress application: speech（语音识别） ----> images(计算机视觉)—> t…...

编程日记 2024/1/5 15:03:02

代码随想录算法训练营第二十四天 | 回溯算法

理论基础代码随想录原文什么是回溯法回溯也可以叫做回溯搜索法，它是一种搜索的方式。回溯是递归的副产品，只要有递归就会有回溯。回溯法的效率虽然回溯法很难，不好理解，但是回溯法并不是什么高效的算法。因为回溯的本…...

编程日记 2024/1/5 15:00:59

Spring Cloud Gateway 缓存区异常

目录 1、问题背景 2、分析源码过程 3、解决办法最近在测试环境spring cloud gateway突然出现了异常，在这里记录一下，直接上干货 1、问题背景测试环境spring cloud gateway遇到以下异常 DataBufferLimitException: Exceeded limit on max bytes t…...

编程日记 2024/1/5 14:58:58

链接官网 Spring Boot文档官网：https://docs.spring.io/spring-boot/docs/https://docs.spring.io/spring-boot/docs/ Spring Boot 2.0.7.RELEASE Spring Boot 2.0.7.RELEASE reference相关：https://docs.spring.io/spring-boot/docs/2.…...

编程日记 2024/1/5 14:56:56

Java项目：109SpringBoot超市仓管系统

博主主页：Java旅途简介：分享计算机知识、学习路线、系统源码及教程文末获取源码一、项目介绍超市仓管系统基于SpringBootMybatis开发，系统使用shiro框架做权限安全控制，超级管理员登录系统后可根据自己的实际需求配角色&…...

编程日记 2024/1/5 14:55:55

【React系列】Redux(三) state如何管理

本文来自#React系列教程：https://mp.weixin.qq.com/mp/appmsgalbum?__bizMzg5MDAzNzkwNA&actiongetalbum&album_id1566025152667107329) 一. reducer拆分 1.1. reducer代码拆分我们来看一下目前我们的reducer： function reducer(state ini…...

编程日记 2024/1/5 14:54:54

3D 纹理的综合指南

在线工具推荐：3D数字孪生场景编辑器 - GLTF/GLB材质纹理编辑器 - 3D模型在线转换 - Three.js AI自动纹理开发包 - YOLO 虚幻合成数据生成器 - 三维模型预览图生成器 - 3D模型语义搜索引擎我们经常看到超现实主义的视频游戏和动画电影角色出现在屏幕上。他们皮肤上的…...

编程日记 2024/1/5 14:53:53

LLM之RAG实战（十一）| 使用Mistral-7B和Langchain搭建基于PDF文件的聊天机器人

在本文中，使用LangChain、HuggingFaceEmbeddings和HuggingFace的Mistral-7B LLM创建一个简单的Python程序，可以从任何pdf文件中回答问题。一、LangChain简介 LangChain是一个在语言模型之上开发上下文感知应用程序的框架。LangChain使用带prompt和few-…...

编程日记 2024/1/5 14:48:48

VLOOKUP的使用方法

VLOOKUP是Excel中一个非常有用的函数，用于在一个表格或范围中查找某个值，并返回该值所在行或列的相应数据。 VLOOKUP函数的基本语法如下： VLOOKUP(lookup_value, table_array, col_index_num, [range_lookup])lookup_value：要查…...

编程日记 2024/1/5 14:46:47

数据加密、端口管控、行为审计、终端安全、整体方案解决提供商

PC端访问地址： https://isite.baidu.com/site/wjz012xr/2eae091d-1b97-4276-90bc-6757c5dfedee 以下是关于这几个概念的解释： 数据加密：这是一种通过加密算法和密钥将明文转换为密文，以及通过解密算法和解密密钥将密文恢复为明文…...

编程日记 2024/1/5 14:45:45

编码器原理详解

编码器什么是编码器编码器可以用来将信息编码成为二进制代码，有点类似于取代号，人为的将二进制代码与对应的信息联系起来。如下图所示： 假设有这三种情况会发生，且每次只发生一种情况为了给这三种情况做一个区分&#xff…...

编程日记 2024/1/5 14:44:44

linux下docker搭建mysql8

1：环境信息 centos 7,mysql8 安装docker环境 2.创建mysql容器 2.1 拉取镜像 docker pull mysql:8.0.23 2.2 查询镜像拉取成功 docker images 2.3 创建挂载的目录文件 mkdir /usr/mysql8/conf mkdir /usr/mysql8/data ##给data文件赋予操作权限 chmod 777 /…...

编程日记 2024/1/5 14:42:43

书生·浦语大模型实战1

书生浦语大模型全链路开源体系视频链接：书生浦语大模型全链路开源体系_哔哩哔哩_bilibili 大模型之所以能收到这么高的关注度，一个重要原因是大模型是发展通用人工智能的重要途径深度信念网络： （1）又被称为贝叶斯网…...

编程日记 2024/1/5 14:41:42

前端JS加密对抗由浅入深-1

前言： 本文主要讲解，针对前端加密数据传输站点，如何进行动态调试以获取加密算法、秘钥，本次实验不涉及漏洞挖掘，仅为学习演示，环境为本地搭建环境此次站点加密方式为AES加密方式，现如今越来越…...

编程日记 2024/1/5 14:38:39

八股文打卡day17——计算机网络（17）

面试题：拥塞控制是怎么实现的？ 我的回答： 1.慢启动在连接刚建立的时候，会缓慢调大滑动窗口的大小，从而加大网络传输速率，避免速率太快，造成拥塞。 2.拥塞避免慢启动之后，会进入拥…...

编程日记 2024/1/5 14:37:38

Java-经典算法-logcat获取数据

1 需求 2 语法 3.1 示例：打印本次查询数据 import java.io.BufferedReader; import java.io.IOException; import java.io.InputStream; import java.io.InputStreamReader;/*** 功能：adb logcat -b main -s PRIVA_LOG -d*/ public class Test {public …...

编程日记 2024/1/5 14:36:37

APache 网页优化

技能目标： 掌握 Apache 网页压缩掌握 Apache 网页缓存掌握 Apache 网页防盗链掌握 Apache 隐藏版本信息 4.1 网页压缩与缓存在使用 Apache 作为 Web 服务器的过程中，只有对 Apache 服务器进行适当的优化配置&…...

编程日记 2024/1/5 14:34:36

C语言实现关键字匹配算法（复制即用）

文章目录前言功能要求运行截图全部代码前言无套路，均已上机通过，求个关注求个赞，提供答疑解惑服务。功能要求一份C源代码存储在一个文本文件中，请统计该文件中关键字出现的频度，并按此频度对关键字进行排序。要…...

编程日记 2024/1/5 14:33:35

【大数据】安装 Zookeeper 单机版

安装 Zookeeper 单机版下面安装 Zookeeper，由于它是 Apache 的一个顶级项目，所以域名是 zookeeper.apache.org，所有 Apache 的顶级项目的官网都是以项目名 .apache.org 来命名的。点击 Download 即可下载，这里我们选择的版本是 …...

编程日记 2024/1/5 14:31:32

Django 快速整合 Swagger：实用步骤和最佳实践

Django ，作为 Python 编写的一个优秀的开源 Web 应用框架，特别适用于快速开发的团队。对于很多场景来说，我们需要一份 API 文档，好处实在太多了： 提高开发效率：开发者可以基于 API 文档快速学习和尝试 AP…...

编程日记 2024/1/5 14:30:31

C++ cstdio

头文件 <cstdio> 是 C 中的标准输入输出库（C Standard Input and Output Library）头文件，它提供了一系列的输入输出函数。以下是其中一些主要的函数： 输入函数： scanf: 格式化输入函数，用于从标准输入…...

编程日记 2024/1/5 14:27:28

昇腾多卡通信教程【配置网络检测对象IP】

无法通信会出现的错误如下一、网络健康状态报错命令原型 hccn_tool [-i %d] -netdetect -s [address %s]命令功能本功能支持用户执行命令获取网络健康状态（本端与所配置的检测IP之间的连通状态），用户可指定上报的状态信息名称。状态信…...

编程日记 2024/1/5 14:24:26

PKI 公钥基础设施，公钥私钥，信息摘要，数字签名，数字证书

PKI 公钥基础设施 https 基于 PKI 技术。PKI（Public Key Infrastructure，公钥基础设施）是一种安全体系结构，用于管理数字证书和密钥对，以确保安全的数据传输和身份验证。PKI 采用了公钥加密技术，其中每个实…...

编程日记 2024/1/5 14:22:24

企业Aspera替代方案有哪些推荐

随着企业数据量的不断增加，数据传输和共享成为了一个重要的问题。Aspera是一款高性能、低延迟的数据传输工具，但是它并不是万能的，随着数据量的不断增大，也有一些企业需要寻找Aspera的替代方案。本文将介绍三种常用的企业Aspera替…...

编程日记 2024/1/5 14:21:23

vue3 vuedraggable draggable element must have an item slot

vue3vite 看官网使用这种<template #item“{ element }”> <draggablev-model"myArray"start"onStart"end"onEnd":sort"false"item-key"id"draggable".item"handle".mover" ><template…...

编程日记 2024/1/5 14:20:22

如何缓解BOT攻击？分享灵活准确的防御之道

BOT流量在所有互联网流量中的占比过半，而且存在好坏之分。其中“好”的BOT，比如在互联网上搜索和查找内容的BOT，它们是我们不可或缺的帮手。恶意的BOT进行信息数据爬取、薅羊毛等攻击行为，正损害着企业和用户的利益。专业数据统计…...

编程日记 2024/1/5 14:16:17

了解JavaScript的执行环境及作用域

一、执行环境执行环境定义了变量或函数有权访问的其他数据，决定了它们的各自行为。每个执行环境都有一个与之关联的变量对象，环境中定义的所有变量和函数都保存在这个对象中。虽然我们无法访问这个对象，但是解析器在处理数据时会在后台使用它…...

编程日记 2024/1/5 14:09:11

嵌套调用和链式访问

嵌套调用嵌套调用就是函数之间的互相调用，每个函数就是⼀个乐高零件，正是因为多个乐高的零件互相无缝的配合才能搭建出精美的乐高玩具，也正是因为函数之间有效的互相调用，最后写出来了相对大型的程序。假设我们计算某年…...

编程日记 2024/1/5 14:08:10

DBA技术栈（二）：MySQL 存储引擎

2.1 MySQL存储引擎概述上个业余的图： MyISAM 存储引擎是 MySQL 默认的存储引擎，也是目前 MySQL 使用最为广泛的存储引擎之一。他的前身就是我们在 MySQL 发展历程中所提到的 ISAM，是 ISAM 的升级版本。在 MySQL最开始发行的时候是 ISAM 存…...

编程日记 2024/1/5 14:07:09

java发送邮件到qq邮箱

自己的授权码自己记好引入依赖 <dependency><groupId>com.sun.mail</groupId><artifactId>javax.mail</artifactId><version>1.6.2</version> </dependency> <dependency><groupId>javax.mail</groupId>&…...

编程日记 2024/1/5 14:06:08

一、Neural Networks

1.神经元和大脑

1） Demand Prediction（需求预测）

a) some notion

2) 神经网络的网络层

a) definition

b) notion:

c) complex 神经网络

3） build neural network

a ) build in tensorflow

b ) dense and forward prop in numpy （传播向量化）

4 ) A G I (artificial g eneral intelligence)

5 ） Martrix multiplication in numpy

definition

optimization forward prop（优化传播向量）

2. use tensorflow build neuron

i .模型训练细节

1）create the model

2）loss and cost function

3）gradient descent

i i . sigmoid 替代函数

1） reLU function

2）linear activation function

3 ) how to select activation function

二 、multiclass classification problem

1 . Softmax

i . softmax regression (N possible outputs)

i i. cost function

i i i . implement in tensorflow

v i . improve softmax

2 . improve α algorithm

i . Adam algorithm

3 . Convolutional layer （卷积层）

三、Evaluate the performance of algorithm

1 . Evaluate the model

i . use test set

i i . Training / cross validation（交叉样本） / test set

i i i . Bias / Variance (偏差和方差)

vi . Regulartion (正则化)

v i i . how to add regularization

2 . Iterative loop of ML development

i . add data

i i. transfer learning（迁移学习）

四、倾斜数据集的误差指标

1 . precision / recall（准确度和召回）

i . definition

i i . 权衡精确度和召回

i i i .F 1 Score ( f 1 指标 )

相关文章：

二、multiclass classification problem