当前位置：首页 > news >正文

1-1 动手学深度学习v2-线性回归-笔记

news 2026/2/8 20:29:18

简化核心模型

假设1: 影响房价的关键因素是卧室个数，卫生间个数和居住面积，记为 $x_{1}$ ， $x_{2}$ ， $x_{3}$
假设2: 成交价是关键因素的加权和
$y=w_{1}x_{1}+w_{2}x_{2}+w_{3}x_{3}+b$ 权重和偏差的实际值在后面决定

线性一般模型

给定 $n$ 维输入 $\pmb{x}=[x_{1},x_{2},...,x_{n}]^{T}$
(这里 $x_{1},x_{2},...,x_{n}$ 是实数/标量， $x_{1},x_{2},...,x_{n}]$ 是行向量，再一转置就是一个列向量 $\pmb{x}=[x_{1},x_{2},...,x_{n}]^{T}$ )
线性模型有一个 $n$ 维权重和一个标量偏差
$\pmb{w}=[w_{1},w_{2},...,w_{n}]^{T}，b$ （ $\pmb{w}$ 同 $\pmb{x}$ 理,b是实数/标量）
输出是输入的加权和
$y=w_{1}x_{1}+w_{2}x_{2}+...+w_{n}x_{n}+b$ 向量版本： $y=\langle\pmb{w},\pmb{x}\rangle+b$
（ $\langle\pmb{w},\pmb{x}\rangle$ 表示内积，这里即两个列向量按位相乘。内积算出来的是一个实数标量。）

衡量预测质量

比较真实值和预估值，例如房屋售价和估价
假设 $y$ 是真实值， $\hat{y}$ 是估计值，我们可以比较
$\ell(y,\hat{y})=\frac{1}{2}(y-\hat{y})^{2}$ 这个叫做平方损失，这里之所以有个 $\frac{1}{2}$ ，是因为我们可以在后面的求导过程中很方便地消除掉。

训练数据

收集一些数据点来决定参数值（权重和偏差），例如过去6个月卖的房子
这被称之为训练数据
通常越多越好
假设我们有 $n$ 个样本，记
$\pmb{X}=[\pmb{x_{1}},\pmb{x_{2}},...,\pmb{x_{n}}]^{T}$ （假设每个 $xi \pmb{x_{i}}$ 都是按照上面模型定义的列向量（一个列向量就是一个样本），我们把样本一列列的排好，再经过一个转置，最后的效果就是原先的每一列现在到了每一行， $\pmb{X}$ 的每一行都是一个样本。）
$\pmb{y}=[y_{1},y_{2},...,y_{n}]^{T}$
（每一个 $y_{i}$ 都是一个实数的数值，也即一个样本，那么 $\pmb{y}$ 就是一个列向量。）

参数学习

训练损失
关于数据 $\pmb{X}$ , $\pmb{y}$ ,权重 $\pmb{w}$ ,偏差 $b$ 的损失函数（真实值-估计值）：（这里算出来的是个标量）
$\ell(\pmb{X},\pmb{y},\pmb{w},b)=\frac{1}{2n}\sum_{i=1}^{n}(y_{i}-\langle\pmb{x_{i},w}\rangle-b)^{2}=\frac{1}{2n}||\pmb{y}-\pmb{Xw}-b||^{2}$ 在数学中，双竖线 ∣∣⋅∣∣ 通常表示向量的范数（norm），是衡量向量大小的一种方法。在计算线性回归模型的训练损失时，这个符号用来表示预测误差向量的欧几里得范数（Euclidean norm），也就是通常所说的 L2 范数。
L2范数（L2 norm），是向量元素的平方和的平方根。它在数学和机器学习中经常被用作一种正则化项、距离度量或误差度量。
$||x||_{2} = (x_{1}^{2} + x_{2}^{2} + ... + x_{n}^{2})^{\frac{1}{2}}$ 这里的 $||\pmb{y}-\pmb{Xw}-b||^{2}$ 表示的是预测误差向量 $\pmb{y}-\pmb{Xw}-b$ 的 L2 范数的平方，其中 $\pmb{y}$ 是实际值的向量， $\pmb{X}$ 是特征矩阵， $\pmb{w}$ 是权重向量， $b$ 是偏差项。
计算L2范数的平方是将每个样本的损失值平方后求和，再除以 $2 n$ ，这样做的目的是平均损失，并且在后续的优化过程中，平方项可以帮助计算梯度。
两个等号，后一个是用向量的形式来表示，但是意义都是一样的，也即都是在先计算样本损失值的平方和，再除以样本数，得到一个对于所有样本来说的平均损失。
对于向量的形式，更易于并行化。
最小化损失来学习参数 $w∗,b∗ \pmb{w^{*},b^{*}}=arg\;\min_{\pmb{w},b}\ell(\pmb{X},\pmb{y},\pmb{w},b)$
这个公式的意思是说：要找到 $\pmb{w}$ 和 $b$ 的那个具体值或者值的组合 $w∗,b∗ \pmb{w^{*},b^{*}}$ ，使得 $\ell(\pmb{X},\pmb{y},\pmb{w},b)$ 达到最小值。
这里的 “arg min” 是 “argument of the minimum” 的缩写。

显示解

将偏差加入权重
$\pmb{X}\leftarrow [\pmb{X},\pmb{1}] \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \pmb{w}\leftarrow\left [ \begin{matrix} \pmb{w} \\ b \\ \end{matrix} \right ]$ 给 $\pmb{X}$ 加一列全 $1$ 的特征，也就是在末尾加一个全 $1$ 的列向量 $\pmb{1}$ ，相当于是给所有样本新增一个为1的实数项，然后把偏差放到权重的最后一行。相当于是把偏差融进数据 $\pmb{X}$ 和权重 $\pmb{w}$ 。
损失函数变为：
$\ell(\pmb{X},\pmb{y},\pmb{w})=\frac{1}{2n}||\pmb{y}-\pmb{Xw}||^{2}\ \ \ \ \ \ \ \ \ \ \frac{\partial }{\partial \pmb{w}}\ell(\pmb{X},\pmb{y},\pmb{w})=\frac{1}{n}(\pmb{y}-\pmb{Xw})^{T}\pmb{X}$
线性模型的损失是凸函数，所以最优解满足
$\frac{\partial }{\partial \pmb{w}}\ell(\pmb{X},\pmb{y},\pmb{w})=0$ $\Leftrightarrow \frac{1}{n}(\pmb{y}-\pmb{Xw})^{T}\pmb{X}=0$ $\Leftrightarrow \pmb{w^{*}}=(\pmb{X}^{T}\pmb{X})^{-1}\pmb{X}\pmb{y}$ 凸函数（Convex function）是指从函数图形上来看，任意两点连成的线段，皆位于图形的上方的实值函数。
凸函数的最优解是满足使得它的梯度等于0的地方。

总结

线性回归是对 $n$ 维输入的加权，外加偏差（ $\hat{y}=\pmb{Xw}+b$ ）
使用平方损失来衡量预测值和真实值的差异
线性回归有显示解
线性回归可以看作单层神经网络，是最简单的神经网络

QA补充

为啥使用平方损失而不是绝对差值？
绝对差值在零点处的导数比较难求，并不是一个处处可导的函数
为啥损失要求平均？
求平均和不求平均区别不大，但是不求的话，会导致梯度比较大，如果不除以 $n$ 的话，就把学习率除以 $n$ 吧。
除以 $n$ 的好处是：不管你的样本多大，批量多大，我的梯度都差不多，使得我调学习率比较容易，比较好调。

1-1 动手学深度学习v2-线性回归-笔记

简化核心模型假设1: 影响房价的关键因素是卧室个数，卫生间个数和居住面积，记为 x 1 x_{1} x1， x 2 x_{2} x2， x 3 x_{3} x3假设2: 成交价是关键因素的加权和 y w 1 x 1 w 2 x 2 w 3 x 3 b yw_{1}x_{1}w_{2}x_{2}w_{3…...

编程日记 2024/2/8 1:18:39

算法每日一题：使用循环数组所有元素相等的最少秒数 | 哈希

大家好，我是星恒，今天给大家带来的是一道需要感觉规律的题目，只要读懂题目中的规律，就可以做出来了这道题用到了哈希，还有一个关键点比较类似循环队列题目：leetcode 2808 给你一个下标从 0 开始长度为 n…...

编程日记 2024/2/8 1:17:38

canvas实现涂鸦画板功能

查看专栏目录 canvas实例应用100专栏，提供canvas的基础知识，高级动画，相关应用扩展等信息。canvas作为html的一部分，是图像图标地图可视化的一个重要的基础，学好了canvas，在其他的一些应用上将会起到非常重…...

编程日记 2024/2/8 1:16:37

6-3、T型加减速单片机程序【51单片机+L298N步进电机系列教程】

↑↑↑点击上方【目录】，查看本系列全部文章摘要：根据前两节内容，已完成所有计算工作，本节内容介绍具体单片机程序流程及代码一、程序流程图根据前两节文章内容可知，T型加减速的关键内容是运动类型的判断以及定时…...

编程日记 2024/2/8 1:15:36

Flutter组件 StatefulWidget、StatelessWidget 可继承写法

前言学过Java的同学，应该都知道面向对象语言的三大特征，封装、继承、多态； Dart也是面向对象的语言，但是在Flutter中的很多组件都被下划线 _ 标记为私有，导致无法继承，本文将介绍一种非私有的创建组件写…...

编程日记 2024/2/8 1:14:35

skywalking链路追踪

skywalking 1.简介1.1 skywalking介绍1.2 链路追踪框架对比1.3 Skywalking架构 2 环境构建2.1 windows环境2.1.1 启动skywalking服务和UI界面2.1.2 在IDEA启动项目中使用Skywalking2.1.3 skywalking持久化 2.2 linux环境 1.简介微服务架构已经是一个很通用的系统架构&#xf…...

编程日记 2024/2/8 1:12:33

如何在苹果Mac上进行分屏，多任务处理？

Apple 在 macOS Catalina 中引入了 Split View，让您可以同时查看两个应用程序。如果同时处理多个应用程序，但在它们之间切换时感到沮丧，小编教给大家在 Macbook Pro/Air 或 iMac 上使用分屏功能流畅地进行多任务处理。注意：您可…...

编程日记 2024/2/8 1:11:32

【Java EE】----Spring框架创建和使用

1.Spring框架创建创建一个maven项目添加Spring框架支持 <dependencies> 上下文<dependency><groupId>org.springframework</groupId><artifactId>spring-context</artifactId><version>5.2.3.RELEASE</version></depende…...

编程日记 2024/2/8 1:10:32

UE4 C++ 静态加载类和资源

静态加载类和资源：指在编译时加载，并且只能在构造函数中编写代码 .h //增加所需组件的头文件 #include "Components/SceneComponent.h" //场景组件 #include "Components/StaticMeshComponent.h" //静态网格体组件 #include &qu…...

编程日记 2024/2/8 1:09:31

洛谷C++简单题小练习day9—[AHOI2017]寻找探监点

day9--[AHOI2017]寻找探监点--2.7 习题概述题目描述一个nn 的网格图（标号由 1,1 开始）上有 m 个探测器，每个探测器有个探测半径 r ，问这 nn 个点中有多少个点能被探测到。输入格式第一行 3 个整数 n,m,r。接下来 m 行&…...

编程日记 2024/2/8 1:08:30

JVM双亲委派机制

双亲委派模型是一种组织类加载器之间关系的一种规范,他的工作原理是:如果一个类加载器收到了类加载的请求,它不会自己去尝试加载这个类,而是把这个请求委派给父类加载器去完成,这样层层递进,最终所有的加载请求都被传到最顶层的启动类加载器中,只有当父类加载器无法完成这个加载…...

编程日记 2024/2/8 1:06:28

目录实验一常用网络命令的使用.................................... 1 实验二双绞线制作.................................................. 12 实验三网络模拟软件.............................................. 15 实验四交换机基本配置..................…...

编程日记 2024/2/8 1:02:23

18.AUTOSAR 网络管理系统(一)

目录 1.为什么需要整车网络管理 2.本地唤醒和网络唤醒 3.小结 1.为什么需要整车网络管理在描述AUTOSAR网络管理细节前，大家可以思考几个问题： 1.网络管理为整车系统提供了什么样的服务？ 2.整车网络视角看，每个ECU的上下电是…...

编程日记 2024/2/8 1:01:22

802.11 MAC帧介绍

控制帧 RTS（Request To Send）：用于申请无线媒介的使用时间CTS（Clear To Send）：用于回复RTS帧ACK：对MAC帧的肯定确认PS-POLL：STA用于从AP中获取因省电模式而缓存的数据，只…...

编程日记 2024/2/8 1:00:21

【高阶数据结构】B-树详解

文章目录 1. 常见的搜索结构2. 问题提出使用平衡二叉树搜索树的缺陷使用哈希表的缺陷 3. B-树的概念4. B-树的插入分析插入过程分析插入过程总结 5. B-树的代码实现5.1 B-树的结点设计5.2 B-树的查找5.3 B-树的插入实现InsertKey插入和分裂测试 6. B-树的删除（思想&…...

编程日记 2024/2/8 0:56:17

elementui常用组件-个人版（间断更新）

Dialog 对话框 el-dialog <el-dialogtitle"提示":visible.sync"dialogVisible"width"30%":before-close"handleClose"><span>这是一段信息</span><span slot"footer" class"dialog-footer"…...

编程日记 2024/2/8 0:55:16

无人机在化工消防救援中的应用，消防无人机应用场景分析

火灾对社会环境具有较大影响，因此需要重视消防灭火救援工作，注重现代化技术的运用，将无人机应用到救援过程并保障其应用质量。无人机是一项重要技术，便于消防灭火救援操作，使救援过程灵活展开，排除不利影响…...

编程日记 2024/2/8 0:52:12

java设计模式- 建造者模式

一需求以及实现方式 1.1 需求描述我们要创建一个表示汽车的复杂对象，汽车包含发动机、轮胎和座椅等部分。用传统方式创建，代码如下 1.2 传统实现方式 1.抽象类 public abstract class BuildCarAbstaract {//引擎public abstract void buildEng…...

编程日记 2024/2/8 0:49:09

【C++航海王：追寻罗杰的编程之路】类与对象你学会了吗？(下)

目录 1 -> 再谈构造函数1.1 -> 构造函数体赋值1.2 -> 初始化列表1.3 -> explicit关键字 2 -> static成员2.1 -> 概念2.2 -> 特性 3 -> 友元3.1 -> 友元函数3.2 -> 友元类 4 -> 内部类5 -> 匿名对象6 -> 拷贝对象时的一些编译器优化 1 -…...

编程日记 2024/2/8 0:47:07

解决TSP旅行商问题3个可以用Python编程的优化路径算法

旅行商问题（Traveling Salesman Problem, TSP）是一个经典的组合优化问题，它要求找到访问一系列城市并返回起点的最短可能路线，同时每个城市仅访问一次。这个问题是NP-hard的，意味着没有已知的多项式时间复杂度的精确算…...

编程日记 2024/2/8 0:45:06

Day131 | 灵神 | 回溯算法 | 子集型子集

Day131 | 灵神 | 回溯算法 | 子集型子集 78.子集 78. 子集 - 力扣（LeetCode） 思路： 笔者写过很多次这道题了，不想写题解了，大家看灵神讲解吧回溯算法套路①子集型回溯【基础算法精讲 14】_哔哩哔哩_bilibili 完…...

编程新知 2026/1/23 12:37:51

渗透实战PortSwigger靶场-XSS Lab 14：大多数标签和属性被阻止

编程新知 2026/1/24 13:05:24

【大模型RAG】Docker 一键部署 Milvus 完整攻略

本文概要 Milvus 2.5 Stand-alone 版可通过 Docker 在几分钟内完成安装；只需暴露 19530（gRPC）与 9091（HTTP/WebUI）两个端口，即可让本地电脑通过 PyMilvus 或浏览器访问远程 Linux 服务器上的 Milvus。下面…...

编程新知 2026/1/31 8:08:07

Python爬虫（二）：爬虫完整流程

爬虫完整流程详解（7大核心步骤实战技巧） 一、爬虫完整工作流程以下是爬虫开发的完整流程，我将结合具体技术点和实战经验展开说明： 1. 目标分析与前期准备网站技术分析： 使用浏览器开发者工具（F12&…...

编程新知 2025/10/19 5:48:51

基于Java+MySQL实现（GUI）客户管理系统

客户资料管理系统的设计与实现第一章需求分析 1.1 需求总体介绍本项目为了方便维护客户信息为了方便维护客户信息，对客户进行统一管理，可以把所有客户信息录入系统，进行维护和统计功能。可通过文件的方式保存相关录入数据，对…...

编程新知 2026/1/25 10:12:06

排序算法总结（C++）

目录一、稳定性二、排序算法选择、冒泡、插入排序归并排序随机快速排序堆排序基数排序计数排序三、总结一、稳定性排序算法的稳定性是指：同样大小的样本 **（同样大小的数据）**在排序之后不会改变原始的相对次序。稳定性对基础类型对象…...

编程新知 2026/1/25 9:33:23

虚拟电厂发展三大趋势：市场化、技术主导、车网互联

市场化：从政策驱动到多元盈利政策全面赋能 2025年4月，国家发改委、能源局发布《关于加快推进虚拟电厂发展的指导意见》，首次明确虚拟电厂为“独立市场主体”，提出硬性目标：2027年全国调节能力≥2000万千瓦&#xff0…...

编程新知 2025/12/20 18:09:59

vue3 daterange正则踩坑

<el-form-item label"空置时间" prop"vacantTime"> <el-date-picker v-model"form.vacantTime" type"daterange" start-placeholder"开始日期" end-placeholder"结束日期" clearable :editable"fal…...

编程新知 2025/12/27 19:12:09

yaml读取写入常见错误 (‘cannot represent an object‘, 117)

错误一：yaml.representer.RepresenterError: (‘cannot represent an object’, 117) 出现这个问题一直没找到原因，后面把yaml.safe_dump直接替换成yaml.dump，确实能保存，但出现乱码： 放弃yaml.dump，又切…...

编程新知 2026/2/4 11:44:10

基于开源AI智能名片链动2 + 1模式S2B2C商城小程序的沉浸式体验营销研究

摘要：在消费市场竞争日益激烈的当下，传统体验营销方式存在诸多局限。本文聚焦开源AI智能名片链动2 1模式S2B2C商城小程序，探讨其在沉浸式体验营销中的应用。通过对比传统品鉴、工厂参观等初级体验方式，分析沉浸式体验的优势与价值…...

编程新知 2026/2/2 21:52:42

1-1 动手学深度学习v2-线性回归-笔记

简化核心模型

线性一般模型

衡量预测质量

训练数据

参数学习

显示解

总结

QA补充

相关文章：

1-1 动手学深度学习v2-线性回归-笔记

算法每日一题：使用循环数组所有元素相等的最少秒数 | 哈希

canvas实现涂鸦画板功能

6-3、T型加减速单片机程序【51单片机+L298N步进电机系列教程】

Flutter组件 StatefulWidget、StatelessWidget 可继承写法

skywalking链路追踪

如何在苹果Mac上进行分屏，多任务处理？

【Java EE】----Spring框架创建和使用

UE4 C++ 静态加载类和资源

洛谷C++简单题小练习day9—[AHOI2017]寻找探监点

JVM双亲委派机制

思科模拟器实验合集

18.AUTOSAR 网络管理系统(一)

802.11 MAC帧介绍

【高阶数据结构】B-树详解

elementui常用组件-个人版（间断更新）

无人机在化工消防救援中的应用，消防无人机应用场景分析

java设计模式- 建造者模式

【C++航海王：追寻罗杰的编程之路】类与对象你学会了吗？(下)

解决TSP旅行商问题3个可以用Python编程的优化路径算法

Day131 | 灵神 | 回溯算法 | 子集型子集

渗透实战PortSwigger靶场-XSS Lab 14：大多数标签和属性被阻止

【大模型RAG】Docker 一键部署 Milvus 完整攻略

Python爬虫（二）：爬虫完整流程

基于Java+MySQL实现（GUI）客户管理系统

排序算法总结（C++）

虚拟电厂发展三大趋势：市场化、技术主导、车网互联

vue3 daterange正则踩坑

yaml读取写入常见错误 (‘cannot represent an object‘, 117)

基于开源AI智能名片链动2 + 1模式S2B2C商城小程序的沉浸式体验营销研究