当前位置: 首页 > news >正文

数学建模——统计回归模型

一、基本知识

1、基本统计量

  1. 总体:研究对象的某个感兴趣的指标。
  2. 样本:从总体中随机抽取的独立个体X1,X2,…,Xn,一般称(X1,…,Xn)为一个样本,可以看成一个n维随机向量,它的每一取组值(x1,…,xn)称为样本的观测值。
  3. 统计量:样本是总体的代表,抽取后不直接利用样本的观测值进行推断,而是把样本所包含的有关信息集中起来进行研究,即针对研究的目的构造样本的某种函数,称为样本函数,只包含样本信息的样本函数就是统计量。根据研究目的,下面介绍常见的统计量。

 平均值、中位数、众数、方差、均方差(标准差)、极差就不介绍了。

  • 分位数:满足的Zα称为分布函数F的α分位数。
  • 偏度:反映数据分布对称性指标。  当P1>0是称为右偏,即数据位于均值右边的居多;当P1<0是左偏,即数据位于均值左边的居多;当P1≈0时,数据分布关于均值对称。
  • 峰度:。计算正态分布的峰度值为3(均匀分布的峰度是1.8),若P2>3,表示数据分布有沉重的尾巴,即很多数据离均值较远。
  • k阶原点矩:
  • k阶中心矩:
  • 变异系数(Coefficient of Variation):(两组变量量纲不同时的差异程度比较),常常用于反映重要程度的权系数。

二、统计回归模型基础

1、回归模型

处于同一个大系统下各个变量,它们相依存,相互制约,却又不能判定为确定的函数关系,这类关系称为相关关系。例如作物的产量与施肥量相关,人的身高与体重相关。

一般地,考虑多个变量的情形,将考察的目标的变量Y称为因变量,而影响它的其它各个变量称为自变量或可控变量。在给定可控变量X1,X2,…,Xp的一组观测值x1,x2,…,xp,若Y的条件数学期望存在,称其为Y关于X1,X2,…,Xp的回归函数。

称为Y对X1,…,Xp的回归方程。

【2.1】称为Y对X1,…,Xp的回归模型。特别当时,称【2.1】为正态回归模型,其中ε表示模型的拟合误差,又称为残差或随机扰动项。理想的模型应当是越小越好。

回归函数μ(x1,…,xp)是确定性的函数,一般不知道,只能通过经验公式S(x1,…,xp)来作为其估计函数,记为习惯上称为经验回归方程。

回归与拟合的区别:

回归和拟合是统计学中常用的两个概念,它们有一些相似之处,但也有一些不同之处。

回归是指通过分析数据的关系,建立一个模型来描述自变量和因变量之间的关系。回归分析的目标是预测因变量的值,并评估自变量对因变量的影响程度。回归可以用于解决预测和关联分析等问题。

拟合是指将一个数学模型与已有的数据拟合,以找到最能代表这些数据的模型参数。拟合的目标是通过调整模型的参数值,使得模型的预测值与实际观测值之间的误差最小化。拟合可以用于寻找最佳拟合曲线或曲面等。

总的来说,回归和拟合都是通过建立数学模型来描述数据的变化趋势和关系。回归更关注变量之间的关系和预测能力,而拟合更关注模型与数据之间的拟合程度。

 2、线性回归模型和多项式回归模型

【2.2】

为p元线性回归模型,其中是回归系数。

【2.3】

为p阶多项式回归。

由于【2.2】有较好的检验和误差分析,常常把【2.3】转化为【2.2】:就将p阶多项式回归转换为p元线性回归。

3、回归系数求解

 回归模型的系数采用最小二乘估计法,对Y,X1,…,Xp作了n次观测,得到系列观测值

 构造函数

 为了求(即求关于β0,β1,…,βp的最小值)

 称SST为总偏差平方和(即y1,y2,…,yn之间的误差)

称SSE为残差平方和(即预测值与真实值之间的误差)

称SSR为回归平方和(即回归自变量引起的误差)

为观测值对应的理论值。

在假设H0:不全为0,成立的情况下,可以推出且相互独立。

建模的目的,主要是用自变量x的变化来解释因变量y的变化,即希望SST值主要是SSR引起的,SSE很小,而由概率统计知识知道

【2.4】

给定显著水平α,查F分布临界值若由【2.4】算出来的F值满足F>Fα(p,n-p-1)就认为SSR远远大于SSE,即模型有效。

同时,由于

即在模型有效时,可以用SSE/(n-p-1)来作为σ2的无偏估计值。

显著水平:

在统计学中,显著水平(significance level)指的是在假设检验中作为判断标准的阈值。它用来评估统计检验结果是否足够显著,即对于给定的观察数据,是否可以拒绝原假设。

一般来说,显著水平通常以 α(alpha)表示,取值范围在0到1之间。常见的显著水平有0.05(或5%)和0.01(或1%)等。α的选择通常取决于具体情况和研究的要求。

在进行假设检验时,我们首先设定一个原假设(null hypothesis),通常表示没有效应或没有关系,然后根据观察数据计算统计量,并计算出相应的p值(p-value)。p值表示观察数据达到或超过统计量所示的极端情况的概率。

然后,我们将p值与预先设定的显著水平进行比较。如果p值小于或等于显著水平,通常就拒绝原假设,认为观察数据具有统计显著性。反之,如果p值大于显著水平,就无法拒绝原假设,没有足够的证据表明观察结果是显著的。

显著水平的选择需要权衡研究的目的、统计方法和实际需求。通常,较低的显著水平要求有更强的证据才能拒绝原假设,但也可能增加犯第一类错误(拒绝真实的原假设)。而较高的显著水平则减少了犯第一类错误的可能性,但也增加了犯第二类错误(接受错误的原假设)的风险。

4、回归显著性检验

(1)回归方程显著性检验问题:软件计算R2和F值

在回归方程的显著性检验中,R方(R-Squared)和F值(F-value)是常用的统计指标。

R方是衡量回归方程对观察数据的拟合程度的一个度量。它的取值范围在0到1之间,越接近1表示回归方程能够很好地解释观察数据的变异。R方可以解释因变量的变异中,由回归方程中的自变量解释的比例。然而,它并不能直接说明回归方程是否显著。

F值是用于检验回归方程的整体显著性的统计量。它基于回归方程中解释的变异与未解释的变异之间的比例。F值的计算涉及一系列步骤,其中包括计算均方差、残差平方和、回归平方和等。F值的计算结果会与自由度相关,并进行与显著水平的比较。

在实际应用中,许多统计软件(如R、Python中的statsmodels和scikit-learn、SPSS、Excel等)都可以计算回归方程的R方和F值。这些软件会自动给出关于回归方程显著性的统计结果和相应的p值。一般来说,如果F值的p值小于预先设定的显著水平(如0.05),则可以认为回归方程是显著的,即至少有一个自变量对因变量的解释能力是统计显著的。

需要注意的是,R方和F值虽然是回归分析的重要指标,但不应作为唯一的判断依据。在实际应用中,还应综合考虑其他指标、模型的实际意义以及研究的背景和目的。

(2)回归系数显著性检验问题:T检验

T检验是用于检验回归模型中回归系数的显著性的一种统计方法。它通过计算回归系数的估计值与其标准误之比得到T值,并与自由度相关的T分布进行比较来判断回归系数的显著性。

在回归模型中,每个自变量都有一个相应的回归系数,用于衡量该自变量对因变量的影响程度。T检验用于检验每个回归系数是否显著不等于零,即判断自变量是否对因变量的解释能力是统计显著的。

T检验中使用的统计量是T值,它的计算公式为回归系数的估计值与其标准误之比。T值的计算结果与自由度相关,并与T分布进行比较。一般而言,如果T值的绝对值较大,那么说明回归系数显著不等于零,即自变量对因变量的解释能力是统计显著的。

在实际应用中,许多统计软件(如R、Python中的statsmodels和scikit-learn、SPSS、Excel等)都可以计算回归系数的T值和相应的p值。p值是在零假设成立的情况下观察到的T值或更极端结果的概率。一般而言,如果回归系数的p值小于预先设定的显著水平(如0.05),则可以认为该回归系数是显著的。

需要注意的是,T检验只能检验单个系数的显著性,而不能判断多个系数之间的比较。此外,在进行T检验时,还应满足检验的前提条件,如误差项的正态性、方差齐性等。此外,通过T检验得出的显著性是基于样本数据的推断,仍需要根据具体研究的背景和目的判断其实际意义和重要性。

(3)回归方程“最优”问题:经验调整

在回归分析中,经验调整(empirical adjustment)是一种通过对回归方程进行调整以获得更好拟合和更准确的预测的方法。

回归方程的拟合程度可以由R方值(R-squared)来衡量,R方值越接近1表示模型对数据的解释能力越强。然而,仅仅使用R方值来选择最佳模型可能存在问题,因为一个复杂的模型可以通过增加自由度而提高拟合程度,但可能过度拟合了数据,导致在新数据上表现不佳。

经验调整的目标是在保持模型解释力的同时,尽量避免过度拟合。一种常见的经验调整方法是利用特定的准则来选择自变量的子集,例如AIC(赤池信息准则)或BIC(贝叶斯信息准则)等。这些准则考虑了模型的拟合程度和模型的复杂度,鼓励选择较简单的模型,以避免过度拟合。

另一个常用的经验调整方法是交叉验证(cross-validation)。交叉验证将数据集分为训练集和验证集,使用训练集来拟合模型,并使用验证集评估模型的预测性能。通过比较不同模型的平均误差或其他性能指标,可以选择具有较好预测性能的模型。

需要注意的是,经验调整不是一种唯一的方法,适用于所有情况。选择最佳的经验调整方法将取决于具体的数据特征、研究目标和背景知识。在进行经验调整时,应该根据问题的要求和假设仔细选择模型和调整方法,同时要避免过度调整或过度拟合的问题。

要注意的是,给定显著水平α,计算F值与临界值比较即可;计算R值,与临界值关于t检验也可以由系数的1-a置信区间估计来完成:若置信区间内包含0,则相应的系数显著为0,否则就不显著。(很多统计参考书,称R为可决系数,即可解释机会)

相关文章:

数学建模——统计回归模型

一、基本知识 1、基本统计量 总体&#xff1a;研究对象的某个感兴趣的指标。样本&#xff1a;从总体中随机抽取的独立个体X1,X2,…,Xn&#xff0c;一般称(X1,…,Xn)为一个样本&#xff0c;可以看成一个n维随机向量&#xff0c;它的每一取组值(x1,…,xn)称为样本的观测值。统计…...

C++【个人笔记1】

1.C的初识 1.1 简单入门 #include<iostream> using namespace std; int main() {cout << "hello world" << endl;return 0; } #include<iostream>; 预编译指令&#xff0c;引入头文件iostream.using namespace std; 使用标准命名空间cout …...

博通强迫三星签不平等长约,被韩处罚1亿元 | 百能云芯

近日&#xff0c;博通&#xff08;Broadcom&#xff09;这家国际知名的半导体公司因其市场主导地位的滥用&#xff0c;遭到了韩国公平贸易委员会&#xff08;FTC&#xff09;的严厉制裁&#xff0c;罚款高达191亿韩元&#xff0c;约合人民币1.04亿元。这一惩罚背后的故事揭示了…...

版本控制 Sourcetree

Sourcetree软件做版本控制&#xff0c;小程序的代码和springboot项目的代码放到同一个文件夹下&#xff0c; 无脑安装就行 命名就用项目名bkd表示springboot项目名 项目命名xcx表示小程序 每次上传代码&#xff0c;一定要先拉下代码不然代码冲突处理起来比较麻烦...

题目 1059: 二级C语言-等差数列

题目描述 sum2581114…&#xff0c;输入正整数n&#xff0c;求sum的前n项和。样例输入 2样例输出 7 根据题目我们得知&#xff0c;求一个等差数列的和。 等差数列的下一项前一项d。d是等差。 根据这个直接求每一项&#xff0c;再加进sum的和&#xff0c;最后输出即可。 在本题中…...

HarmonyOS 如何使用异步并发能力进行开发

一、并发概述 并发是指在同一时间段内&#xff0c;能够处理多个任务的能力。为了提升应用的响应速度与帧率&#xff0c;以及防止耗时任务对主线程的干扰&#xff0c;HarmonyOS 系统提供了异步并发和多线程并发两种处理策略。 ● 异步并发是指异步代码在执行到一定程度后会被暂…...

时间格式化时候HH和hh的区别

SimpleDateFormat simpleDateFormatnew SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); simpleDateFormat.format(new Date()) HH&#xff08;大写&#xff09;&#xff1a;表示使用24小时制&#xff08;也称为军用时间制&#xff09;来表示小时。它的范围是从00到23。例…...

aliyunoss上传图片

依赖 <dependency><groupId>com.aliyun.oss</groupId><artifactId>aliyun-sdk-oss</artifactId><version>3.8.1</version></dependency>配置文件 config:alioss:endpoint: oss-cn-shanghai.aliyuncs.com&#xff08;节点名 我…...

动手吧,vue数字动画

数字动画&#xff0c;有数字的地方都能用上&#xff0c;拿去吧&#xff01; 效果&#xff1a; 1、template部分 <template><div class"v-count-up">{{ dispVlaue }}</div> </template> 2、js部分 export default {data() {return {timer…...

Android12之仿Codec2.0实现传递编解码器组件本质(四十六)

简介: CSDN博客专家,专注Android/Linux系统,分享多mic语音方案、音视频、编解码等技术,与大家一起成长! 优质专栏:Audio工程师进阶系列【原创干货持续更新中……】🚀 人生格言: 人生从来没有捷径,只有行动才是治疗恐惧和懒惰的唯一良药. 更多原创,欢迎关注:Android…...

MongoDB【部署 04】Windows系统实现MongoDB多磁盘存储

Windows系统实现多磁盘存储 1.为什么2.多磁盘存储2.1 数据库配置2.2 文件夹磁盘映射2.3 创建新的数据集 3.总结 1.为什么 这里仅针对只有一台Windows系统服务器的情景&#xff1a; 当服务器存储不足时&#xff0c;或者要接入更多的数据&#xff0c;就会挂载新磁盘&#xff0c…...

ruoyi框架使用自定义用户表登录

背景 有的时候我们做框架升级或改造的时候&#xff0c;需要用到原来的部分表&#xff0c;比如只是用ruoyi的框架&#xff0c;然后登录的用户逻辑还是想用自己的表&#xff0c;那么接下来这边文章将介绍修改逻辑。 修改教程 1、SysLoginController.java 大家找到这个login方…...

计算机视觉与深度学习-卷积神经网络-卷积图像去噪边缘提取-卷积-[北邮鲁鹏]

目录标题 参考学习链接卷积的定义卷积的性质叠加性平移不变性交换律结合律分配律标量 边界填充边界填充方法 - 常数填充最常用常数填充零填充&#xff08;zero padding&#xff09;拉伸镜像 卷积示例单位脉冲核无变化平移平滑锐化 卷积核平均卷积核高斯卷积核高斯卷积核定义高斯…...

JS手动实现发布者-订阅者模式

发布-订阅模式是一种对象间一对多的依赖关系&#xff0c;当一个对象的状态发送改变时&#xff0c;所有依赖于它的对象都将得到状态改变的通知。具体过程是&#xff1a;订阅者把自己想订阅的事件注册到调度中心&#xff0c;当发布者更新该事件时通知调度中心&#xff0c;由调度中…...

【含面试题】MySQL死锁日志分析与解决的Java代码实现

AI绘画关于SD,MJ,GPT,SDXL百科全书 面试题分享点我直达 2023Python面试题 2023最新面试合集链接 2023大厂面试题PDF 面试题PDF版本 java、python面试题 项目实战:AI文本 OCR识别最佳实践 AI Gamma一键生成PPT工具直达链接 玩转cloud Studio 在线编码神器 玩转 GPU AI…...

解决方案:TSINGSEE青犀+智能分析网关助力智慧仓储智能化监管

为全面保障物流仓储的安全性与完整性&#xff0c;解决仓库管理难题&#xff0c;优化物流仓储方式&#xff0c;提升仓储效率&#xff0c;降低人工成本&#xff0c;旭帆科技推出智慧仓储AI视频智能分析方案&#xff0c;利用物联网、大数据、云计算等技术&#xff0c;对仓储管理进…...

进程间通信

#include <unistd.h> int pipe(int pipefd[2]); 功能&#xff1a;创建一个匿名管道&#xff0c;用于进程间通信 参数&#xff1a; -int pipefd[2]:传出参数 pipefd[0]对应的是管道的读端 pipefd[0]对应的是管道的写端 返回值&#xff1a; 成功返回0&#xff0c;失败返回-…...

Ubuntu 22.04.3 LTS安装

最近换电脑了&#xff0c;准备重新装一下ubuntu。多年前装过ubuntu很老的版本&#xff0c;现在发现官网最新的LTS版本是 Ubuntu 22.04.3 LTS 版本。那重新装的话&#xff0c;肯定装最新的版本了。这里我记录下自己的安装过程&#xff0c;作为以后的笔记查看。 我的环境&#x…...

记一次manjaro-i3系统sogoupinying候选词无法正常显示中文(变方框了)问题解决方案

记一次manjaro-i3系统sogoupinying候选词无法正常显示中文&#xff08;变方框了&#xff09;问题解决方案 前言解决方案 前言 今天早上发现公司电脑显卡驱动好像坏了&#xff0c;各种折腾完了干脆把系统搞黑屏无法开机了&#xff0c;时间有限懒再修了&#xff0c;于是重装了系…...

Lua学习笔记:词法分析

前言 本篇在讲什么 Lua的词法分析 本篇需要什么 对Lua语法有简单认知 对C语法有简单认知 依赖Visual Studio工具 本篇的特色 具有全流程的图文教学 重实践&#xff0c;轻理论&#xff0c;快速上手 提供全流程的源码内容 ★提高阅读体验★ &#x1f449; ♠ 一级标题…...

flask服务鉴权

基本认证&#xff08;Basic Authentication&#xff09;&#xff1a; 这是一种简单的鉴权方式&#xff0c;需要客户端发送用户名和密码&#xff0c;服务器验证后允许或拒绝访问。可以使用 Flask-BasicAuth 扩展来实现。首先&#xff0c;安装扩展&#xff1a; pip install Fla…...

【2023华为杯B题】DFT类矩阵的整数分解逼近(思路及代码下载)

&#x1f4a5;&#x1f4a5;&#x1f49e;&#x1f49e;欢迎来到本博客❤️❤️&#x1f4a5;&#x1f4a5; &#x1f3c6;博主优势&#xff1a;&#x1f31e;&#x1f31e;&#x1f31e;博客内容尽量做到思维缜密&#xff0c;逻辑清晰&#xff0c;为了方便读者。 ⛳️座右铭&a…...

基于微信小程序的校园生活管理系统设计与实现(源码+lw+部署文档+讲解等)

文章目录 前言运行环境学生微信端的主要功能有&#xff1a;管理员的主要功能有&#xff1a;具体实现截图视频演示为什么选择我自己的网站自己的小程序&#xff08;小蔡coding&#xff09;有保障的售后福利 代码参考源码获取 前言 &#x1f497;博主介绍&#xff1a;✌全网粉丝1…...

SQL server 创建存储过程

SQL Server如何创建存储过程 存储过程&#xff1a; 可以理解为完成特定功能的一组 SQL 语句集&#xff0c;存储在数据库中&#xff0c;经过第一次编译&#xff0c;之后的运行不需要再次编译&#xff0c;用户通过指定存储过程的名字并给出参数&#xff08;如果该存储过程带有参数…...

一文了解亚马逊云科技适用于 Amazon Lightsail 的托管数据库

Amazon Lightsail 是亚马逊云科技提供的一种易上手使用、月度价格经济实惠&#xff0c;并包括了计算实例、容器、存储、数据库的虚拟专用服务器。在创建时可以进行业务蓝图选择&#xff0c;可选择包含多种操作系统&#xff08;Linux/Windows 等&#xff09;或操作系统加上典型应…...

【antd Col】奇怪的TypeError: Cannot read properties of undefined (reading ‘then‘)

现象 修改antd的Col组件的layouts属性为span后&#xff0c;并通过监听resize事件对span列宽进行动态变化时&#xff0c;报错TypeError: Cannot read properties of undefined (reading ‘then‘)。 补充示例一 由于我使用了飞冰ice.js&#xff0c;且在以下过程中写了如下语句…...

requests处理 multipart/form-data 请求以及 boundary值问题

requests处理 multipart/form-data 请求以及 boundary值问题 前言1. 请求需要携带本地资源2. 请求需要携带json3. 总结 前言 关于 Content-type: multipart/form-data可以看一下这篇文章, 分析特别详细 HTTP协议之multipart/form-data请求分析 put和post区别不大, 只是上传资…...

FBX文件结构解读【文本格式】

FBX 格式几乎受到所有 3D 引擎的支持&#xff0c;是 Autodesk 开发的 3D 模型的专有格式。它支持顶点、索引、法线、UV坐标、材质和动画。 FBX还支持许多其他类型的信息&#xff0c;但它们对游戏引擎几乎没有用处。 推荐&#xff1a;用 NSDT编辑器 快速搭建可编程3D场景 有两种…...

JS基础语法

JS是一门面向对象的编程语言&#xff0c;运行在客户端的脚本语言&#xff0c;可以基于Node.js进行服务器端编程 JS的作用: 表单动态校验网页特效服务端开发 浏览器执行JS&#xff1a; 浏览器分为两部分&#xff1a;渲染引擎和JS引擎 渲染引擎用来解析HTML和CSS&#xff0c;…...

【Zabbix监控一】zabbix的原理与安装

利用一个优秀的监控软件&#xff0c;我们可以: ●通过一个友好的界面进行浏览整个网站所有的服务器状态 ●可以在 Web 前端方便的查看监控数据 ●可以回溯寻找事故发生时系统的问题和报警情况 总结&#xff1a;zabbix主要功能 监控&#xff0c;cpu负载&#xff0c;内存使用&a…...

加强政府网站建设建议/做网站优化哪家公司好

在了解了TensorflowJS的一些基本模型的后&#xff0c;大家会问&#xff0c;这究竟有什么用呢&#xff1f;我们就用深度学习中被广泛使用的MINST数据集来进行一下手写识别的操作。MINST数据集MINST是一组0到9的手写数字。就像这个&#xff1a;这组数据出现在各种深度学习的入门和…...

网站开发用什么架构/天天外链官网

来自公众号&#xff1a;孤独烟引言大家应该知道烟哥最近要(tiao 咳咳咳)&#xff0c;嗯&#xff0c;不可描述&#xff01;随手讲其中一部分知识&#xff0c;都是一些烟哥自己平时工作的总结以及经验。大家看完&#xff0c;其实能避开很多坑。而且很多问题&#xff0c;都是面试中…...

做视频链接哪个网站好/刷推广链接的网站

TheBrain&#xff0c;您的终极数字记忆和无限思维导图软件。我们从一个想法跳到另一个想法&#xff0c;构建越来越复杂的网络&#xff0c;直到新想法形成。TheBrain允许你以同样的方式组织你的信息&#xff0c;而不限制你预先确定的文件结构。事实上&#xff0c;你的数字大脑是…...

马云为什么做网站/文明seo

Enumable类型是linq to object 是一个很特殊的类型 这个类型的数据源都是在程序的内存中 Queryable类型是 Linq to sql 对数据库进行操作都是这个类型 这个类型会生成表达式目录树 方法体只能有一行代码 Expression 表达式目录树 ///外链接 需要用join into …...

珠海网站建设公司/做微商如何引流推广怎么找客源

在购物车页面单击“结算”链接,可生成订单,结算页面提交订单前,需最后确认该订单的商品、数量、金额以及用户资料,用户单击“提交订单”后,页面切换到订单成功信息界面。 1、制作结算页 CheckOut.aspx ,完成页面布局和基本设计。 结算页主要分成两大部分区域,一部分为提…...

哪个视频网站做直播销售/泉州关键词排名工具

2019独角兽企业重金招聘Python工程师标准>>> 访问权限修饰符&#xff1a;说明类中成员的访问权限 类中的成员按访问权限分为public&#xff08;公有&#xff09;、protected&#xff08;保护&#xff09;、priavte&#xff08;私有&#xff09;。 公有成员可以被该类…...