当前位置: 首页 > news >正文

插值、拟合和回归分析的相关知识

目录

0 序言

1 分段线性插值

2 多项式插值

3 样条插值

4 最小二乘拟合

5 多元线性回归


0 序言

在生产实践和科学研究中,常常有这些问题:

  1. 插值问题:由实验或测量得到变量间的一批离散样点,要求得到变量之间的函数关系或得到样点之外的数据值。给定一组离散的数据点(x_{i},y_{i}),其中i=1,2,...,n,目标是找到一个函数f(x_{i})=y_{i},使得该函数在给定的数据点处的函数值,并且可以用这个函数来估计在数据点之间的x值对应的y值。
  2. 拟合问题:指找到一条曲线(通常是某种函数形式)f(x_{i})=y_{i}+\xi _{i}来近似地表示一组数据点的分布规律。与插值不同的是,拟合并不要求曲线一定通过所有的数据点,而是要在整体上能够最好地描述数据的趋势。且\sum_{i=1}^{n}\xi _{i}^{2}最小。
  3. 回归分析:要关注一个因变量(通常用y表示)和一个或多个自变量(通常用x_{1},x_{2},...,x_{p}表示)之间的关系,并且建立一个数学模型来描述这种关系,同时还可以对模型的参数进行估计和检验。

拟合和回归分析都关注数据的整体趋势和模型构建,拟合更侧重于曲线的近似,回归分析更强调变量之间关系的统计推断。插值主要关注数据点之间的函数值估计,在一定程度上也可以看作是一种特殊的数据拟合方式(要求通过所有已知数据点)。

1 分段线性插值

这是最通俗的一种插值方法,直观上就是将各数据点用折线连接起来。如果

a=x_{0}<x_{1}<...<x_{n}=b

那么,分段线性插值公式为

\varphi (x)=\frac{x-x_{i}}{x_{i-1}-x_{i}}y_{i-1}+\frac{x-x_{i-1}}{x_{i}-x_{i-1}}y_{i},\; \; x_{i-1}<x\leq x_{i},\; \; i=0,1,...,n

(由\varphi (x)=y_{i-1}+\frac{y_{i}-y_{i-1}}{x_{i}-x_{i-1}}(x-x_{i-1})整理而来,其中k_{i-1}=\frac{y_{i}-y_{i-1}}{x_{i}-x_{i-1}}为斜率)

可以证明,当分点足够多,分段线性插值是收敛的。其缺点是不能形成一条光滑曲线。

例1:求解标准正态分布\Phi (2.3456789)

:由标准正态分布函数值表可以得到\Phi (2.34)=0.99036,\; \; \Phi (2.35)=0.99061采用分段线性插值计算\Phi (2.3456789),取区间[x_{i-1},x_{i}]=[2.34,2.35],插值函数f(x)=\Phi (x),则

y_{i-1}=\Phi (x_{i-1})=\Phi (2.34)=0.99036\\\; \; y_{i}=\Phi (x_{i})=\Phi (2.35)=0.99061

利用分段线性插值式可得

\Phi (2.3456789)\approx \varphi (2.3456789)\\=0.99036\times \frac{2.3456789-2.35}{2.34-2.35}+0.99061\times \frac{2.3456789-2.34}{2.35-2.34}=0.99050

2 多项式插值

多项式插值是指用一个多项式函数来通过给定的一组数据点。给定n+1个不同的数据点(x_{0},y_{0}),(x_{1},y_{1}),...,(x_{n},y_{n})要找一个次数不超过n的多项式

P_{n}(x)=a_{0}+a_{1}x+a_{2}x^{2}+...+a_{n}x^{n}使得P_{n}(x_{i})=y_{i},i=0,1,2,...,n

若要求得函数表达式,可直接解方程组。若只要求得函数在插值点处数值,可利用Lagrange插值公式

P_{n}(x)=\sum_{i=0}^{n}y_{i}\left ( \prod_{j\neq i,j=1}^{n} \frac{x-x_{j}}{x_{i}-x_{j}}\right )

多项式插值光滑但不具有收敛性,一般不宜采用高次多项式插值。

3 样条插值

样条本来是绘图员用于数据放样的工具。在画曲线时要求经过一些设定值且使整曲线都很光滑。以后逐渐发展成为一个应用极为广泛的数学分支。现在数学上所说的样条,实质上指分段多项式的光滑连接。

设有区间[a,b]的一个划分a=x_{0}<x_{1}<...<x_{n}=b,称分段函数S(x)为k次样条函数,若它满足:

  1. S(x)在每个小区间上是次数不超过k次的多项式;
  2. S(x)在[a,b]上具有k-1阶连续导数。

用样条函数作出的插值称为样条插值。工程上广泛采用三次样条插值。

n段三次多项式共有4n个参数,光滑性条件含3(n-1)个约束,插值条件含(n+1)个约束,从而三次样条插值结果不唯一。另外需要2个定解条件。通常有下列4类条件。

非扭结:第一、二端多项式三次项系数相同,最后一段和倒数第二段三次项系数相同。

一阶导数:S'(x_{0})=y'_{0},S'(x_{n})=y'_{n}

二阶导数:S''(x_{0})=y''_{0},S''(x_{n})=y''_{n},特别地,当y''_{0}=y''_{n}=0时,称为自然样条。

周期样条:S'(x_{0})=S'(x_{n}),S''(x_{0})=S''(x_{n})(前提条件S(x_{0})=S(x_{n}))当被插值函数为周期函数或封闭曲线,宜适用周期样条。

4 最小二乘拟合

假设已知经验公式y=f(c,x)(这里c和x均可为向量),要求根据一批有误差的数据(x_{i},y_{i}),i=0,1,...,n,确定参数c。这样的问题称为曲线拟合,其基本原理是最小二乘法,即求c使得均方误差

Q_{c}=\sqrt{\sum_{i=0}^{n}(y_{i}-f(c,x_{i}))^{2}}

达到最小。当f关于c是线性函数(例如,f(c,x)是x的多项式函数,c为系数),问题转化为一个线性方程组求解,且其解存在唯一。如果f关于c是非线性函数,问题等价于个非线性函数极值问题。

5 多元线性回归

设有多元线性回归模型

y=b_{1}x_{1}+b_{2}x_{2}+...+b_{p}x_{p}+\varepsilon

其中\varepsilon \sim N(0,\sigma ^{2})。令\beta =(b_{1},b_{2},...,b_{p})^{T},x=(x_{0},x_{1},...,x_{p}),表示为

y=x\beta +\varepsilon

现获得y和x_{0},x_{1},...,x_{p}的n组观测值(当回归模型中考虑常数项,等价于x_{1}取常数1),要求\beta的估计值。设Y和X分别为相应n组观测值的n\times 1n\times p矩阵,即

Y=(y)_{n\times 1},X=(x_{ij})_{n\times p}

\beta的估计值为

\beta =(X^{T}Y)^{-1}Y

对于任意的y 和x_{0},x_{1},...,x_{p}的n组观测值,由\beta =(X^{T}Y)^{-1}Y均可得到回归系数β的估计值,要判断这一模型的有效性,还要通过对于残差r=Y-X\hat{\beta }的分析以检验

H_{0}:\beta =0,H_{1}:\beta \neq 0

例2:测得平板表面3*5网格点处的温度如表1所列,试作出平板表面的温度分布曲面z=f(x,y)的图形。

8281808284
7963616581
8484828586

解:(1)先在三维坐标系画出原始数据

%先在三维坐标系画出原始数据
x=1:5;
y=1:3;
temps=[82 81 80 82 84;79 63 61 65 81;84 84 82 85 86];
mesh(x,y,temps)

画出粗糙的平板温度分布曲面图

(2)在x、y方向上每隔0.2个单位的地方进行插值以平滑数据

%先在三维坐标系画出原始数据
x=1:5;
y=1:3;
temps=[82 81 80 82 84;79 63 61 65 81;84 84 82 85 86];
cx=1:0.2:5;
cy=1:0.2:3;
cz=interp2(x,y,temps,cx',cy,'cubic');
mesh(cx,cy,cz)

画出插值后的平板温度分布曲面


注:本篇内容均为对《MATLAB建模与仿真》(周品 赵新芬 编著,国防工业出版社)摘录与个人归纳总结,如需要更加详细了解,可阅读原书“第9章 数据建模”部分。

相关文章:

插值、拟合和回归分析的相关知识

目录 0 序言 1 分段线性插值 2 多项式插值 3 样条插值 4 最小二乘拟合 5 多元线性回归 0 序言 在生产实践和科学研究中&#xff0c;常常有这些问题: 插值问题&#xff1a;由实验或测量得到变量间的一批离散样点&#xff0c;要求得到变量之间的函数关系或得到样点之外的…...

【小白学机器学习42】进行多次抽样,样本的分布参数和总体的分布参数的关系

目录 1 进行多次抽样&#xff0c;样本的分布参数和总体的分布参数的关系 2 样本容量越大&#xff0c;多次抽样的样本的分布参数和总体的分布参数的关系 3 随着样本容量增大&#xff0c;多次抽样均值的 平均值&#xff0c;方差的变化 4 随着样本容量增大&#xff0c;多次抽…...

链动星海 质引未来|中信银行加码科技金融 “接力式”服务助力“新质生产力”释放

11月26日&#xff0c;第二届中国国际供应链促进博览会&#xff08;以下简称链博会&#xff09;在北京中国国际展览中心开幕。中信集团以“链动星海 质引未来”为主题&#xff0c;亮相先进制造链展区。此次布展由中信金控主办、中信银行承办&#xff0c;携手中信证券、中信建投证…...

黑马2024AI+JavaWeb开发入门Day02-JS-VUE飞书作业

视频地址&#xff1a;哔哩哔哩 讲义作业飞书地址&#xff1a;飞书 一、作业1 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta http-equiv"X-UA-Compatible" content"IEedge">&l…...

云计算基础-期末复习

第一章&#xff1a;云计算概论 一、云计算的定义与特征 1. 定义&#xff1a; 云计算是一种通过网络以按需、可扩展的方式获取计算资源和服务的模式。它将计算资源视为一种公用事业&#xff0c;用户可以根据需求动态获取和释放资源&#xff0c;而无需了解底层基础设施的细节。…...

Java GET请求 请求参数在Body中使用Json格式传参

业务需要调个三方接口 使用GET请求方式 但是&#xff01;请求参数不在Query中&#xff0c;竟然在Body中&#xff0c;使用Json格式传参 在API调试工具里面可以调通 在java代码里&#xff0c;死活调不通 网上搜了搜&#xff0c;找到一个靠谱的&#xff0c;记录一下 import o…...

AI数据分析工具(一)

Looker Studio&#xff08;谷歌&#xff09;-免费 优点 免费使用&#xff1a;对于中小型企业和个人用户来说&#xff0c;没有任何费用压力&#xff0c;可以免费享受到数据可视化和报表创建的功能。与Google服务集成&#xff1a;特别适合使用Google产品生态的企业&#xff0c;…...

go结构体匿名“继承“方法冲突时继承优先顺序

在 Go 语言中&#xff0c;匿名字段&#xff08;也称为嵌入字段&#xff09;可以用来实现继承的效果。当你在一个结构体中匿名嵌入另一个结构体时&#xff0c;嵌入结构体的方法会被提升到外部结构体中。这意味着你可以直接通过外部结构体调用嵌入结构体的方法。 如果多个嵌入结…...

【049】基于51单片机语音录放【Proteus仿真+Keil程序+报告+原理图】

☆、设计硬件组成&#xff1a;51单片机最小系统ISD4004语音芯片LM386音频放大器喇叭LCD1602液晶显示按键控制LED灯。 1、本设计采用STC89C51/52、AT89C51/52、AT89S51/52作为主控芯片&#xff0c;LCD1602液晶显示屏实时显示&#xff1b; 2、系统具有两种模式&#xff1a;录音…...

《软件项目管理》期末-复习题及参考答案

&#xff08;1&#xff09;赶工一个任务时&#xff0c;你应该关注&#xff08; C &#xff09; A. 尽可能多的任务 B. 非关键任务 C. 加速执行关键路径上的任务 D. 通过成本最低化加速执行任务 &#xff08;2&#xff09;下列哪个不是项目管理计划的一部分&#xff1f;&#x…...

milvus 通俗易懂原理

向量值如何生成的 Milvus 是一个开源的向量数据库&#xff0c;专门用于处理高维向量的存储、搜索和分析。向量值本身通常来自于某些机器学习或深度学习模型的输出&#xff0c;尤其是在自然语言处理&#xff08;NLP&#xff09;、计算机视觉&#xff08;CV&#xff09;、推荐系…...

什么是撞库、拖库和洗库?

“撞库”是黑客通过收集互联网已泄露的用户和密码信息&#xff0c;生成对应的字典表&#xff0c;尝试批量登陆其他网站后&#xff0c;得到一系列可以登录的用户。 很多用户在不同网站使用的是相同的帐号密码&#xff0c;因此黑客可以通过获取用户在A网站的账户从而尝试登录B网…...

安卓-碎片的使用入门

1.碎片(Fragment)是什么 Fragment是依赖于Activity的&#xff0c;不能独立存在的,是Activity界面中的一部分&#xff0c;可理解为模块化的Activity,它能让程序更加合理和充分地利用大屏幕的空间&#xff0c;因而在平板上应用得非常广泛. Fragment不能独立存在&#xff0c;必须…...

华为IPD流程学习之——深入解读123页华为IPD流程体系设计方法论PPT

该方案全面介绍了华为IPD流程体系设计方法论&#xff0c;包括流程体系建设的背景、理念、架构、核心特征、构建模型、与组织和战略的关系、运营机制、数字化转型以及流程管理组织等内容&#xff0c;旨在为企业提供一套系统的流程体系建设指导&#xff0c;以提升运营效率、质量和…...

DriveMLLM:一个专为自动驾驶空间理解任务设计的大规模基准数据集

2024-11-20&#xff0c; 由武汉大学、中国科学院自动化研究所、悉尼科技大学、牛津大学等合创建了DriveMLLM数据集&#xff0c;该数据集是自动驾驶领域首个专为评估多模态大型语言模型&#xff08;MLLMs&#xff09;空间理解能力而设计的基准&#xff0c;对于推动自动驾驶技术的…...

高效处理 iOS 应用中的大规模礼物数据:以直播项目为例(1-礼物池)

引言 在现代iOS应用开发中&#xff0c;处理大规模数据是一个常见的挑战。尤其实在直播项目中&#xff0c;礼物面板作为展示用户互动的重要部分&#xff0c;通常需要实时显示海量的礼物数据。这些数据不仅涉及到不同的区域、主播的动态差异&#xff0c;还需要保证高效的加载与渲…...

python的函数与递归

需求&#xff1a; 编写一个函数&#xff0c;计算斐波那契数列的第 N 项&#xff0c;并使用递归实现。 为了计算斐波那契数列的第 N 项&#xff0c;可以使用递归方法。斐波那契数列的定义是&#xff1a; F(0) 0 F(1) 1 对于 n > 2&#xff0c;F(n) F(n-1) F(n-2)&#xf…...

RabbitMQ学习-Seven

再SpringBoot中使用MQ 1.创建SpringBoot项目 除了我们平常使用的一些工具依赖&#xff0c;还需要选择这个Spring for RabbitMQ依赖 2.需要在application.yml文件中进行配置 server:port :9090 spring:application:name:producerrabbitmq:host: 你的主机名port: 5672virtual-…...

中科亿海微SoM模组——波控处理软硬一体解决方案

本文介绍的波控处理软硬一体解决方案主要是面向相控阵天线控制领域&#xff0c;波控处理通过控制不同天线组件的幅相来调整天线波束的方向和增益&#xff0c;实现高精度角度控制和高增益。本方案由波控处理板、波控处理控制软件算法和上位机软件共同构成。波控处理SoM模组原型样…...

开源法律、政策和实践

#一切皆可开源# 木兰社区对《Open Source Law,Policy and Practice 》这本书的第二版进行了翻译&#xff0c;并发布在了gitee上。这本书是对开源文化、开源政策、法律的全面介绍。目录如下&#xff1a; 1 Open Source as Philosophy,Methodology,and CommerceUsing Law with …...

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…...

Docker 运行 Kafka 带 SASL 认证教程

Docker 运行 Kafka 带 SASL 认证教程 Docker 运行 Kafka 带 SASL 认证教程一、说明二、环境准备三、编写 Docker Compose 和 jaas文件docker-compose.yml代码说明&#xff1a;server_jaas.conf 四、启动服务五、验证服务六、连接kafka服务七、总结 Docker 运行 Kafka 带 SASL 认…...

(二)原型模式

原型的功能是将一个已经存在的对象作为源目标,其余对象都是通过这个源目标创建。发挥复制的作用就是原型模式的核心思想。 一、源型模式的定义 原型模式是指第二次创建对象可以通过复制已经存在的原型对象来实现,忽略对象创建过程中的其它细节。 📌 核心特点: 避免重复初…...

Mobile ALOHA全身模仿学习

一、题目 Mobile ALOHA&#xff1a;通过低成本全身远程操作学习双手移动操作 传统模仿学习&#xff08;Imitation Learning&#xff09;缺点&#xff1a;聚焦与桌面操作&#xff0c;缺乏通用任务所需的移动性和灵活性 本论文优点&#xff1a;&#xff08;1&#xff09;在ALOHA…...

Linux nano命令的基本使用

参考资料 GNU nanoを使いこなすnano基础 目录 一. 简介二. 文件打开2.1 普通方式打开文件2.2 只读方式打开文件 三. 文件查看3.1 打开文件时&#xff0c;显示行号3.2 翻页查看 四. 文件编辑4.1 Ctrl K 复制 和 Ctrl U 粘贴4.2 Alt/Esc U 撤回 五. 文件保存与退出5.1 Ctrl …...

前端中slice和splic的区别

1. slice slice 用于从数组中提取一部分元素&#xff0c;返回一个新的数组。 特点&#xff1a; 不修改原数组&#xff1a;slice 不会改变原数组&#xff0c;而是返回一个新的数组。提取数组的部分&#xff1a;slice 会根据指定的开始索引和结束索引提取数组的一部分。不包含…...

Oracle11g安装包

Oracle 11g安装包 适用于windows系统&#xff0c;64位 下载路径 oracle 11g 安装包...

MFE(微前端) Module Federation:Webpack.config.js文件中每个属性的含义解释

以Module Federation 插件详为例&#xff0c;Webpack.config.js它可能的配置和含义如下&#xff1a; 前言 Module Federation 的Webpack.config.js核心配置包括&#xff1a; name filename&#xff08;定义应用标识&#xff09; remotes&#xff08;引用远程模块&#xff0…...

C++实现分布式网络通信框架RPC(2)——rpc发布端

有了上篇文章的项目的基本知识的了解&#xff0c;现在我们就开始构建项目。 目录 一、构建工程目录 二、本地服务发布成RPC服务 2.1理解RPC发布 2.2实现 三、Mprpc框架的基础类设计 3.1框架的初始化类 MprpcApplication 代码实现 3.2读取配置文件类 MprpcConfig 代码实现…...

Java详解LeetCode 热题 100(26):LeetCode 142. 环形链表 II(Linked List Cycle II)详解

文章目录 1. 题目描述1.1 链表节点定义 2. 理解题目2.1 问题可视化2.2 核心挑战 3. 解法一&#xff1a;HashSet 标记访问法3.1 算法思路3.2 Java代码实现3.3 详细执行过程演示3.4 执行结果示例3.5 复杂度分析3.6 优缺点分析 4. 解法二&#xff1a;Floyd 快慢指针法&#xff08;…...