当前位置：首页 > news >正文

【小白学机器学习42】进行多次抽样，样本的分布参数和总体的分布参数的关系

news 2026/2/8 13:31:48

1 进行多次抽样，样本的分布参数和总体的分布参数的关系

2 样本容量越大，多次抽样的样本的分布参数和总体的分布参数的关系

3 随着样本容量增大，多次抽样均值的平均值，方差的变化

4 随着样本容量增大，多次抽样方差的平均值，方差的变化

进行多次抽样，样本的分布参数和总体的分布参数的关系

1 进行多次抽样，样本的分布参数和总体的分布参数的关系

每次抽样都会得到1个均值，1个方差
多次抽样会得到多个均值，多个方差
可以把多次抽样得到的均值，方差再进行平均，看下多次抽样的平均值和总体参数的关系

多次抽样会得到多个均值→也就是均值数组，这个均值数组的平均值，接近总体的均值
多次抽样会得到多个方差→也就是方差数组，这个方差数组的平均值，会远小于总体的均值，这就是样本方差对总体方差的有偏估计。
std的情况类方差。

import numpy as np
import pandas as pd
import scipy as sp
from matplotlib import pyplot as plt
import seaborn as sns
%precision 3population1=sp.stats.norm(loc=4,scale=0.8)  #不设置size，可以认为是一个无限的总体？
samples_mean_array1=np.zeros(1000)
np.random.seed(1)
for i in range(0,1000):sample1=population1.rvs(size=10)samples_mean_array1[i]=np.mean(sample1)#print(samples_mean_array1)
sns.distplot(samples_mean_array1)
#sns.histplot(samples_mean_array1)
#sns.kdeplot(samples_mean_array1, fill=True)
plt.show()print(f"设置的总体的均值 =4")
print(f"设置的总体的方差 ={0.8*0.8}")
print(f"设置的总体的标准差 =0.8")
print()print(f"多次抽样的样本均值的均值 = {np.mean(samples_mean_array1)}")
print(f"多次抽样的样本方差的均值 = {np.var(samples_mean_array1)}")
print(f"多次抽样的样本标准差的均值 = {np.std(samples_mean_array1)}")
print()print("多次抽样的样本的均值的均值，接近总体的均值")      
print("多次抽样的样本的方差的均值，远远小于总体的方差")   
print("多次抽样的样本的标准差的均值，远远小于总体的标准差")       
print()

2 样本容量越大，多次抽样的样本的分布参数和总体的分布参数的关系

首先，还是基于，多次抽样
因为单次抽样的随机性比较大
样本容量越大，多次抽样的样本的分布参数和总体的分布参数的关系会发现

样本容量越大，多次抽样的样本的平均值的均值，会收敛，越来越接近总体的平均值
样本容量越大，多次抽样的样本的方差的均值，会收敛，越来越接近总体的方差

hist图就像把plot给旋转竖过来了+ 下沉相同的归类后统计成次数！！

hist图就像把plot给旋转竖过来了+ 下沉相同的归类后统计成次数！！

hist图就像把plot给旋转竖过来了+ 下沉相同的归类后统计成次数！！

随着抽样次数的变化

每次都增加抽样样本的容量

可以发现

写到一半，代码居然崩了，丢失了。。。。

3 随着样本容量增大，多次抽样均值的平均值，方差的变化

多次抽样的样本均值的均值趋向总体的均值
多次抽样的样本均值的方差很小，说明很稳定

4 随着样本容量增大，多次抽样方差的平均值，方差的变化

多次抽样的样本方差的均值，应该还是小于总体的方差，因为是有偏估计
多次抽样的样本方差的方差很大？不稳定？

【小白学机器学习42】进行多次抽样，样本的分布参数和总体的分布参数的关系

目录 1 进行多次抽样，样本的分布参数和总体的分布参数的关系 2 样本容量越大，多次抽样的样本的分布参数和总体的分布参数的关系 3 随着样本容量增大，多次抽样均值的平均值，方差的变化 4 随着样本容量增大，多次抽…...

编程日记 2024/11/30 6:04:36

链动星海质引未来|中信银行加码科技金融 “接力式”服务助力“新质生产力”释放

11月26日，第二届中国国际供应链促进博览会（以下简称链博会）在北京中国国际展览中心开幕。中信集团以“链动星海质引未来”为主题，亮相先进制造链展区。此次布展由中信金控主办、中信银行承办，携手中信证券、中信建投证…...

编程日记 2024/11/30 5:59:29

黑马2024AI+JavaWeb开发入门Day02-JS-VUE飞书作业

视频地址：哔哩哔哩讲义作业飞书地址：飞书一、作业1 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta http-equiv"X-UA-Compatible" content"IEedge">&l…...

编程日记 2024/11/30 5:55:25

云计算基础-期末复习

第一章：云计算概论一、云计算的定义与特征 1. 定义： 云计算是一种通过网络以按需、可扩展的方式获取计算资源和服务的模式。它将计算资源视为一种公用事业，用户可以根据需求动态获取和释放资源，而无需了解底层基础设施的细节。…...

编程日记 2024/11/30 5:54:24

Java GET请求请求参数在Body中使用Json格式传参

业务需要调个三方接口使用GET请求方式但是！请求参数不在Query中，竟然在Body中，使用Json格式传参在API调试工具里面可以调通在java代码里，死活调不通网上搜了搜，找到一个靠谱的，记录一下 import o…...

编程日记 2024/11/30 5:53:23

AI数据分析工具（一）

Looker Studio（谷歌）-免费优点免费使用：对于中小型企业和个人用户来说，没有任何费用压力，可以免费享受到数据可视化和报表创建的功能。与Google服务集成：特别适合使用Google产品生态的企业，…...

编程日记 2024/11/30 5:51:21

go结构体匿名“继承“方法冲突时继承优先顺序

在 Go 语言中，匿名字段（也称为嵌入字段）可以用来实现继承的效果。当你在一个结构体中匿名嵌入另一个结构体时，嵌入结构体的方法会被提升到外部结构体中。这意味着你可以直接通过外部结构体调用嵌入结构体的方法。如果多个嵌入结…...

编程日记 2024/11/30 5:50:18

【049】基于51单片机语音录放【Proteus仿真+Keil程序+报告+原理图】

☆、设计硬件组成：51单片机最小系统ISD4004语音芯片LM386音频放大器喇叭LCD1602液晶显示按键控制LED灯。 1、本设计采用STC89C51/52、AT89C51/52、AT89S51/52作为主控芯片，LCD1602液晶显示屏实时显示； 2、系统具有两种模式：录音…...

编程日记 2024/11/30 5:48:15

《软件项目管理》期末-复习题及参考答案

（1）赶工一个任务时，你应该关注（ C ） A. 尽可能多的任务 B. 非关键任务 C. 加速执行关键路径上的任务 D. 通过成本最低化加速执行任务 （2）下列哪个不是项目管理计划的一部分？&#x…...

编程日记 2024/11/30 5:47:15

milvus 通俗易懂原理

向量值如何生成的 Milvus 是一个开源的向量数据库，专门用于处理高维向量的存储、搜索和分析。向量值本身通常来自于某些机器学习或深度学习模型的输出，尤其是在自然语言处理（NLP）、计算机视觉（CV）、推荐系…...

编程日记 2024/11/30 5:46:13

什么是撞库、拖库和洗库？

“撞库”是黑客通过收集互联网已泄露的用户和密码信息，生成对应的字典表，尝试批量登陆其他网站后，得到一系列可以登录的用户。很多用户在不同网站使用的是相同的帐号密码，因此黑客可以通过获取用户在A网站的账户从而尝试登录B网…...

编程日记 2024/11/30 5:45:12

安卓-碎片的使用入门

1.碎片(Fragment)是什么 Fragment是依赖于Activity的，不能独立存在的,是Activity界面中的一部分，可理解为模块化的Activity,它能让程序更加合理和充分地利用大屏幕的空间，因而在平板上应用得非常广泛. Fragment不能独立存在，必须…...

编程日记 2024/11/30 5:43:10

华为IPD流程学习之——深入解读123页华为IPD流程体系设计方法论PPT

该方案全面介绍了华为IPD流程体系设计方法论，包括流程体系建设的背景、理念、架构、核心特征、构建模型、与组织和战略的关系、运营机制、数字化转型以及流程管理组织等内容，旨在为企业提供一套系统的流程体系建设指导，以提升运营效率、质量和…...

编程日记 2024/11/30 5:42:09

DriveMLLM：一个专为自动驾驶空间理解任务设计的大规模基准数据集

2024-11-20， 由武汉大学、中国科学院自动化研究所、悉尼科技大学、牛津大学等合创建了DriveMLLM数据集，该数据集是自动驾驶领域首个专为评估多模态大型语言模型（MLLMs）空间理解能力而设计的基准，对于推动自动驾驶技术的…...

编程日记 2024/11/30 5:41:08

高效处理 iOS 应用中的大规模礼物数据：以直播项目为例（1-礼物池）

引言在现代iOS应用开发中，处理大规模数据是一个常见的挑战。尤其实在直播项目中，礼物面板作为展示用户互动的重要部分，通常需要实时显示海量的礼物数据。这些数据不仅涉及到不同的区域、主播的动态差异，还需要保证高效的加载与渲…...

编程日记 2024/11/30 5:40:06

python的函数与递归

需求： 编写一个函数，计算斐波那契数列的第 N 项，并使用递归实现。为了计算斐波那契数列的第 N 项，可以使用递归方法。斐波那契数列的定义是： F(0) 0 F(1) 1 对于 n > 2，F(n) F(n-1) F(n-2)&#xf…...

编程日记 2024/11/30 5:39:05

RabbitMQ学习-Seven

再SpringBoot中使用MQ 1.创建SpringBoot项目除了我们平常使用的一些工具依赖，还需要选择这个Spring for RabbitMQ依赖 2.需要在application.yml文件中进行配置 server:port :9090 spring:application:name:producerrabbitmq:host: 你的主机名port: 5672virtual-…...

编程日记 2024/11/30 5:38:04

中科亿海微SoM模组——波控处理软硬一体解决方案

本文介绍的波控处理软硬一体解决方案主要是面向相控阵天线控制领域，波控处理通过控制不同天线组件的幅相来调整天线波束的方向和增益，实现高精度角度控制和高增益。本方案由波控处理板、波控处理控制软件算法和上位机软件共同构成。波控处理SoM模组原型样…...

编程日记 2024/11/30 5:37:02

开源法律、政策和实践

#一切皆可开源# 木兰社区对《Open Source Law,Policy and Practice 》这本书的第二版进行了翻译，并发布在了gitee上。这本书是对开源文化、开源政策、法律的全面介绍。目录如下： 1 Open Source as Philosophy,Methodology,and CommerceUsing Law with …...

编程日记 2024/11/30 5:33:59

【计算视觉算法与应用】金字塔，下采样Gaussian Pyramid. 上采用 Laplacian Pyramid （code: py）

金字塔（Pyramid）在图像处理中主要用于多尺度分析和图像压缩。常见的图像金字塔有两种： 高斯金字塔（Gaussian Pyramid）：用于下采样图像，生成分辨率逐渐降低的图像序列。拉普拉斯金字塔&#xff…...

编程日记 2024/11/30 5:32:59

基于算法竞赛的c++编程（28）结构体的进阶应用

结构体的嵌套与复杂数据组织在C中，结构体可以嵌套使用，形成更复杂的数据结构。例如，可以通过嵌套结构体描述多层级数据关系： struct Address {string city;string street;int zipCode; };struct Employee {string name;int id;…...

编程新知 2025/11/16 19:06:23

龙虎榜——20250610

上证指数放量收阴线，个股多数下跌，盘中受消息影响大幅波动。深证指数放量收阴线形成顶分型，指数短线有调整的需求，大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技代表标的：御银股份、雄帝科技驱动…...

编程新知 2026/2/7 5:06:52

业务系统对接大模型的基础方案：架构设计与关键步骤

业务系统对接大模型：架构设计与关键步骤在当今数字化转型的浪潮中，大语言模型（LLM）已成为企业提升业务效率和创新能力的关键技术之一。将大模型集成到业务系统中，不仅可以优化用户体验，还能为业务决策提供…...

编程新知 2026/2/8 4:53:03

linux之kylin系统nginx的安装

一、nginx的作用 1.可做高性能的web服务器直接处理静态资源（HTML/CSS/图片等），响应速度远超传统服务器类似apache支持高并发连接 2.反向代理服务器隐藏后端服务器IP地址，提高安全性 3.负载均衡服务器支持多种策略分发流量…...

编程新知 2026/1/18 3:11:35

相机Camera日志实例分析之二：相机Camx【专业模式开启直方图拍照】单帧流程日志详解

【关注我，后续持续新增专题博文，谢谢！！！】上一篇我们讲了： 这一篇我们开始讲： 目录一、场景操作步骤二、日志基础关键字分级如下三、场景日志如下： 一、场景操作步骤操作步…...

编程新知 2026/1/30 10:10:55

大数据零基础学习day1之环境准备和大数据初步理解

学习大数据会使用到多台Linux服务器。一、环境准备 1、VMware 基于VMware构建Linux虚拟机是大数据从业者或者IT从业者的必备技能之一也是成本低廉的方案所以VMware虚拟机方案是必须要学习的。 （1）设置网关打开VMware虚拟机，点击编辑…...

编程新知 2026/1/25 14:43:07

【配置 YOLOX 用于按目录分类的图片数据集】

现在的图标点选越来越多，如何一步解决，采用 YOLOX 目标检测模式则可以轻松解决要在 YOLOX 中使用按目录分类的图片数据集（每个目录代表一个类别，目录下是该类别的所有图片），你需要进行以下配置步骤&#x…...

编程新知 2026/1/30 4:52:56

什么？连接服务器也能可视化显示界面？：基于X11 Forwarding + CentOS + MobaXterm实战指南

文章目录什么是X11？环境准备实战步骤1️⃣ 服务器端配置（CentOS）2️⃣ 客户端配置（MobaXterm）3️⃣ 验证X11 Forwarding4️⃣ 运行自定义GUI程序(Python示例)5️⃣ 成功效果![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/55aefaea8a9f477e86d065227851fe3d.pn…...

编程新知 2025/10/2 17:12:14

Ubuntu系统复制（U盘-电脑硬盘）

所需环境电脑自带硬盘：1块 (1T) U盘1：Ubuntu系统引导盘（用于“U盘2”复制到“电脑自带硬盘”） U盘2：Ubuntu系统盘（1T，用于被复制） ！！！建议“电脑…...

编程新知 2026/2/7 17:43:28

如何配置一个sql server使得其它用户可以通过excel odbc获取数据

要让其他用户通过 Excel 使用 ODBC 连接到 SQL Server 获取数据，你需要完成以下配置步骤： ✅ 一、在 SQL Server 端配置（服务器设置） 1. 启用 TCP/IP 协议打开 “SQL Server 配置管理器”。导航到：SQL Server 网络配…...

编程新知 2025/8/25 19:37:12

1 进行多次抽样，样本的分布参数和总体的分布参数的关系

2 样本容量越大，多次抽样的样本的分布参数和总体的分布参数的关系

3 随着样本容量增大，多次抽样均值的 平均值，方差的变化

4 随着样本容量增大，多次抽样方差的 平均值，方差的变化

相关文章：

3 随着样本容量增大，多次抽样均值的平均值，方差的变化

4 随着样本容量增大，多次抽样方差的平均值，方差的变化