当前位置：首页 > news >正文

Python分析假期对美国出生率的影响

news 2026/2/8 18:06:46

背景

1、数据集下载

birthsHistorical US birth data culled from the CDC website - jakevdp/data-CDCbirthshttps://github.com/jakevdp/data-CDCbirths

2、数据集介绍

此数据来自美国疾病控制和预防中心，并通过 Google 的 BigQuery Web UI 使用以下查询进行编译：

SELECTyear, month, day,IF (is_male, 'M', 'F') AS gender,SUM(record_weight) as births
FROM[publicdata:samples.natality]
GROUP BYyear, month, day, gender
ORDER BYyear, month, day, gender

它被汇总以符合他们的使用条款。数据于 2015 年 6 月 9 日访问。

请注意，Andrew Gelman 和他的小组已经对这些数据进行了相当广泛的分析;参见 this post （英文）。

一、读取数据

import matplotlib.pyplot as plt
import matplotlib as mpl
import numpy as np
import pandas as pd
from datetime import datetime
%matplotlib inline

二、数据分析预处理

#假期对美国出生率的影响
births=pd.read_csv('./births.csv')
quartiles = np.percentile(births['births'], [25, 50, 75])
mu, sig = quartiles[1], 0.74 * (quartiles[2] - quartiles[0])
births = births.query('(births > @mu - 5 * @sig) & (births < @mu + 5 * @sig)')
births['day'] = births['day'].astype(int)
births.index = pd.to_datetime(10000 * births.year +100 * births.month +births.day, format='%Y%m%d')
births_by_date = births.pivot_table('births',[births.index.month, births.index.day])
births_by_date.index = [datetime(2012, month, day)for (month, day) in births_by_date.index]#导入datetime模块
births_by_date.index

DatetimeIndex(['2012-01-01', '2012-01-02', '2012-01-03', '2012-01-04',
'2012-01-05', '2012-01-06', '2012-01-07', '2012-01-08',
'2012-01-09', '2012-01-10',
...
'2012-12-22', '2012-12-23', '2012-12-24', '2012-12-25',
'2012-12-26', '2012-12-27', '2012-12-28', '2012-12-29',
'2012-12-30', '2012-12-31'],
dtype='datetime64[ns]', length=366, freq=None)

三、可视化

fig,ax=plt.subplots(figsize=(12,4)) 
births_by_date.plot(ax=ax)
ax.annotate("New Year's Day",xy=("2012-1-1",4100),xycoords='data',xytext=(50,-30),textcoords='offset points',         arrowprops=dict(arrowstyle='->',                 connectionstyle='arc3,rad=-0.2'))
ax.annotate("Independence Day",xy=('2012-7-4',4250),xycoords='data',          bbox=dict(boxstyle='round',fc='none',ec='gray'),         xytext=(10,-40),textcoords="offset points",ha='center',  arrowprops=dict(arrowstyle='->'))
ax.annotate("Labor Day",xy=('2012-9-4',4850),xycoords='data',ha='center',         xytext=(0,-20),textcoords='offset points')
ax.annotate('',xy=('2012-9-1',4850),xytext=('2012-9-7',4850),         xycoords='data',textcoords='data',   arrowprops={'arrowstyle':'|-|,widthA=0.2,widthB=0.2',})
ax.annotate('Halloween',xy=('2012-10-31',4600),xycoords='data',       xytext=(-80,-40),textcoords='offset points',        arrowprops=dict(arrowstyle='fancy',                     fc='0.6',ec='none',                       connectionstyle='angle3,angleA=0,angleB=-90'))
ax.annotate("Thanksgiving",xy=('2012-11-25',4500),xycoords='data',           xytext=(-120,-60),textcoords='offset points',           bbox=dict(boxstyle='round4,pad=.5',fc='0.9'),          arrowprops=dict(arrowstyle='->',                          connectionstyle='angle,angleA=0,angleB=80,rad=20'))
ax.annotate('Christmas',xy=('2012-12-25',3850),xycoords='data',           xytext=(-30,0),textcoords='offset points',           size=13,ha='right',va='center',           bbox=dict(boxstyle='round',alpha=0.1),         arrowprops=dict(arrowstyle='wedge,tail_width=0.5',alpha=0.1));
ax.set(title='USA births by day of year (1969-1988)',ylabel='average daily births')         
ax.xaxis.set_major_locator(mpl.dates.MonthLocator())
ax.xaxis.set_minor_locator(mpl.dates.MonthLocator(bymonthday=15))
ax.xaxis.set_major_formatter(plt.NullFormatter())
ax.xaxis.set_minor_formatter(mpl.dates.DateFormatter('%h'))
ax.set_ylim(3600,5400)
# ax.grid(True)
plt.show()

# Plot the results
fig, ax = plt.subplots(figsize=(8, 6))
births.groupby(dates)['births'].mean().plot(ax=ax)# Label the plot
ax.text('2012-1-1', 3950, "New Year's Day")
ax.text('2012-7-4', 4250, "Independence Day", ha='center')
ax.text('2012-9-4', 4850, "Labor Day", ha='center')
ax.text('2012-10-31', 4600, "Halloween", ha='right')
ax.text('2012-11-25', 4450, "Thanksgiving", ha='center')
ax.text('2012-12-25', 3800, "Christmas", ha='right')
ax.set(title='USA births by day of year (1969-1988)',ylabel='average daily births',xlim=('2011-12-20','2013-1-10'),ylim=(3700, 5400));# Format the x axis with centered month labels
ax.xaxis.set_major_locator(mpl.dates.MonthLocator())
ax.xaxis.set_minor_locator(mpl.dates.MonthLocator(bymonthday=15))
ax.xaxis.set_major_formatter(plt.NullFormatter())
ax.xaxis.set_minor_formatter(mpl.dates.DateFormatter('%h'));
ax.set_ylim(3600, 5400)plt.show()

Python分析假期对美国出生率的影响

背景 1、数据集下载 birthsHistorical US birth data culled from the CDC website - jakevdp/data-CDCbirthshttps://github.com/jakevdp/data-CDCbirths 2、数据集介绍此数据来自美国疾病控制和预防中心，并通过 Google 的 BigQuery Web UI 使用以下查询进行编…...

编程日记 2024/10/29 7:01:48

机械臂笛卡尔空间轨迹规划

1. 重新优化末端轨迹规划调整末端轨迹的插值方法或参数：如果之前使用的是线性插值，可改为三次样条插值。例如，对于一个在二维平面上从点(0, 0)到(10, 10)的末端轨迹，线性插值可能是简单地在每个时间步长均匀增加坐标值&#xff0…...

编程日记 2024/10/29 7:00:48

红队工具---Behinder学习

1.什么是Behinder？ Behinder 是一款用于网络渗透测试的安全工具，主要用于对 Web 应用进行攻击和漏洞利用。它提供了强大的功能，是一款红队的大杀器，几乎是现代web安全必须学习的一款webshell管理工具。主要用途渗透测试&#…...

编程日记 2024/10/29 6:57:44

k8s 1.28.2 集群部署 NFS server 和 NFS Subdir External Provisioner

文章目录 [toc]前言部署 NFS server镜像准备节点打标签启动 NFS server创建 pv 验证创建 pvc创建 pod 挂载验证部署 NFS Subdir External Provisioner创建 pod 验证提前创建 pvc 的方式使用 volumeClaimTemplates 的方式前言 NFS Subdir External Provisioner 可以使用现有的…...

编程日记 2024/10/29 6:50:38

前端零基础入门到上班：【Day1】什么是前端？

本来打算开付费专栏但是想起那句话赠人玫瑰手留余香引言1. 什么是前端？1.1 前端的定义1.2 前端的三大核心技术1.3 前端框架和工具 2. 什么是后端？2.1 后端的定义2.2 后端的组成要素2.3 后端框架和工具 3. 前后端的区别4. 什么是前后端分离&#xff1f…...

编程日记 2024/10/29 6:47:35

搜索二叉树 Binary Search Tree（BST）

【提醒】本章内容需掌握二叉树结构的基本概念和特性，不然可能阅读起来比较费劲。一、概念什么是搜索二叉树？搜索二叉树和普通二叉树的却别是什么？ 答： 二叉搜索树又称二叉排序树，它或者是一棵空树或者是具有以下性…...

编程日记 2024/10/29 6:46:34

数据库表字段插入bug

瀚高数据库目录环境 BUG/漏洞编码症状触发条件解决方案环境系统平台：Linux x86-64 Red Hat Enterprise Linux 7 版本：4.5.1 BUG/漏洞编码 3355 症状数据库安全版v4.5.1，安装包为：hgdb4.5.1-see-centos7-x86-64-20210804.…...

编程日记 2024/10/29 6:44:32

信创环境模拟：X86架构下部署搭建aarch64的ARM虚拟机

在真实系统为x86架构下，搭建arm64的虚拟开发环境。在该环境中直接下载打包项目依赖的python运行环境。前言随着国家信创环境的要求普及，基本和国家沾边的政企事业单位都换成了信创环境，即ARM64的cpu服务器，而且该类服务器是不…...

编程日记 2024/10/29 6:43:24

TSO的资料

TSO即TCP Segmentation Offload，相关资料如下： Segmentation Offloads in the Linux Networking StackWhat is TCP Segmentation OffloadUnderstanding TCP Segmentation Offload (TSO) and Large Receive Offload (LRO) in a VMware environment...

编程日记 2024/10/29 6:42:19

OpenCV视觉分析之目标跟踪(3)实现基于金字塔的 Lucas-Kanade 算法来进行稀疏光流计算的类SparsePyrLKOpticalFlow的使用

操作系统：ubuntu22.04 OpenCV版本：OpenCV4.9 IDE:Visual Studio Code 编程语言：C11 算法描述用于计算稀疏光流的类。该类可以使用带有金字塔的迭代 Lucas-Kanade 方法来计算稀疏特征集的光流 cv::SparsePyrLKOpticalFlow 类是 OpenCV 库…...

编程日记 2024/10/29 6:40:16

乐维网管平台（一）：如何精准掌控 IP 管理

业网络已成为支撑业务运转的关键基础设施，而在企业网络管理中，IP 管理至关重要，它就像是网络秩序的守护者，确保网络的高效运行、安全可靠。一、为什么企业要进行 IP 管理 1. 优化资源分配 IP 地址作为网络中的重要资源&#xf…...

编程日记 2024/10/29 6:37:13

React-Route新版本(v6或以上)用法示例

新版本的React-Route (v6或以上，但不排序后续版本还会有修改)，移除了Switch，写法和老版本有一些区别，下面分享一个示例： JSX文件: import React, {StrictMode } from react import { createRoot } from react-dom/cli…...

编程日记 2024/10/29 6:35:11

卡方检验方法概述与类型——四格表和R*C表卡方检验案例

卡方检验是以卡方分布为基础，针对定类数据资料的常用假设检验方法。其理论思想是判断实际观测到的频数与有关总体的理论频数是否一致。卡方统计量是实际频数与理论频数吻合程度的指标。卡方值越小，表明实际观察频数与理论频数越接近，反之卡…...

编程日记 2024/10/29 6:32:07

在浏览器和Node.js环境中使用Puppeteer的Rollup与Webpack打包指南

Puppeteer是一个Node.js库，它提供了一套高级API来通过DevTools协议控制Chrome或Chromium。虽然Puppeteer通常在服务器端使用，但有时你可能需要在浏览器环境中使用它的某些功能。本文将介绍如何使用Rollup和Webpack来打包包含Puppeteer或其轻量级版本Pupp…...

编程日记 2024/10/29 6:30:56

GPT论文整理提示词

论文阅读指令1:粗读论文请你阅读并理解这篇文献，然后将该篇文章的标题作为一级标题，将摘要和各个大标题作为二级标题，将小标题作为三级标题，将小标题下每一部分内容作为四级标题，给我以markdown的语言输出中文的翻…...

编程日记 2024/10/29 6:29:51

在培训班学网络安全有用吗

在当今数字化时代，网络安全问题日益凸显，成为了企业和个人关注的焦点。随着对网络安全人才需求的不断增长，各种网络安全培训班也如雨后春笋般涌现。然而，在培训班学网络安全真的有用吗? 一、网络安全的重要性与挑战 1. 信息时代的…...

编程日记 2024/10/29 6:28:50

Flink CDC系列之：理解学习YARN模式

Flink CDC系列之：理解学习YARN模式准备会话模式在 YARN 上启动 Flink 会话设置 Flink CDC提交 Flink CDC Job Apache Hadoop YARN 是许多数据处理框架中流行的资源提供者。Flink 服务提交给 YARN 的 ResourceManager，后者在由 YARN NodeManagers 管理的…...

编程日记 2024/10/29 6:27:49

langgraph入门

使用langgraph框架搭建一个简易agent。最近想学习一下agent相关知识，langgraph似乎挺好的，于是就来试一试。langgraph。看了官网，起核心思想是将agent中的角色和工具都当作是图的Node，整个agent流程通过增加Node之间的边来设定。…...

编程日记 2024/10/29 6:26:48

【Python】爬虫程序打包成exe

上一篇写了爬虫获取汽车之家配置表，师父要更方便使用甚至推广（？），反正就是他们没有环境也能用嘛，我就直接打包了，界面不会做也懒得学了、、 1、下载pyinstaller（清华镜像&#xff09…...

编程日记 2024/10/29 6:23:44

【力扣专题栏】两两交换链表中的节点，如何实现链表中两两相邻节点的交换？

这里写目录标题 1、题目描述解释2、算法原理解析3、代码编写 1、题目描述解释 2、算法原理解析 3、代码编写 /*** Definition for singly-linked list.* struct ListNode {* int val;* ListNode *next;* ListNode() : val(0), next(nullptr) {}* ListNode(int…...

编程日记 2024/10/29 6:22:43

国防科技大学计算机基础课程笔记02信息编码

1.机内码和国标码国标码就是我们非常熟悉的这个GB2312,但是因为都是16进制，因此这个了16进制的数据既可以翻译成为这个机器码，也可以翻译成为这个国标码，所以这个时候很容易会出现这个歧义的情况； 因此，我们的这个国…...

编程新知 2026/2/8 4:37:15

DeepSeek 赋能智慧能源：微电网优化调度的智能革新路径

目录一、智慧能源微电网优化调度概述1.1 智慧能源微电网概念1.2 优化调度的重要性1.3 目前面临的挑战二、DeepSeek 技术探秘2.1 DeepSeek 技术原理2.2 DeepSeek 独特优势2.3 DeepSeek 在 AI 领域地位三、DeepSeek 在微电网优化调度中的应用剖析3.1 数据处理与分析3.2 预测与…...

编程新知 2025/11/20 2:48:44

基于Flask实现的医疗保险欺诈识别监测模型

基于Flask实现的医疗保险欺诈识别监测模型项目截图项目简介社会医疗保险是国家通过立法形式强制实施，由雇主和个人按一定比例缴纳保险费，建立社会医疗保险基金，支付雇员医疗费用的一种医疗保险制度， 它是促进社会文明和进步的…...

编程新知 2026/1/24 14:59:08

FastAPI 教程：从入门到实践

FastAPI 是一个现代、快速（高性能）的 Web 框架，用于构建 API，支持 Python 3.6。它基于标准 Python 类型提示，易于学习且功能强大。以下是一个完整的 FastAPI 入门教程，涵盖从环境搭建到创建并运行一个简单的…...

编程新知 2025/10/16 7:51:26

【JVM】- 内存结构

引言 JVM：Java Virtual Machine 定义：Java虚拟机，Java二进制字节码的运行环境好处： 一次编写，到处运行自动内存管理，垃圾回收的功能数组下标越界检查（会抛异常，不会覆盖到其他代码…...

编程新知 2026/1/30 13:40:43

Cinnamon修改面板小工具图标

Cinnamon开始菜单-CSDN博客设置模块都是做好的，比GNOME简单得多！ 在 applet.js 里增加 const Settings imports.ui.settings;this.settings new Settings.AppletSettings(this, HTYMenusonichy, instance_id); this.settings.bind(menu-icon, menu…...

编程新知 2026/1/31 14:56:22

vue3 定时器-定义全局方法 vue+ts

1.创建ts文件路径：src/utils/timer.ts 完整代码： import { onUnmounted } from vuetype TimerCallback (...args: any[]) > voidexport function useGlobalTimer() {const timers: Map<number, NodeJS.Timeout> new Map()// 创建定时器con…...

编程新知 2025/8/9 0:31:20

零基础设计模式——行为型模式 - 责任链模式

第四部分：行为型模式 - 责任链模式 (Chain of Responsibility Pattern) 欢迎来到行为型模式的学习！行为型模式关注对象之间的职责分配、算法封装和对象间的交互。我们将学习的第一个行为型模式是责任链模式。核心思想：使多个对象都有机会处…...

编程新知 2026/1/31 9:33:18

DeepSeek 技术赋能无人农场协同作业：用 AI 重构农田管理 “神经网”

目录一、引言二、DeepSeek 技术大揭秘2.1 核心架构解析2.2 关键技术剖析三、智能农业无人农场协同作业现状3.1 发展现状概述3.2 协同作业模式介绍四、DeepSeek 的 “农场奇妙游”4.1 数据处理与分析4.2 作物生长监测与预测4.3 病虫害防治4.4 农机协同作业调度五、实际案例大…...

编程新知 2025/9/24 13:35:36

使用 SymPy 进行向量和矩阵的高级操作

在科学计算和工程领域，向量和矩阵操作是解决问题的核心技能之一。Python 的 SymPy 库提供了强大的符号计算功能，能够高效地处理向量和矩阵的各种操作。本文将深入探讨如何使用 SymPy 进行向量和矩阵的创建、合并以及维度拓展等操作，并通过具体…...

编程新知 2026/1/31 12:47:41

背景

1、数据集下载

2、数据集介绍

一、读取数据

二、数据分析预处理

三、可视化

相关文章：