当前位置：首页 > news >正文

R语言优雅的进行广义可加模型泊松回归分析

news 2026/2/7 18:46:31

泊松回归（Poisson regression）是以结局变量为计数结果时的一种回归分析。泊松回归在我们的生活中应用非常广泛，例如：1分钟内过马路人数，1天内火车站的旅客流动数，1天内的银行取钱人数，一周内的销售经营数据等等都可以使用泊松回归进行分析。

在这里插入图片描述
既往已经有文章《R语言进行泊松回归》初步的介绍了泊松回归，本期介绍下如何使用tidygam包来优雅的进行泊松回归，tidygam包主要是通过mgcv包来进行分析，通过对tidygam包对mgcv包的数据转换后，上手难度大大降低，可以轻松优雅的进行泊松回归分析。
咱们先导入R包和数据，数据使用的是tidygam自带的gest数据

library(tidygam)
library(mgcv)
library(dplyr)
library(ggplot2)
data("gest")
theme_set(theme_light())

在这里插入图片描述
这个数据是一个10、11和12个月婴儿的手势数量的数据，这个数据表包含了来自孟加拉、中国和英国背景的60名婴儿所做的三种手势的计数。我解释一下变量名：dyad是ID标识的意思，background：表明来自哪个国家，months：月份，只有10，11，12共3个月，gesture手势的类型，count：手势的计数，这个是结局变量
先生成gam模型

gs <- gam(count ~ s(months, k = 3),data = gest,family = poisson
)

这个模型gam是mgcv包生成的，解析模型，表明月数和手势计数是相关的

在这里插入图片描述
生成预测值

gs_pred <- predict_gam(gs)

绘图，一定要用series标明绘制哪个变量

gs_pred %>%plot(series = "months")

在这里插入图片描述
R包介绍，这个时候生成的Y周是count的对数值，因此我们还需要转换一下

predict_gam(gs, tran_fun = exp) %>%plot(series = "months")

在这里插入图片描述
如果咱们想了解不同国家的分类，可以再gam函数中设定

gs_by <- gam(count ~ s(months, by = background, k = 3),data = gest,family = poisson
)

解析模型，表明不同的国家婴儿，手势计数都是和月份相关

summary(gs_by)

在这里插入图片描述
接下来咱们可以绘制分类图形，需要再comparison处指明根据哪个变量分类

gs_by %>%predict_gam(length_out = 20, series = "months", tran_fun = exp) %>%plot(comparison = "background")

在这里插入图片描述
R包指出，虽然使用plot函数绘图，但是它的本质上是一个ggplot2绘制的图片，所以咱们可以使用ggplot的方法修改它

gs_by %>%predict_gam(length_out = 20, series = "months", tran_fun = exp) %>%plot(comparison = "background") +scale_color_brewer(type = "qual") + scale_fill_brewer(type = "qual")

在这里插入图片描述
咱们如果考虑有2个非连续的变量，可以再模型里面定义

gs_by_2 <- gam(count ~ s(months, by = background, k = 3) +s(months, by = gesture, k = 3),data = gest,family = poisson
)

解析模型，这里虽然有变量交叉，但是这种做法并不是交互效应，应该理解为亚组更加准确

summary(gs_by_2)

在这里插入图片描述
绘图

gs_by_2 %>%predict_gam(length_out = 20, series = "months", tran_fun = exp) %>%plot(comparison = "gesture") +scale_color_brewer(type = "qual") + scale_fill_brewer(type = "qual") +facet_grid(~ background)

在这里插入图片描述
如果咱们想了解background和gesture的交互关系，要先生成一个交互变量

gest <- gest %>%mutate(back_gest = interaction(background, gesture))

然后咱们使用这个交互变量进行模型分类

gs_i <- gam(count ~ s(months, by = back_gest, k = 3),data = gest,family = poisson
)
summary(gs_i)

在这里插入图片描述
绘图，

predict_gam(gs_i, tran_fun = exp,separate = list(back_gest = c("background", "gesture"))
) %>%plot(series = "months", comparison = "gesture") +facet_grid(~ background)

在这里插入图片描述
这样一个亚组交互图形就生成好啦。

R语言优雅的进行广义可加模型泊松回归分析

相关文章：

R语言优雅的进行广义可加模型泊松回归分析

大模型学习笔记十四：Agent模型微调

大疆创新2025校招内推

搜索引擎项目（四）

声音克隆一键本地化部署 GPT-SoVITS

使用【Easypoi】实现百万数据导出

GRL-图强化学习

昇思25天学习打卡营第22天|Pix2Pix实现图像转换

全感知、全覆盖、全智能的智慧快消开源了。

ABC364:D - K-th Nearest(二分)

hive中分区与分桶的区别

Blender材质-PBR与纹理材质

微软的Edge浏览器如何设置兼容模式

SpringBoot开启多端口探究(1)

优化算法：2.粒子群算法(PSO)及Python实现

ThreadLocal面试三道题

Git操作指令（已完结）

大数据采集工具——Flume简介安装配置使用教程

C语言 #具有展开功能的排雷游戏

npm publish出错，‘proxy‘ config is set properly. See: ‘npm help config‘

Android Wi-Fi 连接失败日志分析

Leetcode 3577. Count the Number of Computer Unlocking Permutations

镜像里切换为普通用户

Cloudflare 从 Nginx 到 Pingora：性能、效率与安全的全面升级

Java 加密常用的各种算法及其选择

全面解析各类VPN技术：GRE、IPsec、L2TP、SSL与MPLS VPN对比

如何在最短时间内提升打ctf（web)的水平？

智能AI电话机器人系统的识别能力现状与发展水平

Docker拉取MySQL后数据库连接失败的解决方案

数据结构：递归的种类（Types of Recursion）