当前位置: 首页 > news >正文

多元统计方法众多,分类还是排序?约束排序还是非约束排序?哪种方法或技术更适合我的研究目的或数据?

            生态环境领域研究中常常面对众多的不同类型的数据或变量,当要同时分析多个因变量(y)时需要用到多元统计分析(multivariate statistical analysis)。多元统计分析内容丰富,应用广泛,是非常重要和实用的多元数据分析方法和统计工具,其中分类(classification)/分组(grouping)和梯度(gradient)/排序(ordination)分析是多元统计分析的核心内容。分类/分组分析主要包括聚类(如层次聚类和k-means聚类等)和辨别分析(如线性辨别分析和mental检验等);梯度/排序分析分为非约束排序(如PCA和CA等)和约束排序(如RDA和CCA等)两大类(详见课程介绍)。

         但初学者在应用多元统计分析方法时往往非常困惑,这种困惑主要来自几个方面:首先,多元统计方法众多,分类还是排序?约束排序还是非约束排序?哪种方法或技术更适合我的研究目的或数据?

其次,在多元分析中很多术语都有别称,如非约束排序也叫间接梯度分析;

再次,多元数据类型包括连续型数据、计数数据、分类数据及混合类型数据,不同数据类型如何选择合适的方法?

本文将梳理多元统计中分类/分组和排序/梯度分析各方法不同应用情境,包括生态环境多元数据分析概述、R基础及数据探索、多元数据梯度分析、多元数据分组分析及统计结果作图。课程将通过大量具体案例,利用R语言相关包示范各种方法实现途径,使大家面对多元数据分析时能够驾轻就熟,从容面对。

多元统计方法概念定义

纷繁的多元统计方法应用情景、异同点

多元统计方法数据或变量类型和结构

 R基础及数据探索 (Working with R and Data screening)

R和Rstudio简介及入门和作图基础

R及Rstudio介绍:背景、软件及程序包安装、基本设置等

2) R语言基本操作,包括向量、矩阵、数据框及数据列表等生成和数据提取等

3) R语言数据文件读取、整理(清洗)、结果存储等(含tidverse)

4) R语言基础绘图(含ggplot):基本绘图、排版、发表质量绘图输出存储

 

群落数据准备及探索分析

生物群落数据准备:物种组成、环境变量、物种功能属性、系统发育树等

2) 生物群落数据检查:缺失值和离群值(outliers)等-避免模型错进错出(GIGO)

3) 物种多样性计算:物种多样性(TD)、功能多样性(FD)和系统发育多样性(PD)

4) 物种相似/相异矩阵关联测度介绍

 

多元数据分组分析 (Working with groups)

聚类(Cluster)分析上:非层次聚类(NHC)

1) 聚类及非层次聚类方法概述

2) 非层次聚类:K均值(K-means)聚类方法(kmeans;pam;clara)

3) 实例鸟类生境数据K均值聚类比较分析:聚类数确定、聚类稳定性、聚类结果评估、复合聚类值构建

 聚类(Cluster)分析下:层次聚类(NHC)

1)层次聚类方法简介:多元聚合层次聚类(PAHC) VS 多元分化层次聚类(PDHC)

2)层次聚类方法(hcluster和agnes)分类结果比较分析:碎石图、轮廓宽度、同表型相关图等

3) 案例1鸟类生境数据的层次聚类分析;案例2鱼类生境数据的层次聚类分析

辨别(Discrimination)分析上:分组差异性检验(Group Difference Test)

1) 多元群落数据分组差异分析及检验简介

2)(非参数)多元方差分析(NP-MANOVA/ADONIS/PERMANOVA)、多元置换过程(MRPP)、多元相似分析(ANOSIM)、Mantel检验(MANTEL)在多元数据差异性检验的应用

3)多元差异性检验多组数据比较实现方法:MRPP、Mantel

4)Mental方法在群落生态学‘标准’应用:空间取样距离、环境因子及物种组成关系及其偏Mental分析

5) 案例1乌龟适生生境差异性检验;案例2微生物组成数据差异分析;案例3鱼类群落、空间距离及环境因子相互关析分析

 

 辨别(Discrimination)分析中:线性辨别分析(LDA)

1) 辨别分析(DA)的多面性

2) 线性辨别(LDA)分析基本原理及流程:数据检查、评估假设、样本数量、变量选择、模型确定、结果解读及模型验证

3)其他辨别分析方法介绍(QDA,KNN等)

4) 案例乌龟适生生境辨别及预测

辨别(Discrimination)分析下:分类回归树(CART)及随机森林模型(RFM)

1) 生物群落数据的分类回归树简介

2) 分类回归树分析(CART)实现:分化准则、节点杂度、gini指数、先验概率效应、误分类代价、分类树裁剪、Monte Carlo检验、变量重要性评估、模型预测等

3) 随机森林模型(RFM)实现:算法流程、模型评估、变量重要性评估及模型分类与回归等

4) 案例1基于分类回归树的乌龟群落生境划分及预测

5)案例2基于随机森林模型的根际微生物群落与植物生长关系及变量重要性评估

多元数据梯度分析/(Working with gradients) 

间接梯度分析-非约束排序(Unconstrained ordination)上:PCA

1)生物群落数据的非约束排序简介

2) 主成分分析(PCA)的基本原理:假设条件、数据要求等

3)案例:鱼类生境数据的PCA排序分析实现-数据准备、检查(离群值、多元正态性、线性关系、样本独立性等)、结果验证、排序轴选择(特征根准则、累计解释率、随机断棍准则等)、结果解读、双序图等

间接梯度分析-非约束排序(Unconstrained ordination)下:PCoA、CA、DCA 及NMDS

1) 其他非约束方法介绍及应用情景: CA、DCA 、PCOA及NMDS

2) 案例1鸟类群落组成数据的对应分析(CA)及去趋势对应分析(DCA):数据准备、假设条件、总惯量、特征根、排序轴选择、结果解读、偶见种效应/弓形效应等

3) 案例2 基于距离/相似度指数或矩阵的主坐标排序(PCoA):距离/相似度指数选择、模型假设、负特征根问题、结果解读、排序图等

4) 案例3 NMDS排序方法应用:假设条件、基本分析流程、排序效果评估(应力值)、排序图等

5)案例4 药物对肠道微生物群落影响:PCoA+PERMANOVA

6)案例5 基于随机森林模型的蚂蚁多维属性特征预测:RF+PCA+PCoA+PERMANOVA

直接梯度分析-约束排序(Constrained ordination)上:RDA

生物群落数据的约束排序简介:非对称约束排序 VS 对称约束排序

2)生物群落数据非对称约束排序的基本流程:响应变量/物种选择(矩阵Y)、响应变量数据预处理(转换或标准化)、分析方法选择(RDA/db-RDA/CCA)、解释变量/约束变量选择(矩阵X)及分析和结果解读、评估及展示

3) 案例景观、斑块及立地条件对森林景观中蛾类群落物种组成的影响

直接梯度分析-约束排序(Constrained ordination)中:dbRDA、CCA及对称约束排序方法

案例1:基于距离矩阵的冗余分析(dbRDA):物种组成数据及0,1数据分析

2)案例2:群落物种多度数据的典范对应分析(CCA):单峰型环境梯度分析方法

3)案例3:对称约束排序方法介绍及物种组成、物种属性及环境变量相关关系第四角分析

直接梯度分析-约束排序(Constrained ordination)下:变差分解(Variance Partitioning) 

 群落数据多元统计分析变差分解简介

2) 偏回归分析与变差分解

3) 案例景观、斑块及立地条件及空间因素对森林景观蛾类群落物种组成变异的变差分解

 

 

 统计结果作图ggplot (Plotting the results)

群落数据及统计分析结果作图数据准备:结果提取、整理

PCA、CA、PCoA及NMDS等非约束排序图:排序图和双序图(biplot)

PCoA+PERMANOVA结果图:排序图+分组+PERMANOVA差异显著性+多重比较

RDA、db-RDA及CCA等约束排序图:三序图(triplot)和韦恩图(venn)

 

 

相关文章:

多元统计方法众多,分类还是排序?约束排序还是非约束排序?哪种方法或技术更适合我的研究目的或数据?

生态环境领域研究中常常面对众多的不同类型的数据或变量,当要同时分析多个因变量(y)时需要用到多元统计分析(multivariate statistical analysis)。多元统计分析内容丰富,应用广泛,是非常重要和…...

有关白盒加密

白盒密码技术白皮书 有关白盒的概念 其实白盒黑盒之类概念其实是软件保护方面的概念,在很多方面都有应用,例如 黑盒: 传统的加密技术是默认假定处于黑盒中的,也就是假定攻击者无法获得密钥。具体而言,认为攻击者并…...

C#学习系列之image控件配合ffmpeg播放视频(bitmap转image)

C#学习系列之image控件配合ffmpeg播放视频(bitmap转image)啰嗦ffmpeg输入格式与输出格式bitmap数据在image控件上显示数据转化总结啰嗦 关于音视频解码问题,采用海思解码库进行解码,存在C#托管调用动态库,会出现卡顿的…...

电容笔和Apple pencil有什么区别?开学季电容笔排行榜

与苹果的 Pencil相比,市面上常见的电容笔在压感上是没有具备重力压感,只具备着一种倾斜压感。对于绘画没有过高要求的话,其实一支普通的平替电容笔,就能为我们解决日常很多问题。它不仅可以用在办公上,也可以用在笔记、…...

【蓝桥杯每日一题】递归算法

🍎 博客主页:🌙披星戴月的贾维斯 🍎 欢迎关注:👍点赞🍃收藏🔥留言 🍇系列专栏:🌙 蓝桥杯 🌙我与杀戮之中绽放,亦如黎明的花…...

java 寻找2020

题目描述 本题为填空题,只需要算出结果后,在代码中使用输出语句将所填结果输出即可。 小蓝有一个数字矩阵,里面只包含数字 0 0 和 2 2。小蓝很喜欢 2020 2020,他想找 到这个数字矩阵中有多少个 2020 2020 。 小蓝只关注三种构成 …...

1.1 小白黑群晖构建,硬件推荐,硬件选购教程

构建一台黑群晖需要购买:CPU主板、散热器、内存条、机箱、电源、硬盘、网卡(可选)。物理机安装若需硬解需选择918/920此类机型系统进行安装。关联教程:黑群晖安装中的报错:https://guoqing.blog.csdn.net/article/deta…...

实验三、数字PID控制器的设计

实验三、数字PID控制器的设计 --- 直流闭环调速实验 一、实验目的 1.理解晶闸管直流单闭环调速系统的数学模型和工作原理;. 2. 掌握PID控制器参数对控制系统性能的影响; 3. 能够运用MATLAB/Simulink软件对控制系统进行正确建模并对模块进行正确的参数设置; 4.…...

python List和常用的方法

List:列表中包含多个数据,数据之间使用逗号分隔,索引从0开始。 空列表: dir:查看列表的所有方法 List常用方法:insert、append,extend、del、remove、pop、clear、count、index 增加insert(索引…...

PMP证书要怎么考,含金量怎么样?

对于新改版的PMP提纲,很多人都不知道如何去备考,这里我就总结一些经验,希望能帮助到大家!! 一,学习内容及考试形式? 学习内容:《PMBOK》项目管理知识体系指南,建议大家…...

MySQL实战解析底层---事务隔离:为什么你改了我还看不见

目录 前言 隔离性与隔离级别 事务隔离的实现 事务的启动方式 前言 和数据库打交道的时候,总是会用到事务最经典的例子就是转账,你要给朋友小王转 100 块钱,而此时你的银行卡只有 100 块钱转账过程具体到程序里会有一系列的操作&#xff0…...

变更数据捕获(CDC)

从广泛意义上说,全球许多企业每天都需要通过频繁的数据批量处理与加载,来定期将数据从一个数据库迁移到另一个数据库(或数据仓库)。这类定期批量加载的工作,往往既耗费时间,又会消耗原始系统的大量处理能力。因此,管理…...

【移动端表格组件】uniapp简单实现H5,小程序,APP多端兼容表格功能,复制即用,简单易懂【详细注释版本】

前言: 由于最近需要做移动端的项目 有个pc端的后台系统里面需要移一部分页面过来 而里面就有很多的表格,我就开始惯例网上先找前人栽的树,我好乘凉 然后找了一圈发现,不管是主流的移动端ui库或者网上自己写的帖子,或者…...

电子技术——CMOS 逻辑门电路

电子技术——CMOS 逻辑门电路 在本节我们介绍如何使用CMOS电路实现组合逻辑函数。在组合电路中,电路是瞬时发生的,也就是电路的输出之和当前的输入有关,并且电路是无记忆的也没有反馈。组合电路被大量的使用在当今的数字逻辑系统中。 晶体管…...

【C++】C++11 新特性

目录 1.列表初始化 1.1. C98中使用{}初始化的问题 1.2. 内置类型的列表初始化 1.3. 自定义类型的列表初始化 2. 变量类型推导 2.1. 为什么需要类型推导 2.2. decltype类型推导 2.2.1 为什么需要decltype 2.2.2. decltype 3. 对默认成员的控制(default、delete) 3.1. …...

JPA 相关注解说明

jpa相关注解 JPA(Java Persistence API)是一种Java规范,定义了一套标准的对象关系映射(ORM)API,用于将Java对象映射到关系型数据库中。JPA旨在统一各种ORM框架之间的差异,提供一种标准化的ORM解…...

SAP 生产订单/流程订单中日期的解释

SAP 生产订单/流程订单中日期的解释 基本开始日期:表示订单的开始日期 基本完成日期:表示订单的完成日期 我们在输入基本开始日期和基本完成日期时需要关注 调度 下面的“类型”,其中有向前、向后、当天日期等: 调度类型 为向前…...

Java设计模式笔记——七大设计原则

系列文章目录 第一章 Java 设计模式之七大设计原则 文章目录系列文章目录前言一、单一职责原则1.案例分析2.改进二、开闭原则1.案例分析2.改进三、里氏替换原则1.案例分析2.改进四、依赖倒转原则五、接口隔离原则1.案例分析2.改进六、合成复用原则1.案例分析2.改进七、迪米特原…...

记录第一次接口上线过程

新入职一家公司后,前三天一直在学习公司内部各种制度文化以及考试。 一直到第三天组长突然叫我过去,给了一个需求的思维导图,按照这个需求写这样一个接口, 其实还不错,不用自己去分析需求,按照这上面直接开…...

时序预测 | MATLAB实现Rmsprop算法优化LSTM长短期记忆神经网络时间序列多步预测(滚动预测未来,多指标,含验证Loss曲线)

时序预测 | MATLAB实现Rmsprop算法优化LSTM长短期记忆神经网络时间序列多步预测(滚动预测未来,多指标,含训练和验证Loss曲线) 目录 时序预测 | MATLAB实现Rmsprop算法优化LSTM长短期记忆神经网络时间序列多步预测(滚动预测未来,多指标,含训练和验证Loss曲线)效果一览基本描…...

如何利用Level2行情数据接口追板和交易股票?

十档行情看得更深的A股行情软件,我们在盘口数据中可以看到,买一到买五以及卖一到卖五,共10个价位的挂单情况,但基于上证所的level-2行情软件,视野则扩展到了买一到买十以及卖一到卖十数据,无疑比所有免费软…...

MySQL常用的聚合函数

聚合函数聚合函数对一组值进行运算,并返回单个值。也叫组合函数函数作用COUNT(*|列名) 统计查询结果的⾏数AVG(数值类型列名)求平均值,返回指定列数据的平均值SUM (数值类型列名)求和,返回指定列的总和MAX(列名)查询指定列的最⼤值MIN(列名)查…...

如何评估模糊测试工具-unibench的使用

unibench是一个用来评估模糊测试工具的benchmark。这个benchmark集成了20多个常用的测试程序,以及许多模糊测试工具。 这篇文章(https://zhuanlan.zhihu.com/p/421124258)对unibench进行了简单的介绍,本文就不再赘诉,…...

2023初级会计详细学习计划打卡表!自律逆袭,一次上岸!

2023年初级会计职称考试报名时间:2月7日-28日考试时间:5月13日—17日给大家整理了《经济法基础》和《初级会计实务》两科超实用的学习打卡表重要程度、难易度、易错点、要求掌握内容、章节估分等都全部总结在一起,一目了然!为什么…...

【Python】Python项目打包发布(四)(基于Nuitka打包PySide6项目)

Python项目打包发布汇总 【Python】Python项目打包发布(一)(基于Pyinstaller打包多目录项目) 【Python】Python项目打包发布(二)(基于Pyinstaller打包PyWebIO项目) 【Python】Pytho…...

一起Talk Android吧(第五百一十三回:Java中的byte数组与int变量相互转换)

文章目录整体思路示例代码各位看官们大家好,上一回中咱们说的例子是"自定义Dialog",这一回中咱们说的例子是" Java中的byte数组与int变量相互转换"。闲话休提,言归正转, 让我们一起Talk Android吧!在实际项目…...

22《Protein Actions Principles and Modeling》-《蛋白质作用原理和建模》中文分享

​《Protein Actions Principles and Modeling》-《蛋白质作用原理和建模》 本人能力有限,如果错误欢迎批评指正。 第五章:Folding and Aggregation Are Cooperative Transitions (折叠和聚合是同时进行的) -蛋白质折叠的协同作…...

vue2 @hook 的解析与妙用

目录前言几种用法用法一 将放在多个生命周期的逻辑,统一到一个生命周期中用法二 监听子组件生命周期运行的情况运用场景场景一 许多时候,我们不得不在不同的生命周期中执行某些逻辑,并且这些逻辑会用到一些通用的变量,这些通用变量…...

网络技术|网络地址转换与IPv6|路由设计基础|4

对应讲义——p6 p7NAT例题例1解1例2解2例3解3例4解4一、IPv6地址用二进制格式表示128位的一个IPv6地址,按每16位为一个位段,划分为8个位段。若某个IPv6地址中出现多个连续的二进制0,可以通过压缩某个位段中的前导0来简化IPv6地址的表示。例如…...

MySQL运维知识

1 日志1.1 错误日志1.2 二进制日志查看二进制日志:mysqlbinlog ./binlog.000007purge master logs to binlog.000006reset mastershow variables like %binlog_expire_logs_seconds%默认二进制文件只存放30天,30天后会自动删除。1.3 查询日志1.4 慢查询日…...

建设公司网站的细节/什么样的人适合做策划

20161215请问全志的android平台的kernel启动早期的 打印信息 全关了吗开发板:索智SC3817。全志R16SDK:android4.4.2 parrotv1.1打开的方法:rootrootrootroot-E400:~/wyb/bt1_parrot_v1.1_20161212/lichee/linux-3.4$ cp .config bak1_orig.co…...

网站脑图怎么做/百度知道下载安装

题目: 洛谷 3242 分析: 明确题意:在一棵树上给定若干权值为 \(w\) 的路径 \((u,v)\) (盘子),每次给定 \((a,b)\) (水果),询问所有满足 \((u,v)\) 被 \((a,b)\) 完全覆盖的…...

网站没有备案怎么做支付/哪里做网站便宜

前言线程池,故名思意,就是一个存放线程的池子,学术一点的说法,就是一组存放线程资源的集合。为什么有线程池这一概念地产生呢?想想以前我们都是需要线程的时候,直接自己手动来创建一个,然后执行…...

东城企业网站建设/杭州网站定制

开发环境 1.在官网下载并且安装python 2.7 2. Python | 开发环境IDE PyCharm配置 3谷歌浏览器 4.爬虫框架Scrapy 地址:https://sourceforge.net/projects/pywin32/ 其它可能依赖的安装包:lxml-3.6.4-cp27-cp27m-win_amd64.whl,VCForPython27.msi百度下载…...

微信小程序购物平台/谷歌排名优化入门教程

linux常见报错有哪些?command not found 命令没有找到NO such file or directory 没有这个文件或者目录Permission denied 权限不足No space left on device 磁盘没有剩余空间File exists 文件已经存在Is a directory 这是一个目录Not a directory 这不是一个目录Wa…...

网站建设模板的/网络营销公司哪家好

先说说我为什么有这种“奇怪”的想法。它基于这样一个场景&#xff1a;我最近闲来无事完善了一个小demo&#xff1a;音乐播放器。在里面有一个功能 —— 点击列表某一项弹出音乐播放弹框。我原先一直是“为每一项单独加一个click事件监听”。这很糟糕&#xff01;<div id&qu…...