从平均数到排名算法
平均数用更少的数字,概括一组数字。属于概述统计量、集中趋势测度、位置测度。中位数是第二常见的概述统计量。许多情况下比均值更合适。算术平均数是3中毕达哥拉斯平均数之一,另外两种毕达哥拉斯平均数是几何平均数和调和平均数。
算术平均
A M = 1 n ∑ i = 1 n x i AM = \frac{1}{n}\sum_{i=1}^n x_i AM=n1i=1∑nxi
几何平均
G M = ( ∏ i n x i ) 1 n GM = (\prod_i^n x_i)^{\frac{1}{n}} GM=(i∏nxi)n1
可以通过面积/体积运算来理解几何平均:两个实数a,b分别对应长方形的边和宽,则实数a,b的几何平均等于这样一个正方形的边长,这个正方形的面积与a、b组成的长方形的面积相等。
更多维度情况下类似。
调和平均
H M = n ∑ i = 1 n 1 x i HM = \frac{n}{\sum_{i=1}^n\frac{1}{x_i}} HM=∑i=1nxi1n
两点间包含 n 段长度相同的路程,每段路程采用不同的速度 x i x_i xi完成,完成所有路程的平均速度就是x_i的调和平均。
平方平均数
Q M = 1 n ∑ i = 1 n x i 2 QM = \sqrt{\frac{1}{n}\sum_{i=1}^nx_i^2} QM=n1i=1∑nxi2
平均数之间的关系
H M ≤ G M ≤ A M ≤ Q M HM \le GM \le AM \le QM HM≤GM≤AM≤QM
关系的几何证明:
排名算法
排名问题形式简单,也就是将一组对象根据其重要性加以排序,但其解答往往不是那么简单的,充满了悖论和谜题。目前看来排名问题吸引了越来越多的人的研究兴趣,原因可能包括信息量的指数增长,数据收集能力的增强。排名的对象五花八门,比如网页、视频、直播、新闻、股票、球队等等。
排名聚合的目的是通过某种算法将多个排名结果加以融合,产出最终的单一的更好的排名结果。平均法是比较常见的排名聚合的方法,下面讨论采用不同的均值算法对排名结果的影响。
- 调和平均:
- H M = 2 1 / x + 1 / y , ∂ H M ∂ x = 2 ( 1 1 + x / y ) 2 , ∂ H M ∂ y = 2 ( 1 1 + y / x ) 2 HM = \frac{2}{1/x+1/y},\frac{\partial HM}{\partial x} = 2(\frac{1}{1 + x/y})^2,\frac{\partial HM}{\partial y} = 2(\frac{1}{1 + y/x})^2 HM=1/x+1/y2,∂x∂HM=2(1+x/y1)2,∂y∂HM=2(1+y/x1)2
- 自变量x, y中较小者的导数较大,平均值结果受到较小值的影响较大
- 几何平均数
- G M = x y , ∂ G M ∂ x = 1 2 y x , ∂ G M ∂ y = 1 2 x y GM = \sqrt{xy},\frac{\partial GM}{\partial x} = \frac{1}{2}\sqrt{\frac{y}{x}}, \frac{\partial GM}{\partial y} = \frac{1}{2}\sqrt{\frac{x}{y}} GM=xy,∂x∂GM=21xy,∂y∂GM=21yx
- 自变量x, y中较小者的导数较大,且在接近零的时候导数趋向无穷大,因此几何平均数在零附近的极小值极为敏感。
- 算术平均数
- A M = x + y 2 , ∂ A M ∂ x = 0.5 , ∂ A M ∂ y = 0.5 AM = \frac{x+y}{2},\frac{\partial AM}{\partial x} = 0.5, \frac{\partial AM}{\partial y} = 0.5 AM=2x+y,∂x∂AM=0.5,∂y∂AM=0.5
- 自变量x, y导数恒定不变,不偏袒较小值和较大值
- 平方平均数
- Q M = x 2 + y 2 2 , ∂ Q M ∂ x = 2 1 + ( y / x ) 2 , ∂ Q M ∂ y = 2 1 + ( x / y ) 2 QM = \sqrt{\frac{x^2+y^2}{2}},\frac{\partial QM}{\partial x} = \sqrt{\frac{2}{1 + (y/x)^2}}, \frac{\partial QM}{\partial y} = \sqrt{\frac{2}{1 + (x/y)^2}} QM=2x2+y2,∂x∂QM=1+(y/x)22,∂y∂QM=1+(x/y)22
- 自变量x, y中较大者的导数较大,平均值受较大值的影响较大
例子:考虑 x , y ∈ ( 0 , 1 ) x,y\in(0,1) x,y∈(0,1), 且固定 y = 0.8,观测均值随x的变化趋势(黑色:QM,橘色:AM,红色:GM,蓝色:HM)
- x ∈ ( 0 , 0.2 ) x \in (0, 0.2) x∈(0,0.2) ,随着x的增大,平方平均数几乎持平,算术平均数已0.5的恒定速度增长,几何平均数增长速度最大,调和平均数增长速度紧次于几何平均数;在 x 远小于 y 的区域,平方平均数几乎不受x变化的影响,算术平均值以恒定的0.5的比例受到x变化的影响,几何平均数以远大于0.5的比例受x变化的影响,调和平均数的影响比例介于几何平均数和算术平均数之间。
- x ∈ ( 0.2 , 0.8 ) x\in(0.2, 0.8) x∈(0.2,0.8),随着 x 的继续增大,对平方平均数的影响逐渐递增,算术平均数的变化率依旧不变,几何平均数从左侧接近0.5,调和平均数与几何平均数类似
- x ∈ ( 0.8 , 1.0 ) x\in(0.8,1.0) x∈(0.8,1.0),随着 x 的继续增大,对平方平均数的影响继续递增,超过所有其他平均数,算术平均的变化率依然保持恒定,几何平均数变化率下降到0.5以下,但高于调和平均数。
因此在对具有多个排序属性值的对象继续排序
- 算术平均值对多属性值的量纲不敏感,选取的对象可能是个别属性特长的,也可以是综合能力(不存在短板属性)都不错的
- 几何平均和调和平均值对较小属性值敏感,如果对象存在短板属性,则整体排名不会太高,因此选出来的对象倾向于综合能力不错,不存在明显短板的内容
- 平方平均值对较大值比较敏感,因此选出的内容倾向于某些熟悉特长的对象,存不存在短板影响不是很大
上文的分析对设计排名算法的启发是:
- 多个属性缺一不可,不能有短板的情况下,适宜几何平均数和调和调和平均数:比如信息检索中的指标f1,是模型查准率precision和查全率recall的调和平均数,原因是一个有使用价值的模型,不能存在明显的偏科,大部分情况下precision = 0.9, recal = 0.1的模型,不如precisio = 0.6,recall = 0.6的模型,查准率查全率太小的模不具有实用价值。几何平均和调和平均排名中,值域小的属性对结果的影响较大,值域大的熟悉对结果影响较小,一点层度上有些反直觉
- 容许多个属性出现某些短板,适宜算术平均值:比如一般的考试成绩汇总,采用的是加法求和,其实等价于算术平均,算术平均允许某些科目有短板,只要考生有另外一些特长科目,整体排名也会不错,又或则考试没有明显的特长,但也没有明显的短板,排名也会不错。
- 平方平均数鼓励特长,惩罚中庸,与几何平均和调和平均相对的另一个极端。
几个属性值同分布的情况下,几类排序算法是等价的。但拉齐分布的隐射过程,可能会导致失去了原始值的信息。
相关文章:
![](https://img-blog.csdnimg.cn/8d156eaeaf8d4845a6a28596d2c59b5a.png)
从平均数到排名算法
平均数用更少的数字,概括一组数字。属于概述统计量、集中趋势测度、位置测度。中位数是第二常见的概述统计量。许多情况下比均值更合适。算术平均数是3中毕达哥拉斯平均数之一,另外两种毕达哥拉斯平均数是几何平均数和调和平均数。 算术平均 A M 1 n ∑…...
![](https://www.ngui.cc/images/no-images.jpg)
如何使用ESP8266微控制器和Nextion显示器为Home Assistant展示温度传感器和互联网天气预报
第一部分:引言与项目概述 在智能家居领域,实时监控和显示环境数据已经成为了一个热门的话题。无论是室内温度、室外温度,还是游泳池的温度,都可以通过各种传感器轻松获取。但如何将这些数据以直观、美观的方式展现出来呢…...
![](https://img-blog.csdnimg.cn/9f2c96e7efd543e8a1fbd7e3f1d00198.png)
阻塞队列-生产者消费者模型
阻塞队列介绍标准库阻塞队列使用基于阻塞队列的简单生产者消费者模型。实现一个简单型阻塞队列 (基于数组实现) 阻塞队列介绍 不要和之前学多线程的就绪队列搞混; 阻塞队列:也是一个队列,先进先出。带有特殊的功能 &…...
![](https://img-blog.csdnimg.cn/097d0432541944d69ad3f4f912f09439.png#pic_center)
Vector Art - 矢量艺术
什么是矢量艺术? 矢量图形允许创意人员构建高质量的艺术作品,具有干净的线条和形状,可以缩放到任何大小。探索这种文件格式如何为各种规模的项目提供创造性的机会。 什么是矢量艺术作品? 矢量艺术是由矢量图形组成的艺术。这些图形是基于…...
![](https://www.ngui.cc/images/no-images.jpg)
ruoyi-nbcio增加flowable流程待办消息的提醒,并提供右上角的红字数字提醒(一)
更多ruoyi-nbcio功能请看演示系统 gitee源代码地址 前后端代码: https://gitee.com/nbacheng/ruoyi-nbcio 演示地址:RuoYi-Nbcio后台管理系统 1、数据库表方面 在原来sys_notice修改基础上增加一个表叫sys_notice_send 表结构如下: DROP …...
![](https://img-blog.csdnimg.cn/7890dfb757d443feaebe33d1430522a9.png)
数据结构:二叉树的基本概念
文章目录 1. 二叉树的定义2. 二叉树的特点3. 特殊二叉树斜树满二叉树完全二叉树 4. 二叉树的性质 1. 二叉树的定义 如果我们猜一个100以内的数字,该怎么猜才能理论最快呢? 第一种方式:从1,2一直猜到100, 反正数字都是100以内,总能猜到的 第二种方式:先猜50,如果比结果小,猜75…...
![](https://www.ngui.cc/images/no-images.jpg)
利用Socks5代理IP加强跨界电商爬虫的网络安全
随着跨界电商的兴起,爬虫技术在这个领域变得越来越重要。然而,网络安全一直是一个值得关注的问题。在本文中,我们将讨论如何利用代理IP和Socks5代理来增强跨界电商爬虫的网络安全,确保稳定和可靠的数据采集,同时避免封…...
![](https://img-blog.csdnimg.cn/87f874124d0245afb092f04a6c800ea5.png)
Spring学习笔记6 Bean的实例化方式
Spring学习笔记5 GoF之工厂模式_biubiubiu0706的博客-CSDN博客 Spring为Bean提供了多种实例化方式,通常包括4中(目的:更加灵活) 1.通过构造方法实例化 2.通过简单工厂模式实例化 3.通过factory-bean实例化 4.通过FactoryBean接口实例化 新建模块 spring-005 依赖 <!--S…...
![](https://www.ngui.cc/images/no-images.jpg)
大二毕设.3-网盘系统-用户模块讲解
目录 模块功能介绍 具体实现讲解 constants层:存放用户模块常量类 entity层:存放实体类,与数据库中的属性值基本保持一致 mapper层:对数据库进行数据持久化操作 service层:业务逻辑层,主要是针对具体…...
![](https://img-blog.csdnimg.cn/504bcf50186a4ababc6e8a63e42704d6.png)
(Vue2)智慧商城项目
新增两个目录api、utils api接口模块:发送ajax请求的接口模块 utils工具模块:自己封装的一些工具方法模块 第三方组件库vant-ui PC端:element-ui(element-plus) ant-design-vue 移动端:vant-ui Mint UI…...
![](https://img-blog.csdnimg.cn/9998bbc4dda843169da45b41770fa049.png)
Nginx实战
虚拟主机 虚拟主机指的就是⼀个独⽴的站点,具有独⽴的域名,有完整的www服务,例如⽹站、FTP、邮件等 。Nginx⽀持多虚拟主机,在⼀台机器上可以运⾏完全独⽴的多个站点。⼀些草根流量站⻓,常会搭建个⼈站点进⾏资源分享交…...
![](https://www.ngui.cc/images/no-images.jpg)
day-57 代码随想录算法训练营(19)动态规划 part 17
647.回文子串 思路:动态规划 1.dp存储:判断以i开始,j结尾的字符串是否是回文串2.动态转移方程:当s[i]s[j]时,如果j-i<1,d[i][j]true; 如果 dp[i1][j-1]true,那么dp[i][j…...
![](https://img-blog.csdnimg.cn/e59f7fc0219148028b1440de52dabf65.png)
在项目中,关于前端实现数据可视化的技术选择
前言 在项目中,数据可视化以图表、报表类型为主。 需求背景 技术框架是Vue2.x版本,组件库是Ant Design of Vue能够支撑足够多的图表类型开发图表大小/位置能够随意变动图表样式需要支持丰富多样的用户配置强大、开放的图表语法支持复杂的数据可视化场景…...
![](https://img-blog.csdnimg.cn/489187045d814824b2bf50269a502be4.png)
DT 卡通材质学习 一
渐变着色器 相交线 笔刷和卡通结合使用 修改器...
![](https://www.ngui.cc/images/no-images.jpg)
【游戏引擎架构】6.2 资源管理器
资源管理器可以分为离线部分系统和运行时系统 文章目录 离线资源管理数据库资产管道 运行时资源管理文件结构内存管理文件间引用 离线资源管理 数据库 UE的数据库可以直接浏览、编辑资产,看到运行时的状态;但也存在两个较大的缺点: 版本管…...
![](https://img-blog.csdnimg.cn/a33a9689603f4dfbb6362d1c65112d9a.png)
spring的ThreadPoolTaskExecutor装饰器传递调用线程信息给线程池中的线程
概述 需求是想在线程池执行任务的时候,在开始前将调用线程的信息传到子线程中,在子线程完成后,再清除传入的数据。 下面使用了spring的ThreadPoolTaskExecutor来实现这个需求. ThreadPoolTaskExecutor 在jdk中使用的是ThreadPoolExecutor…...
![](https://img-blog.csdnimg.cn/e5afb0442cf84b78b80079eb174ea66c.png)
转载 - 洞察问题本质,解决工作难题
作者:关苏哲 高效管理者的三大技能 问题界定的6个问题 1.你所需要解决的问题是什么? 2.你为什么需要解决这个问题? 3.你期待的理想结果是什么? 4.这个问题包括哪些子问题? 5.你曾经尝试过哪些解决方式?…...
![](https://img-blog.csdnimg.cn/img_convert/3fba9b34b546f6ea3dac50c54f543490.png)
关于计算机找不到d3dx9_43.dll,无法继续执行代码修复方法
d3dx9_43.dll是一个动态链接库文件,它是DirectX的一个组件,主要用于处理游戏中的图形、声音等多媒体元素。当这个文件丢失时,可能会导致以下问题: 1. 游戏无法正常运行:由于d3dx9_43.dll负责处理游戏中的多媒体元素&a…...
![](https://img-blog.csdnimg.cn/59e4caa7b6b5427fb00fab64b5442845.gif)
《从零开始的Java世界》01基本程序设计
《从零开始的Java世界》系列主要讲解Javase部分,从最简单的程序设计到面向对象编程,再到异常处理、常用API的使用,最后到注解、反射,涵盖Java基础所需的所有知识点。学习者应该从学会如何使用,到知道其实现原理全方位式…...
![](https://img-blog.csdnimg.cn/20d38285b48940c689a17c7b35bf2f4c.png)
【数据开发】数据全栈知识架构,数据(平台、开发、管理、分析)
文章目录 一、数据全栈知识架构1、数据方法(思维,统计学,实践,北极星)2、数据工具:数据仓库3、数据规范 二、数据分析工具1、大数据平台2、数据开发:入库计算(重点)3、数…...
![](https://img-blog.csdnimg.cn/cd3b5e66b2364900a3b2737f4d291ef2.jpeg)
基于STM32的宠物托运智能控制系统的设计(第十七届研电赛)
一、功能介绍 使用STM32作为主控设备,通过DHT11温湿度传感器、多合一空气质量检测传感器以及压力传感器对宠物的托运环境中的温湿度、二氧化碳浓度和食物与水的重量进行采集,将采集到的信息在本地LCD显示屏上显示,同时,使用4G模块…...
![](https://img-blog.csdnimg.cn/ca54863103dc410087af35b4528707e9.png#pic_center)
数据结构的奇妙世界:实用算法与实际应用
文章目录 数据结构和算法的基本概念数据结构数组链表栈队列树图 算法 常见的数据结构和算法排序算法快速排序示例 数据结构的应用数据库管理系统图像处理网络路由 数据结构和算法的性能分析时间复杂度空间复杂度 如何更好地编写代码避免常见错误结论 🎉欢迎来到数据…...
![](https://img-blog.csdnimg.cn/892a85e8ada74312a6de7f208ee21006.gif)
uniapp实现表格冻结
效果图如下: 思路: 1.由于APP项目需要,起初想去插件市场直接找现成的,结果找了很久没找到合适的(有的不支持vue2有的不能都支持APP和小程序) 2.后来,就只能去改uni-table源码了,因…...
![](https://img-blog.csdnimg.cn/1d2d80cfb6bf4a61a07302d513f27e69.png)
Spring面试题11:什么是Spring的依赖注入
该文章专注于面试,面试只要回答关键点即可,不需要对框架有非常深入的回答,如果你想应付面试,是足够了,抓住关键点 面试官:说一说Spring的依赖注入 依赖注入(Dependency Injection)是Spring框架的一个核心特性,它是指通过外部容器将对象的依赖关系注入到对象中,从而…...
![](https://img-blog.csdnimg.cn/img_convert/2e2966494ce5deb4d3ec90a6821a123e.png)
用于设计 CNN 的 7 种不同卷积
一 说明 最近对CNN架构的研究包括许多不同的卷积变体,这让我在阅读这些论文时感到困惑。我认为通过一些更流行的卷积变体的精确定义,效果和用例(在计算机视觉和深度学习中)是值得的。这些变体旨在保存参数计数、增强推理并利用目标…...
![](https://img-blog.csdnimg.cn/img_convert/c9d6d98de7a2ef9db9e1f2944ea908de.png)
备受以太坊基金会青睐的 Hexlink,构建亿级用户涌入 Web3的入口
早在2021年9月,以太坊创始人Vitalik Buterin就曾提出了EIP-4337(账户抽象)提案,并在去年10月对该提案进一步更新,引发行业的进一步关注。在今年3月,EIP-4337提案正式通过审计,并成为了ERC-4337标…...
![](https://img-blog.csdnimg.cn/img_convert/5d26b83e505fc35a95baddb9807fa2a7.jpeg)
合约升级标准 ERC2535 的设计解析和不足
合约升级标准 ERC2535 的设计解析和不足 Safful最近审计了钻石标准的一份实现代码,这一标准是一种新的可升级合约模式。撰写标准是一项值得赞许的事业,但钻石标准及其实现有许多引人担忧的地方。这份代码是过度工程的产物,附带了许多不必要的…...
![](https://www.ngui.cc/images/no-images.jpg)
【Vue】ElementUI实现登录注册
一、搭建项目 二、后台交互 三、CORS跨域 好啦今天到这了,希望能帮到你!!!...
![](https://img-blog.csdnimg.cn/1096ec1facca4376888fc42c0f9c275b.png)
linux 安装 wordpress
文章目录 linux 安装 wordpress1. wordpress 简介2. wordpress功能和特点3. 部署要求4. 环境搭建4.1 部署 nginx4.1.1 新增配置文件 4.2 部署 PHP74.2.1 查看当前版本4.2.2 YUM 安装 PHP74.2.3 查看 PHP 版本4.2.4 启动PHP-FPM4.2.5 修改配置文件4.2.6 重启服务 4.3 部署 mysql…...
![](https://www.ngui.cc/images/no-images.jpg)
LeetCode902最大为 N 的数字组合(相关话题:数位DP问题,递归遍历和减枝)
目录 题目描述 方法一递归遍历和减枝 方法二动态规划 数位DP问题拓展 通用方法论引入 <...
![](/images/no-images.jpg)
合肥做网站优化/做推广app赚钱的项目
有时因为病毒修改或人为删除了某个系统文件,造成系统无法正常运行的时候, 如果知道被修改或丢失的文件的文件名,我们就可以试着用光盘来修复,但是修复的时间很长,我们可以直接用expand命令来提取所需要的那个文件. 其用法如下: EXPAND [-r] Source DestinationEXPAND -r Source…...
![](https://img-blog.csdnimg.cn/img_convert/f68f2add0b68e4f9810432fce46917b7.png)
6免费网站建站/南宁求介绍seo软件
githttps://github.com/sea-boat/mysql-protocol概况mysql客户端连接上mysql服务端后,当需要退出断开连接时则向服务端发送退出命令。服务端可以直接关闭连接或返回OK包。mysql通信报文结构类型名字描述int<3>payload长度按照the least significant byte firs…...
![](https://img-blog.csdnimg.cn/img_convert/f9a63c4872dec47fb64d2c42f18f89f9.png)
免费的企业建站cms/交换友情链接的渠道有哪些
提起 JavaAgent,很多人都说几句,就像古龙武侠小说里的「孔雀翎」,威力很大,江湖上都是它的传说。但真的见识过的人并没几个。JavaAgent 虽说没这么神秘,但也一直给人曲高和寡的感觉,除了一些中间件产品、大…...
![](/images/no-images.jpg)
企业网站排名/seo咨询解决方案
使用情景区别 listenTo用于监听自身意外的对象 on用于监听自身 listenTo和on中的回调函数里的this的区别 listener.listenTo(object, eventName, function(){//此处的this指向listener})object.on(eventName, function(){//此处的this指向object})object.on(eventName, functio…...
长春疫情最新消息今天封城了/外贸谷歌优化
之前客户给了一个域名检测api接口,专门对接程序的,用于程序自动检测域名轮转,拦截域名自动下线用的最近买域名比较频繁,总是入坑,一不小心买回来的新域名就是已经被微信拦截的,估计是域名上一任主人没有善待…...
![](https://img2018.cnblogs.com/blog/1625602/201904/1625602-20190413145641186-521039196.png)
可以做微积分的网站/seo免费优化公司推荐
如何使用域名访问自己的Windows服务器(Java web 项目) 写在前面 前段时间在阿里云弄了个学生服务器,就想着自己搭建一个网站试一试,在网上查阅相关资料时发现大部分都是基于服务器是Linux系统的,并没有找到关于window …...