当前位置: 首页 > news >正文

游戏中的随机——“动态平衡概率”算法

前言

众所周知计算机模拟的随机是伪随机,但在结果看来依然和现实中的随机差别不大。
例如掷硬币,连续掷很多很多次之后,总有连续七八十来次同一个面朝上的情况出现,计算机中一般的随机函数也能很好模拟这一点。

但在游戏中,假如有一个50%概率会出现的情况,经常连续七八十来次不出现,这样其实非常影响游戏体验。

那么为了增加这部分游戏体验,我们如何避免上述情况发生,使某个概率能在总体上较为均匀地分布呢?

例如现在有这样的需求:

A. 暴击率总体为20%
B. 要求每十次攻击,至少有一次暴击
C. 要求暴击的总体分布较为均匀

算法预览

经过一段时间的深思熟虑,笔者终于构建了一种名为“动态平衡概率”的算法。
虽然它还有一些局限性,但已经达到了基本可用的状态。

先上代码,为了方便演示图表,这里就用 python 了:

import matplotlib.pyplot as plt
import random# 初始化变量
InitCritPercent = 0.2       # 初始暴击率
dynamicCritPercent = 0.2    # 动态暴击率
currentCritPercent = 0      # 当前暴击概率
deltaCritPercent = 0        # 当前暴击率与初始暴击率的差值(用来表示变化)
attackTotalCount = 0        # 总攻击次数
critTotalCount = 0          # 总暴击次数
noCritStreakCount = 0       # 连续未暴击次数# 给 plot 准备的列表
currentCritPercentList = []
deltaCritPercentList = []
dynamicCritPercentList = []
noCritStreakCountList = []
isCriticalList = []# 获取最佳的 N
def find_optimal_N(p):one_minus_p = 1 - pfor i in range(1, 501):if one_minus_p ** i <= 0.05:return ireturn 500  # 如果未找到合适的 N,则默认返回 500# 测试 10000 次
for i in range(10000):# 核心代码 ↓attackTotalCount += 1isCritical = False# 检查当前攻击数是否大于 0if attackTotalCount > 0:# 计算当前暴击概率currentCritPercent = critTotalCount / attackTotalCount# 计算当前暴击概率与初始暴击率的差值deltaCritPercent = abs(InitCritPercent - currentCritPercent)# 计算动态暴击率dynamicCritPercent = (attackTotalCount * (InitCritPercent - currentCritPercent) + currentCritPercent) * pow(deltaCritPercent, 0.5)# 检查是否连续 N - 1 次未暴击if noCritStreakCount < find_optimal_N(InitCritPercent) - 1:percent = random.random()if percent <= dynamicCritPercent:isCritical = TruenoCritStreakCount = 0else:noCritStreakCount += 1else:isCritical = TruenoCritStreakCount = 0if isCritical:critTotalCount += 1# 核心代码 ↑# 将数据添加到列表中currentCritPercentList.append(currentCritPercent)deltaCritPercentList.append(deltaCritPercent)dynamicCritPercentList.append(dynamicCritPercent)noCritStreakCountList.append(noCritStreakCount)isCriticalList.append(int(isCritical))# 创建多表格
fig, axs = plt.subplots(2)# 每 100 条数据标注一下
for i in range(0, len(currentCritPercentList), 100):axs[0].annotate(f"{currentCritPercentList[i]:.3f}", (i, currentCritPercentList[i]))# 画出暴击概率数据表格
axs[0].plot(currentCritPercentList, label='Current Crit Percent', color='r')
axs[0].plot(deltaCritPercentList, label='Delta Crit Percent', color='g')
axs[0].plot(dynamicCritPercentList, label='Dynamic Crit Percent', color='b')
axs[0].set_xlabel('Total Attacks')
axs[0].set_ylabel('Probability')
axs[0].legend()# 画出连续未暴击次数的表格
axs[1].plot(noCritStreakCountList, label='No-Crit Streak', color='m')
axs[1].plot(isCriticalList, label='Is Critical', color='c')
axs[1].set_xlabel('Total Attacks')
axs[1].set_ylabel('No-Crit Streak / Is Critical')
axs[1].legend()plt.show()

给定参数的运行结果如下图所示(这里的“要求N次攻击,至少有一次暴击”中的N,根据算法取了14)
反向 目标0.2 次数14 倍率差值开平方 无限制1
0 ~ 2000 次 如下
请添加图片描述
8000 ~ 10000 次 如下
请添加图片描述
可以看出,总体暴击率会在大概300次内稳定下来,并且逐渐逼近 0.2;
在攻击次数足够多时,“动态暴击率”的浮动也会趋于稳定。

这是一种通过调整每次攻击的暴击率,来达到动态平衡效果的算法;
也可以说,这是一种动态调整每次概率,以达到目标数学期望的算法。

核心思路

以“暴击率”为例,以下是这种“动态平衡概率”算法的核心思路:

基本参数:
初始概率(目标概率) : P 动态概率 : d y n a m i c P 当前概率 : c u r r e n t P 概率差值 : d e l t a P 攻击次数 : a t t a c k N 暴击次数 : c r i t N 连续未暴击次数 : n o C r i t S t r e a k \begin{align*} \text{初始概率(目标概率)} & :P \\ \text{动态概率} & :dynamicP \\ \text{当前概率} & :currentP \\ \text{概率差值} & :deltaP \\ \text{攻击次数} & :attackN \\ \text{暴击次数} & :critN \\ \text{连续未暴击次数} & :noCritStreak \\ \end{align*} 初始概率(目标概率)动态概率当前概率概率差值攻击次数暴击次数连续未暴击次数PdynamicPcurrentPdeltaPattackNcritNnoCritStreak

核心运算逻辑:
c u r r e n t P = c r i t N a t t a c k N d e l t a P = ∣ P − c u r r e n t P ∣ d y n a m i c P = ( a t t a c k N ⋅ ( P − c u r r e n t P ) + c u r r e n t P ) ⋅ d e l t a P \begin{align*} currentP &= \frac{critN}{attackN} \\ deltaP &= |P - currentP| \\ dynamicP &= \left( attackN · (P - currentP) + currentP \right) · \sqrt{deltaP} \\ \end{align*} currentPdeltaPdynamicP=attackNcritN=PcurrentP=(attackN(PcurrentP)+currentP)deltaP

暴击判断逻辑:
找到一个最佳的N, 用于判断连续 N - 1 次未暴击 : Find_Optimal_N ( p ) : ( 1 − p ) N ≤ 0.05 随机数生成和暴击判断 : 如果  n o C r i t S t r e a k < N − 1 ,则生成一个随机数  p e r c e n t ; ﹂如果  p e r c e n t ≤ d y n a m i c P ,则判定为暴击,相关参数 + 1 ﹂否则 未暴击,相关参数 + 1 否则 必然暴击,相关参数 + 1 \begin{align*} \\ \text{找到一个最佳的N,} \\ \text{用于判断连续 N - 1 次未暴击} & : \\ \text{Find\_Optimal\_N}(p) & : (1 - p) ^ N \leq 0.05 \\ \\ \text{随机数生成和暴击判断} & : \\ & \text{如果 \(noCritStreak\) \( < N - 1 \),则生成一个随机数 \(percent\);} \\ & \text{ ﹂如果 \(percent\) \( \leq \) \(dynamicP\),则判定为暴击,相关参数 + 1} \\ & \text{ ﹂否则 未暴击,相关参数 + 1} \\ & \text{否则 必然暴击,相关参数 + 1} \\ \end{align*} 找到一个最佳的N用于判断连续 N - 1 次未暴击Find_Optimal_N(p)随机数生成和暴击判断::(1p)N0.05:如果 noCritStreak <N1,则生成一个随机数 percent ﹂如果 percent  dynamicP,则判定为暴击,相关参数 + 1 ﹂否则 未暴击,相关参数 + 1否则 必然暴击,相关参数 + 1

本文到这里其实就结束了,这套算法虽然简单,但是笔者发现它的过程还是挺有意思的。
感兴趣的朋友可以继续往下看,文末还有一些优化思路…

发现

还是前文中的需求:

A. 暴击率总体为20%
B. 要求每十次攻击,至少有一次暴击
C. 要求暴击的总体分布较为均匀

假如每次暴击的概率都是0.2,并且每十次攻击至少一次暴击,这样相当于增加了总体最终的暴击数,也就是变相增加了暴击率,确实需要通过某种方式将最终结果调整到0.2.

目前笔者想到的实现方式大致分为两种:

一种是“动态概率”,我们可以随着实际已出现的概率,动态地调整下一次的概率,并保证在最终结果上符合我们的目标概率。
另一种是提前将“随机种子”做好。在制作“种子”时使用连续分段的、适当长度的数组,每段数组中目标出现的概率基本相同,且总体概率符合我们的目标概率。再人为打乱每段数组,最后将他们拼接起来。但是这种方式还有个问题,就是打乱数组之后可能会出现两个数组中的一个暴击在头一个在尾,两次暴击又会间隔较远的情况,无法完全保证 B 条件成立。

本文先尝试第一种方式————“动态概率”

以前面的需求为例,假如每次暴击的概率都是0.2,并且每十次攻击至少一次暴击,先这样在Unity中看一下最终的暴击率会高出多少

using UnityEngine;public class CriticalHit : MonoBehaviour
{// 初始暴击率public float InitCritPercent = 0.2f;// 当前暴击概率private float currentCritPercent;// 当前总攻击次数private int attackTotalCount = 0;// 当前总暴击过的次数private int critTotalCount = 0;// 连续未出现暴击的次数private int noCritStreakCount = 0;private void Start(){currentCritPercent = InitCritPercent;}private void Update(){// 监听鼠标左键输入if (Input.GetMouseButtonDown(0)){// 测试一次PerformAttack();Debug.Log("当前暴击率:" + currentCritPercent);}if (Input.GetKeyDown(KeyCode.Space)){// 测试一万次for (int i = 0; i < 10000; i++) PerformAttack();}}private void PerformAttack(){attackTotalCount++;bool isCritical = false;if (attackTotalCount > 0){// 计算当前暴击概率 = 总暴击数 / 总攻击数currentCritPercent = (float)critTotalCount / attackTotalCount;}// 检查是否需要强制暴击if (noCritStreakCount < 9){float percent = Random.Range(0f, 1f);if (percent < InitCritPercent){isCritical = true;noCritStreakCount = 0; // 重置计数器}else{noCritStreakCount++;}}else{isCritical = true;noCritStreakCount = 0; // 重置计数器}if (isCritical) critTotalCount++;// 执行攻击,如果 isCritical 为 true,则为暴击if (isCritical)Debug.Log("Critical Hit!");elseDebug.Log("Normal Hit.");}
}

将这个脚本挂到场景中的空物体上,运行游戏,然后按空格键先测试一万次,再点击鼠标左键显示当前的暴击率
用上述方式测试几次,会发现最终的暴击率大概在 22.5% 左右,打印结果如下图所示
在Unity中测试1请添加图片描述

那么这多出来的 2.5% 为什么会是 2.5% 呢,它具体是怎么来的呢,如何避免它产生呢?

带着这样的疑惑,笔者开始尝试进行分析…

排除误差的可能

首先我们要排除这 2.5% 是误差的可能。

假设暴击率为 0.2,不考虑其他的设定和限制,每次测试十万次、共测试三次。
那么正常情况下的输出结果如下图所示
排除误差1
请添加图片描述
误差在 0.2% 左右,这与 2.5% 差别还是很大的,所以基本排除这是误差导致的情况。

探索

为了进一步优化算法,笔者决定结合已有的数据和个人直觉进行改进。

笔者用Python重新编写了一版代码,这样我们不仅可以方便地输出图表进行可视化分析,还能在这个基础上进行后续的代码修改和优化。

import matplotlib.pyplot as plt
import random# 初始化变量
InitCritPercent = 0.2   # 初始暴击率
attackTotalCount = 0    # 总攻击次数
critTotalCount = 0      # 总暴击次数
noCritStreakCount = 0   # 连续未暴击次数# 给 plot 准备的列表
currentCritPercentList = []
noCritStreakCountList = []
isCriticalList = []# 测试 10000 次
for i in range(10000):attackTotalCount += 1isCritical = False# 检查是否连续 9 次未暴击if noCritStreakCount < 9:percent = random.random()if percent <= InitCritPercent:isCritical = TruenoCritStreakCount = 0else:noCritStreakCount += 1else:isCritical = TruenoCritStreakCount = 0if isCritical:critTotalCount += 1# 计算当前暴击概率currentCritPercent = critTotalCount / attackTotalCount# 添加数据到列表中currentCritPercentList.append(currentCritPercent)noCritStreakCountList.append(noCritStreakCount)isCriticalList.append(int(isCritical))# 创建多表格
fig, axs = plt.subplots(2)# 画出暴击概率数据表格
axs[0].plot(currentCritPercentList, label='Current Crit Percent', color='r')
axs[0].set_xlabel('Total Attacks')
axs[0].set_ylabel('Probability')
axs[0].legend()# 每 100 条数据标注一下
for i in range(0, len(currentCritPercentList), 100):axs[0].annotate(f"{currentCritPercentList[i]:.5f}", (i, currentCritPercentList[i]))# 画出连续未暴击次数的表格
axs[1].plot(noCritStreakCountList, label='No-Crit Streak', color='m')
axs[1].plot(isCriticalList, label='Is Critical', color='c')
axs[1].set_xlabel('Total Attacks')
axs[1].set_ylabel('No-Crit Streak / Is Critical')
axs[1].legend()plt.show()

从输出的图表中不难看出,整体的暴击率确实变高了,如下图所示

前 2000 次 如下
无动态概率调整1
8000 ~ 10000 次 如下
请添加图片描述

如要将最终的暴击概率调整回 0.2,那就应该降低“当前暴击概率”,将 B 条件所增加的那部分修正回来。

“递增修正”

将前文的python代码添加几个变量,用来检测当前暴击概率的变化,当前暴击概率高于初始暴击率的时候,就降低动态暴击率,直到将当前暴击率拉回到正常水平;反之亦然。

import matplotlib.pyplot as plt
import random# 初始化变量
InitCritPercent = 0.2       # 初始暴击率
currentCritPercent = 0      # 当前暴击概率
deltaCritPercent = 0        # 当前暴击率与初始暴击率的差值(用来表示变化)
dynamicCritPercent = 0.2    # 动态暴击率
attackTotalCount = 0        # 总攻击次数
critTotalCount = 0          # 总暴击次数
noCritStreakCount = 0       # 连续未暴击次数# 给 plot 准备的列表
currentCritPercentList = []
deltaCritPercentList = []
dynamicCritPercentList = []
noCritStreakCountList = []
isCriticalList = []# 测试 10000 次
for i in range(10000):attackTotalCount += 1isCritical = False# 检查是否连续 9 次未暴击if attackTotalCount > 0:# 计算当前暴击概率currentCritPercent = critTotalCount / attackTotalCount# 计算当前暴击概率与初始暴击率的差值deltaCritPercent = abs(InitCritPercent - currentCritPercent)# 计算动态暴击率if(currentCritPercent > InitCritPercent):dynamicCritPercent -= deltaCritPercentif(currentCritPercent < InitCritPercent):dynamicCritPercent += deltaCritPercent# 检查是否连续 9 次未暴击if noCritStreakCount < 9:percent = random.random()if percent <= dynamicCritPercent:isCritical = TruenoCritStreakCount = 0else:noCritStreakCount += 1else:isCritical = TruenoCritStreakCount = 0if isCritical:critTotalCount += 1# 将数据添加到列表中currentCritPercentList.append(currentCritPercent)deltaCritPercentList.append(deltaCritPercent)dynamicCritPercentList.append(dynamicCritPercent)noCritStreakCountList.append(noCritStreakCount)isCriticalList.append(int(isCritical))# 创建多表格
fig, axs = plt.subplots(2)# 每 100 条数据标注一下
for i in range(0, len(currentCritPercentList), 100):axs[0].annotate(f"{currentCritPercentList[i]:.3f}", (i, currentCritPercentList[i]))# 画出暴击概率数据表格
axs[0].plot(currentCritPercentList, label='Current Crit Percent', color='r')
axs[0].plot(deltaCritPercentList, label='Delta Crit Percent', color='g')
axs[0].plot(dynamicCritPercentList, label='Dynamic Crit Percent', color='b')
axs[0].set_xlabel('Total Attacks')
axs[0].set_ylabel('Probability')
axs[0].legend()# 画出连续未暴击次数的表格
axs[1].plot(noCritStreakCountList, label='No-Crit Streak', color='m')
axs[1].plot(isCriticalList, label='Is Critical', color='c')
axs[1].set_xlabel('Total Attacks')
axs[1].set_ylabel('No-Crit Streak / Is Critical')
axs[1].legend()plt.show()

输出结果如下图所示
累计 目标0.2 次数10 无限制1
前 2000 次 如下
请添加图片描述

可以明显看出动态暴击率在大幅度地反复震荡,并且明显超出了 (0, 1) 的区间;
在震荡的高点时,会出现连续暴击的情况;在震荡的低点时,会出现连续地触发“保底”暴击;
这样虽然能将总体暴击概率稳定在 0.2 左右,但这显然不满足条件 C。

“递增修正”优化

显而易见,当动态暴击率超出 (0, 1) 区间时,就和 0、1 没有区别了
所以可以为它加个简单限幅,例如笔者将动态暴击率的幅度限制在(0.5倍初始暴击率,2倍初始暴击率)之间

# 同上文代码# 测试 10000 次
for i in range(10000):# 同上文代码if attackTotalCount > 0:# 同上文代码# 计算动态暴击率if(currentCritPercent > InitCritPercent):dynamicCritPercent = min(max(dynamicCritPercent - deltaCritPercent, InitCritPercent * 0.5), InitCritPercent * 2)if(currentCritPercent < InitCritPercent):dynamicCritPercent = min(max(dynamicCritPercent + deltaCritPercent, InitCritPercent * 0.5), InitCritPercent * 2)# 检查是否连续 9 次未暴击if noCritStreakCount < 9:# 同上文代码# 同上文代码# 同上文代码

输出结果如下图所示
累计 目标0.2 次数10 限制0.5-2倍1
前 2000 次 如下
请添加图片描述
8000 ~ 10000 次 如下
请添加图片描述

现在的算法已经基本可用了,但还需要多尝试才能找到合适的限幅范围。
当限幅范围过大时,概率的分布会变得不均匀;
限幅范围过小时,又会出现无法逼近目标概率(初始暴击率),比较麻烦。

“递增修正”测试

将上述优化过的算法应用到其他情景中,例如掷硬币,每5次投掷至少有一次正面
初始概率(目标概率) = 0.5

# 同上文代码
InitCritPercent = 0.5
dynamicCritPercent = 0.5
# 同上文代码# 测试 10000 次
for i in range(10000):# 同上文代码# 检查是否连续 4 次未掷出正面if noCritStreakCount < 4:# 同上文代码# 同上文代码# 同上文代码

输出结果如下图所示
累计 目标0.5 次数5 限制0.5-2倍1
前 2000 次 如下
请添加图片描述
8000 ~ 10000 次 如下
请添加图片描述

可以发现出现连续未正面的次数(连续未暴击次数),又在动态概率的波谷处出现“聚拢”现象,这很好理解:因为我们的限幅有些过大了。
总结下来,这种手动限定幅度的方式效率很低还容易出问题…

那么能不能让它根据自身目前状况,如目标概率、总攻击次数等参数,来动态调整 动态暴击率的增量呢?

“镜像修正”

基于以上思考,笔者希望每次攻击的“动态暴击率”是上次“当前暴击概率”关于“初始暴击率”的镜像,通过这种有针对性的“反向”操作,来将最终暴击率逼近目标值。
于是便有如下代码:

# 初始化变量
InitCritPercent = 0.2       # 初始暴击率
dynamicCritPercent = 0.2    # 动态暴击率
# 同上文代码# 测试 10000 次
for i in range(10000):# 同上文代码if attackTotalCount > 0:# 同上文代码# 计算动态暴击率dynamicCritPercent = attackTotalCount * InitCritPercent - (attackTotalCount - 1) * currentCritPercent# 检查是否连续 9 次未暴击if noCritStreakCount < 9:# 同上文代码# 同上文代码# 同上文代码

输出结果如下图所示
反向 目标0.2 次数10 无限制 无限制1
前 2000 次 如下
请添加图片描述
8000 ~ 10000 次 如下
请添加图片描述

虽然能将最终的暴击概率稳定在 0.2,但结果过于平均了!
可以说这种“修正”的操作过于灵敏,导致暴击的分布非常均匀,甚至没有出现连续 9 次以上的未暴击。但这仍不是我们想要的,需要继续优化。

“镜像修正”优化

笔者发现,这种“过于均匀”的分布情况也是因为每次修正幅度过大导致的。
现在要调整这个幅度会比“递增修正”的方法容易很多,只需要让“计算动态暴击率”的结果乘以一个较小的系数即可。

这个系数需要与当前的状态有关,并且是一个越来越小的值。
而在攻击次数越来越多时,currentCritPercent 也会越来越逼近 InitCritPercent 的值,所以 deltaCritPercent 会随着攻击次数的增多越来越小;
(又因为 currentCritPercent 趋向于一个比 InitCritPercent 偏大的值,那么 deltaCritPercent 也会永不为 0)
这里我们就用 deltaCritPercent 来作为系数,目前来看刚好合适。

# 同上文代码# 计算动态暴击率dynamicCritPercent = (attackTotalCount * (InitCritPercent - currentCritPercent) + currentCritPercent) * deltaCritPercent# 同上文代码

输出结果如下图所示
反向 目标0.2 次数10 倍率差值 无限制1
前 2000 次 如下
请添加图片描述
8000 ~ 10000 次 如下
请添加图片描述

由于对每次的 dynamicCritPercent 的幅度都做了差不多的限制,可以看到图二中,在前 1000 次左右攻击时,currentCritPercent 逼近目标值的速度很慢。
啧,还差一点…

继续优化!既然 deltaCritPercent 会随着攻击次数增多变得越来越小,那么我们不妨直接将它放大。

# 同上文代码# 计算动态暴击率dynamicCritPercent = (attackTotalCount * (InitCritPercent - currentCritPercent) + currentCritPercent) * pow(deltaCritPercent, 0.5)# 同上文代码

输出结果如下图所示
反向 目标0.2 次数10 倍率差值开平方 无限制1
前 2000 次 如下
请添加图片描述
8000 ~ 10000 次 如下
请添加图片描述

以上结果已经基本符合预期。

“镜像修正”测试

掷硬币

下面还是用硬币的例子:掷硬币,每5次投掷至少有一次正面
初始概率(目标概率) = 0.5

# 同上文代码
InitCritPercent = 0.5
dynamicCritPercent = 0.5
# 同上文代码# 测试 10000 次
for i in range(10000):# 同上文代码# 检查是否连续 4 次未掷出正面if noCritStreakCount < 4:# 同上文代码# 同上文代码# 同上文代码

输出结果如下图所示
反向 目标0.5 次数5 倍率差值开平方 无限制1
前 2000 次 如下
请添加图片描述
8000 ~ 10000 次 如下
请添加图片描述

也基本符合预期。

掷骰子

再以掷骰子为例:每掷出 15 次至少有一次是 点数 1。

# 同上文代码
InitCritPercent = 0.166667
dynamicCritPercent = 0.166667
# 同上文代码# 测试 10000 次
for i in range(10000):# 同上文代码# 检查是否连续 14 次未掷出正面if noCritStreakCount < 14:# 同上文代码# 同上文代码# 同上文代码

输出结果如下图所示
反向 目标0.166667 次数15 倍率差值开平方 无限制1
前 2000 次 如下
请添加图片描述
8000 ~ 10000 次 如下
请添加图片描述

稳定发挥。

优化

目前“镜像修正”算法已经基本可用了,但是虽然叫“镜像”,却已经没有了镜像当初的样子。

不如就直接改名叫“动态平衡概率”算法好了…

算法优化

细心的朋友应该会发现,这套算法在一开始的概率会低于目标概率一些,并且逼近的速度还是慢了些。后期稳定性也没有想象中的高。

笔者目前能想到的继续优化的方式有三种:

1.分段修改 deltaCritPercent 的开根,类似LOD模型替换的感觉;
2.用 log 函数做系数,然后当次数达到一定值时直接 * deltaCritPercent 就可以了;
3.按目标概率的比例,给“总攻击次数”和“总暴击次数”设置较大的初始值。这样不用给 deltaCritPercent 开平方,就能得到一个较为满意的结果,也会相对高效一些。

笔者还没来得及测试性能,如果后续有相关优化会修改本文章,或者发一篇新文章。

关于判断次数

我们感觉到的小概率事件发生的概率通常在 5% 或 1% 以下,通过这两个标准,我们可以很轻松地得出“目标概率为 X 时,操作 N 次至少出现一次目标事件”中的N:

def find_optimal_N(p):# 从 1 到 500for i in range(1, 501):if(1 - p) ** i <= 0.05:return iprint(find_optimal_N(0.2))
print(find_optimal_N(0.5))
print(find_optimal_N(0.166667))# 输出结果为:
# 14
# 5
# 17

所以当目标概率为 0.2、0.5、0.166667 时,N 比较合适的值为 14、5、17。
当目标概率小于 0.05 时,可以让if(1 - p) ** i <= 0.01:,或者更小。

结语

虽然本算法目前还有待优化,但已经足够应对一些游戏场景。
关于那多出的2.5%的问题,笔者会继续探索,直到找到满意的答案。

如果这篇文章能为你解决问题或带来新的启发,那我会感到非常荣幸!

对于已经在这个领域有丰富经验的大佬们,非常欢迎你们的建议或批评。这不仅能帮助我改进,也能让这篇文章更加完善,从而帮助到更多的人。

感谢你抽出宝贵的时间来阅读这篇文章,如果你觉得有用,也请不吝分享给更多需要的人。

再次感谢,期待我们在知识的海洋里再次相遇!

相关文章:

游戏中的随机——“动态平衡概率”算法

前言 众所周知计算机模拟的随机是伪随机&#xff0c;但在结果看来依然和现实中的随机差别不大。 例如掷硬币&#xff0c;连续掷很多很多次之后&#xff0c;总有连续七八十来次同一个面朝上的情况出现&#xff0c;计算机中一般的随机函数也能很好模拟这一点。 但在游戏中&…...

AUTOSAR汽车电子嵌入式编程精讲300篇-基于 FIFO 和优先级序列 CAN 总线系统(续)

目录 4.1.2 理想模型的 FIFO 序列分析 4.2 仅有一个缓冲区的模型的可调度性分析...

C# InformativeDrawings 生成素描画

效果 项目 下载 可执行程序exe下载 源码下载...

关于网络协议的若干问题(一)

1、当网络包到达一个网关的时候&#xff0c;可以通过路由表得到下一个网关的 IP 地址&#xff0c;直接通过 IP 地址找就可以了&#xff0c;为什么还要通过本地的 MAC 地址呢&#xff1f; 答&#xff1a;IP报文端到端的传输过程中&#xff0c;在没有NAT情况下&#xff0c;目的地…...

电脑重做系统---win10

电脑重做系统---win10 前言制作启动U盘材料方法打开网址下载启动盘制作工具参照官方说明进行制作使用U盘重做系统 常用软件官网地址 前言 记得最早学习装电脑还是04年左右&#xff0c;最为一个啥也不知道的大一傻白胖&#xff0c;花了几百大洋在电脑版把了个“电脑组装与维修”…...

HTML基础入门02

目录 1.格式化标签 2.图片标签: img 3.超链接标签: a 4.综合案例: 展示博客2 5.表格标签 5.1基本使用 5.2合并单元格 6.列表标签 1.格式化标签 加粗&#xff1a;strong标签和b标签 倾斜&#xff1a;em标签和i标签 删除线&#xff1a;del标签和s标签 下划线&#xff1a;i…...

【C++】如何使用RapidXML读取和创建XML文件

2023年10月11日&#xff0c;周三下午 目录 RapidXML的官网使用rapidXML读取XML文件中的元素的属性和值此次要读取的XML文件&#xff1a;ReadExample.xml用于读取此XML文件的C代码运行结果使用rapidXML创建XML文件用于创建XML文件的C代码 如果上面的代码无法运行运行结果​编辑…...

《UnityShader入门精要》学习3

笛卡尔坐标系&#xff08;Cartesian Coordinate System&#xff09; 二维笛卡儿坐标系 一个二维的笛卡儿坐标系包含了两个部分的信息&#xff1a; 一个特殊的位置&#xff0c;即原点&#xff0c;它是整个坐标系的中心。两条过原点的互相垂直的矢量&#xff0c;即x轴和y轴。这…...

使用Python将MP4视频转换为图像

介绍&#xff1a; 在计算机视觉和机器学习领域&#xff0c;我们经常需要处理视频数据。有时候&#xff0c;我们可能需要将视频转换为图像序列&#xff0c;以便进行后续的分析和处理。本文将介绍如何使用Python和OpenCV库将MP4视频文件转换为图像序列。 步骤&#xff1a; 导入…...

【Vue Router 3】入门

简介 Vue Router让SPA&#xff08;Single-page Application&#xff09;的构建更加容易。 Vue Router的功能&#xff1a; 嵌套的路由/视图映射模块化的、基于组件的router配置route params, query, wildcards由Vue过渡系统支持的视图过渡效果细粒度&#xff08;fine-grained…...

SpringMVC中@RequestMapping注解的详细说明

RequestMapping 是Spring MVC中一个用于映射HTTP请求和控制器方法之间关系的注解。它用于定义控制器方法如何响应特定的HTTP请求&#xff0c;包括GET、POST、PUT、DELETE等。以下是RequestMapping注解的详细说明&#xff1a; 基本用法&#xff1a; RequestMapping("/examp…...

Java - 发送 HTTP 请求的及其简单的方法模块 - hutool

目录 一、POST 传递简单的字符串内容 .body(params)二、POST 传递 Json 数据&#xff0c;以表单类型传递 .form(params)二、POST 传递 Json 数据&#xff0c;以表单类型传递 .form(params) 和 .body(params) 方法效果等效的思路四、传统接口带 token 验证的代码模板参考链接 一…...

Nie et al. 2010 提出的不等式定理

这里写自定义目录标题 定理 定理 For any vector a a a and b b b, we have ∥ a ∥ 2 − ∥ a ∥ 2 2 2 ∥ b ∥ 2 ≤ ∥ b ∥ 2 − ∥ b ∥ 2 2 2 ∥ b ∥ 2 \|a\|_{2} - \frac{\|a\|_{2}^{2}}{2\|b\|_{2}} \leq \|b\|_{2} - \frac{\|b\|_{2}^{2}}{2\|b\|_{2}} ∥a∥2​−…...

chatGLM2-6B模型LoRA微调数据集实现大模型的分类任务

【TOC】 1.chatglm介绍 ChatGLM 模型是由清华大学开源的、支持中英双语问答的对话语言模型,并针对中文进行了优化。该模型基于 General Language Model(GLM)架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署。 ChatGLM 具备以下特点: 充…...

Elasticsearch6实践

目录 目录 一、需求 二、ES索引设计 三、页面搜索条件 四、ES的分页搜索DSL语句 五、其他 一、需求 公告列表&#xff0c;需要支持以下搜索 1、根据文本输入&#xff0c;模糊搜索公告标题和公告正文。 2、支持公告类型搜索&#xff0c;单选 3、支持根据公告所在省市区搜…...

云原生Kubernetes:K8S集群版本升级(v1.20.6 - v1.20.15)

目录 一、理论 1.K8S集群升级 2.集群概况 3.升级集群 4.验证集群 二、实验 1.升级集群 2.验证集群 三、问题 1.给node1节点打污点报错 一、理论 1.K8S集群升级 &#xff08;1&#xff09;概念 搭建K8S集群的方式有很多种&#xff0c;比如二进制&#xff0c;kubeadm…...

毅速丨3D打印随形水路模具日常如何保养

3D打印随形水路的蜿蜒曲折甚至细微水路&#xff0c;使得其容易发生堵塞并难以清洗&#xff0c;一旦堵塞将对生产带来不小的影响。事实上&#xff0c;堵塞的发生是逐步发展的&#xff0c;所以在生产过程中应注意监控&#xff0c;一旦发现冷却效果下降应及时检查。以下是一些防患…...

尚品甄选2023全新SpringBoot+SpringCloud企业级微服务项目

最适合新手入门的SpringBootSpringCloud企业级微服务项目来啦&#xff01;如果你已经学习了Java基础、SSM框架、SpringBoot、SpringCloud&#xff0c;想找一个项目来实战练习&#xff1b;或者你刚刚入行&#xff0c;需要可以写到简历中的微服务架构项目&#xff01; 项目采用前…...

204、RabbitMQ 之 使用 topic 类型的 Exchange 实现通配符路由

目录 ★ 使用topic实现通配符路由代码演示topic通配符类型的Exchange代码演示:ConstantUtilConnectionUtilProducerConsumer01执行结果生产者消费者01消费者02 完整代码&#xff1a;ConstantUtilConnectionUtilProducerConsumer01Consumer02pom.xml ★ 使用topic实现通配符路由…...

qq视频录制教程,让你的视频更加精彩

“qq视频可以录制吗&#xff1f;浏览qq的时候发现一段有趣的视频&#xff0c;点击下载却一直显示失败&#xff0c;朋友叫我把视频录制下来&#xff0c;但是我不知道怎么操作&#xff0c;想问问大家&#xff0c;有没有办法录制qq的视频。” 在信息化的时代&#xff0c;通过视频…...

(滑动窗口) 76. 最小覆盖子串 ——【Leetcode每日一题】

❓76. 最小覆盖子串 难度&#xff1a;困难 给你一个字符串 s 、一个字符串 t 。返回 s 中涵盖 t 所有字符的最小子串。如果 s 中不存在涵盖 t 所有字符的子串&#xff0c;则返回空字符串 "" 。 注意&#xff1a; 对于 t 中重复字符&#xff0c;我们寻找的子字符串…...

grep批量筛选指定目录下的所有日志并写入文件内

背景&#xff1a;在指定目录下&#xff0c;该目录下有上百个日志文件&#xff0c;这些文件以.log结尾 需求&#xff1a;遍历这些日志文件&#xff0c;对每个日志文件进行grep筛选&#xff0c;筛选出包含namexxx和 "server_port":"8088"的内容&#xff0c;并…...

JVM第三讲:JVM 基础-字节码的增强技术详解

JVM 基础-字节码的增强技术详解 本文是JVM第三讲&#xff0c;JVM 基础-字节码的增强技术。在上文中&#xff0c;着重介绍了字节码的结构&#xff0c;这为我们了解字节码增强技术的实现打下了基础。字节码增强技术就是一类对现有字节码进行修改或者动态生成全新字节码文件的技术…...

JWT前后端分离在项目中的应用

14天阅读挑战赛当你累了&#xff0c;要学会休息&#xff0c;而不是放弃&#xff01; 目录 一、JWT简介 1.1 什么是JWT 1.2 为什么要使用JWT&#xff0c;与session的区别 1.3 JWT组成及工作原理和流程 二、JWT工具类解析 2.1 生成JWT 2.2 解析oldJwt 2.3 复制JWT并延时…...

系统架构师备考倒计时23天(每日知识点)Redis篇

Redis篇 1.Redis与Memcache能力对比 工作MemCacheRedis数据类型简单 key/value 结构丰富的数据结构持久性不支持支持分布式存储客户端哈希分片/一致性哈希多种方式&#xff0c;主从、Sentinel、Cluster 等多线程支持支持支持(Redis5.0及以前版本不支持)内存管理私有内存池/内…...

WIN11系统设置重启与睡眠唤醒后自动拨号

文章目录 1. win x快捷键后选择计算机管理2. 编辑名称3. 选择计算机启动时4. 启动程序5. 输入脚本6. 勾选选项7. 填写配置8. 新建触发器9. 设置触发器10. 确定之后完成创建 1. win x快捷键后选择计算机管理 在任务计划程序中创建基本任务 2. 编辑名称 3. 选择计算机启动时 4…...

【【萌新的SOC学习之AXI-DMA环路测试】】

萌新的SOC学习之AXI-DMA环路测试 AXI DMA环路测试 DMA(Direct Memory Access&#xff0c;直接存储器访问)是计算机科学中的一种内存访问技术。它允许某些计算机内部的硬件子系统可以独立地直接读写系统内存&#xff0c;而不需中央处理器&#xff08;CPU&#xff09;介入处理。…...

Lua教程

Lua教程(简单易懂)-CSDN博客 博客相关解释&#xff1a; 5、循环 a {"a", "b"}for i, v in ipairs(a) doprint(i, v)end 代码创建了一个名为 a 的数组&#xff0c;并使用 ipairs 迭代这个数组的元素。运行结果显示了每个元素的索引&#xff08;下标&am…...

《Node.js+Express+MongoDB+Vue.js全栈开发实战》简介

今天介绍的这本书是《Node.jsExpressMongoDBVue.js全栈开发实战》。该书由清华大学出版社于2023年1月出版 外观 从书名故名思议&#xff0c;就是基于Node.jsExpressMongoDBVue.js来实现企业级应用全栈开发。 封面风格比较简约&#xff0c;插图是一张类似于罗马时代战车形象&…...

多输入多输出 | MATLAB实现CNN-BiGRU-Attention卷积神经网络-双向门控循环单元结合SE注意力机制的多输入多输出预测

多输入多输出 | MATLAB实现CNN-BiGRU-Attention卷积神经网络-双向门控循环单元结合SE注意力机制的多输入多输出预测 目录 多输入多输出 | MATLAB实现CNN-BiGRU-Attention卷积神经网络-双向门控循环单元结合SE注意力机制的多输入多输出预测预测效果基本介绍程序设计往期精彩参考…...

阿里云r7服务器内存型CPU采用

阿里云服务器ECS内存型r7实例是第七代内存型实例规格族&#xff0c;CPU采用第三代Intel Xeon可扩展处理器&#xff08;Ice Lake&#xff09;&#xff0c;基频2.7 GHz&#xff0c;全核睿频3.5 GHz&#xff0c;计算性能稳定&#xff0c;CPU内存比1:8&#xff0c;2核16G起步&#…...

Godot2D角色导航-自动寻路教程(Godot设置导航代理的目标位置)

文章目录 创建导航NavigationAgent2D节点设置目标位置其他文章 创建导航 首先&#xff0c;创建一个基本的场景&#xff0c;下面的文章讲解了如何创建一个基本的导航场景&#xff0c;点击如下链接前往该文章&#xff1a; Godot2D角色导航-自动寻路教程 NavigationAgent2D节点 …...

R语言实现向量自回归和误差修正模型——附实战代码

大家好&#xff0c;我是带我去滑雪&#xff01; 向量自回归&#xff08;VAR&#xff09;模型和误差修正模型&#xff08;ECM&#xff09;是时间序列分析中常用的两种模型&#xff0c;它们用于研究多个变量之间的动态关系。VAR 模型适用于研究多个相关变量之间的相互影响和动态关…...

原理:用UE5制作一个2D游戏

选中资产图片右键--Sprite Actions--Apply Paper2D Texture Settings 制作场景 把它丢到场景里&#xff0c;并把坐标归零 创建图块集tileset 打开新建的tile set&#xff0c;根据最小图块设置最小尺寸单元 选择需要的图块单元&#xff0c;add box 对新建的tile set右键创建til…...

【ARM 嵌入式 编译系列 11.3 -- GCC attribute packed noreturn constructor 介绍】

文章目录 GCC 的 __attribute__ 是一个编译器扩展特性,允许开发者在源代码中设置函数属性(function attributes)、变量属性(variable attributes)和类型属性(type attributes)。这些属性可以影响函数、变量或类型的行为。 以下是一些常见的 __attribute__ 属性: __at…...

主从Reactor高并发服务器

文章目录 Reactor模型的典型分类单Reactor单线程单Reactor多线程多Reactor多线程本项目中实现的主从Reactor One Thread One Loop各模型的优点与缺点 项目分解Reactor服务器模块BufferSocketChannelEpollerTimerWheelEventLoopAnyConnectionAcceptorLoopThreadLoopThreadPoolTc…...

文心一言Plugin实战来了,测试开发旅游攻略助手

刚刚过去的8月&#xff0c;百度WAVE SUMMIT 深度学习开发者大会上&#xff0c;重磅发布文心一言的五个原生插件&#xff1a;百度搜索、览卷文档&#xff08;基于文档的交互&#xff09;、E 言易图&#xff08;数据洞察图表生成&#xff09;、说图解画&#xff08;基于图片的交互…...

微服务13-Seata的四种分布式事务模式

文章目录 XA模式实现XA模式 AT模式AT模式的脏写问题&#xff08;对同数据并发写的问题&#xff09;其他事务不获取全局锁的一个情况&#xff08;AT模式写隔离的实现&#xff09;实现AT模式 TCC模式TCC实现我们怎么样去判断是否空回滚和业务悬挂&#xff1f;业务分析 Saga模式总…...

C结构体内定义结构体,不能直接赋值。

现像&#xff1a; 如下代码&#xff1a; 头文件&#xff1a; typedef struct aBlinkGpioPinOutAbst_{void (*initAsOutput)(void);void (*high)(void);void (*low)(void); }aBlinkGpioPinOutAbst;typedef struct aBlinkGpioAbst_{ #if GPIO_CONFIG_PA0 GPIO_CONFIG_AS_OUTPU…...

PHP遇见错误了看不懂?这些错误提示你必须搞懂

&#x1f3ac; 鸽芷咕&#xff1a;个人主页 &#x1f525; 个人专栏:《速学数据结构》 《C语言进阶篇》 ⛺️生活的理想&#xff0c;就是为了理想的生活! 文章目录 一、错误分类二、系统错误&#xff1a;2.1 编译错误2.2 致命错误2.3 警告错误2.4 通知错误 三、用户错误3.1 错…...

微信小程序备案流程操作详解

1、2023年9月1号小程序开始必须备案了,各位小程序商城只需要按流程自主去微信小程序后台操作即可; 2、对未上架的微信小程序,从2023年9月1号开始需先备案才能上架; 3、对存量已上架的小程序,需在2024年3月31号前完成备案即可。逾期未完成备案,平台将按照备案相关规定于…...

【100天精通Python】Day70:Python可视化_绘制不同类型的雷达图,示例+代码

目录 1. 基本雷达图 2. 多组数据的雷达图 3 交互式雷达地图 4 动态雷达图 0 雷达图概述 雷达图&#xff08;Radar Chart&#xff09;&#xff0c;也被称为蜘蛛图&#xff08;Spider Chart&#xff09;或星型图&#xff0c;是一种用于可视化多维数据的图表类型。雷达图通常由…...

KY258 日期累加

KY258 日期累加 int main() {int n 0; //样例个数cin >> n;//for循环处理n个样例for (int i 0; i < n; i){int y, m, d, num;int days[12] { 31,28,31,30,31,30,31,31,30,31,30,31 };//输入年月日 要加的天数cin >> y >> m >> d >>…...

基于CodeFormer实现图片模糊变清晰,去除马赛克等效果

前言 CodeFormer是一种基于AI技术深度学习的人脸复原模型&#xff0c;由南洋理工大学和商汤科技联合研究中心联合开发。该模型通过结合了VQGAN和Transformer等技术&#xff0c;可以通过提供模糊或马赛克图像来生成清晰的原始图像。可以实现老照片修复、照片马赛克修复、黑白照…...

Docker【部署 05】docker使用tensorflow-gpu安装及调用GPU踩坑记录

tensorflow-gpu安装及调用GPU踩坑记录 1.安装tensorflow-gpu2.Docker使用GPU2.1 Could not find cuda drivers2.2 was unable to find libcuda.so DSO2.3 Could not find TensorRT&&Cannot dlopen some GPU libraries2.4 Could not create cudnn handle: CUDNN_STATUS_…...

前后端分离中,前端请求和后端接收请求格式总结

get请求可以携带的参数 1&#xff09;前端&#xff1a;传统键值对(http:xx?a1&b1) <--> 后端&#xff1a;RequestParam("a") int a , RequestParam("b") int b 2&#xff09;前端&#xff1a;(http:xx/a/b) <--> 后端&#xff1a;Reque…...

pytorch的基本运算,是不是共享了内存,有没有维度变化

可以把PyTorch简单看成是Python的深度学习第三方库&#xff0c;在PyTorch中定义了适用于深度学习的基本数据结构——张量&#xff0c;以及张量的各类计算。其实也就相当于NumPy中定义的Array和对应的科学计算方法&#xff0c;正是这些基本数据类型和对应的方法函数&#xff0c;…...

Visual Studio 2022新建项目时没有ASP.NET项目

一、Visual Studio 2022新建项目时没有ASP.NET项目 1、打开VS开发工具&#xff0c;选择工具菜单&#xff0c;点击“获取工具和功能” 2、选择“ASP.NET和Web开发”和把其他项目模板&#xff08;早期版本&#xff09;勾选上安装即可...

nuiapp项目实战:导航栏动态切换效果实践案例树

测试软件的百忙之中去进行软件开发的工作&#xff0c;开展开发软件的工作事情&#xff0c;也真是繁忙至极点的了。 不到一刻钟的课程内容&#xff0c;个人用了三次去写串联的知识点&#xff0c;然后这是第三次&#xff0c;还是第四次了才完全写出来一个功能的效果。 一刻钟的功…...

【机器学习】集成学习(以随机森林为例)

文章目录 集成学习随机森林随机森林回归填补缺失值实例&#xff1a;随机森林在乳腺癌数据上的调参附录参数 集成学习 集成学习&#xff08;ensemble learning&#xff09;是时下非常流行的机器学习算法&#xff0c;它本身不是一个单独的机器学习算法&#xff0c;而是通过在数据…...