信息论基础第二章部分习题
2.5
证明若H(Y|X)=0,则Y是X的函数
若 H ( Y ∣ X ) = 0 H(Y|X) = 0 H(Y∣X)=0,意味着在已知 X X X 的条件下, Y Y Y 的不确定性为零,即给定 X X X 的值,我们完全确定了 Y Y Y 的值。这表明 Y Y Y 的取值完全由 X X X 决定,因此 Y Y Y 是 X X X 的确定性函数。
证明思路如下:
假设 H ( Y ∣ X ) = 0 H(Y|X) = 0 H(Y∣X)=0,即 Y Y Y 在已知 X X X 的条件下没有不确定性。这意味着对于每个可能的 x x x 值,我们都可以唯一地确定 Y Y Y 的值。我们可以表示这一点如下:
∀ x , ∃ y : P ( Y = y ∣ X = x ) = 1 \forall x, \exists y: P(Y = y|X = x) = 1 ∀x,∃y:P(Y=y∣X=x)=1
这表示对于任何 x x x,都存在一个唯一的 y y y,使得在给定 X = x X = x X=x 的情况下, Y Y Y 必然等于 y y y。
因此,我们可以得出结论, Y Y Y 是 X X X 的确定性函数,因为 X X X 的每个可能取值都能唯一地确定 Y Y Y 的取值,没有不确定性。
2.6
条件互信息与无条件互信息。试给出联合随机变量X,Y和Z的例子,使得
(a)I(X;Y|Z)<I(X;Y)
(b)I(X;Y|Z)>I(X;Y)
(a) 一个例子,满足 I ( X ; Y ∣ Z ) < I ( X ; Y ) I(X;Y|Z) < I(X;Y) I(X;Y∣Z)<I(X;Y):
考虑三个二进制随机变量 X、Y 和 Z,它们的联合概率分布如下:
- P(X=0, Y=0, Z=0) = 1/8
- P(X=0, Y=0, Z=1) = 1/8
- P(X=0, Y=1, Z=0) = 1/8
- P(X=0, Y=1, Z=1) = 1/8
- P(X=1, Y=0, Z=0) = 1/8
- P(X=1, Y=0, Z=1) = 1/8
- P(X=1, Y=1, Z=0) = 0
- P(X=1, Y=1, Z=1) = 1/4
现在,我们来计算条件互信息和互信息:
- I ( X ; Y ∣ Z ) = H ( X ∣ Z ) − H ( X ∣ Y , Z ) = ( 1 / 2 ) − ( 1 / 2 ) = 0 I(X;Y|Z) = H(X|Z) - H(X|Y, Z) = (1/2) - (1/2) = 0 I(X;Y∣Z)=H(X∣Z)−H(X∣Y,Z)=(1/2)−(1/2)=0
- I ( X ; Y ) = H ( X ) − H ( X ∣ Y ) = 1 − ( 1 / 2 ) = 1 / 2 I(X;Y) = H(X) - H(X|Y) = 1 - (1/2) = 1/2 I(X;Y)=H(X)−H(X∣Y)=1−(1/2)=1/2
所以,我们得到 I ( X ; Y ∣ Z ) = 0 < 1 / 2 = I ( X ; Y ) I(X;Y|Z) = 0 < 1/2 = I(X;Y) I(X;Y∣Z)=0<1/2=I(X;Y)。
(b) 一个例子,满足 I ( X ; Y ∣ Z ) > I ( X ; Y ) I(X;Y|Z) > I(X;Y) I(X;Y∣Z)>I(X;Y):
考虑三个二进制随机变量 X、Y 和 Z,它们的联合概率分布如下:
- P(X=0, Y=0, Z=0) = 1/4
- P(X=0, Y=0, Z=1) = 0
- P(X=0, Y=1, Z=0) = 0
- P(X=0, Y=1, Z=1) = 0
- P(X=1, Y=0, Z=0) = 0
- P(X=1, Y=0, Z=1) = 1/4
- P(X=1, Y=1, Z=0) = 0
- P(X=1, Y=1, Z=1) = 1/2
现在,我们来计算条件互信息和互信息:
- I ( X ; Y ∣ Z ) = H ( X ∣ Z ) − H ( X ∣ Y , Z ) = ( 1 / 2 ) − ( 1 / 2 ) = 0 I(X;Y|Z) = H(X|Z) - H(X|Y, Z) = (1/2) - (1/2) = 0 I(X;Y∣Z)=H(X∣Z)−H(X∣Y,Z)=(1/2)−(1/2)=0
- I ( X ; Y ) = H ( X ) − H ( X ∣ Y ) = 1 − ( 1 / 2 ) = 1 / 2 I(X;Y) = H(X) - H(X|Y) = 1 - (1/2) = 1/2 I(X;Y)=H(X)−H(X∣Y)=1−(1/2)=1/2
所以,我们得到 I ( X ; Y ∣ Z ) = 0 < 1 / 2 = I ( X ; Y ) I(X;Y|Z) = 0 < 1/2 = I(X;Y) I(X;Y∣Z)=0<1/2=I(X;Y)。
在这两个例子中,我们找到了满足条件 I ( X ; Y ∣ Z ) < I ( X ; Y ) I(X;Y|Z) < I(X;Y) I(X;Y∣Z)<I(X;Y) 和 I ( X ; Y ∣ Z ) > I ( X ; Y ) I(X;Y|Z) > I(X;Y) I(X;Y∣Z)>I(X;Y) 的概率分布。这突显了信息论中条件互信息和互信息的性质,它们可以根据概率分布的不同而变化。
2.12
联合熵的例子。设p(x,y)由2右表给出,试计算
X\Y | 0 | 1 |
---|---|---|
0 | 1/3 | 1/3 |
1 | 0 | 1/3 |
(a)H(X),H(Y)
(b)H(X|Y),H(Y|X)
(c )H(X,Y)
(d)H(Y)-H(Y|X)
(e)I(X;Y)
(f)画出(a)~(e)中所有量的文氏图
( a ) H ( X ) = 2 3 l o g 3 2 + 1 3 l o g 3 = 0.918 b i t s = H ( Y ) H(X)=\frac{2}{3}log\frac{3}{2}+\frac{1}{3}log3=0.918bits=H(Y) H(X)=32log23+31log3=0.918bits=H(Y)
( b ) H ( X ∣ Y ) = 1 3 H ( X ∣ Y = 0 ) + 2 3 H ( X ∣ Y = 1 ) = 0.667 b i t s = H ( Y ∣ X ) H(X|Y)=\frac{1}{3}H(X|Y=0)+\frac{2}{3}H(X|Y=1)=0.667bits=H(Y|X) H(X∣Y)=31H(X∣Y=0)+32H(X∣Y=1)=0.667bits=H(Y∣X)
( c ) H ( X , Y ) = 3 × 1 3 l o g 3 = 1.585 b i t s H(X,Y)=3×\frac{1}{3}log3=1.585bits H(X,Y)=3×31log3=1.585bits
( d ) H ( Y ) − H ( Y ∣ X ) = 0.251 b i t s H(Y)-H(Y|X)=0.251bits H(Y)−H(Y∣X)=0.251bits
( e ) I ( X ; Y ) = H ( Y ) − H ( Y ∣ X ) = 0.251 b i t s I(X;Y)=H(Y)-H(Y|X)=0.251bits I(X;Y)=H(Y)−H(Y∣X)=0.251bits
2.14
设随机变量X,Y的取值分别为 x 1 , x 2 , . . . , x r x_1,x_2,...,x_r x1,x2,...,xr和 y 1 , y 2 , . . . , y s y_1,y_2,...,y_s y1,y2,...,ys,设Z=X+Y。
(a)证明 H ( Z ∣ X ) = H ( Y ∣ X ) H(Z|X)=H(Y|X) H(Z∣X)=H(Y∣X),并讨论如果 X , Y X,Y X,Y独立,则 H ( Y ) ≤ H ( Z ) H(Y)≤H(Z) H(Y)≤H(Z)及 H ( X ) ≤ H ( Z ) H(X)≤H(Z) H(X)≤H(Z)。由此说明独立随机变量的和增加不确定度。
(b)给出一个(必须是相关)随机变量例子,使得 H ( X ) > H ( Z ) H(X)>H(Z) H(X)>H(Z)且 H ( Y ) > H ( Z ) H(Y)>H(Z) H(Y)>H(Z)。
(c )在什么条件下, H ( Z ) = H ( X ) + H ( Y ) H(Z)=H(X)+H(Y) H(Z)=H(X)+H(Y)?
(a) Z = X + Y Z=X+Y Z=X+Y。因此 p ( Z = z ∣ X = x ) = p ( Y = z − x ∣ X = x ) p(Z=z|X=x)=p(Y=z-x|X=x) p(Z=z∣X=x)=p(Y=z−x∣X=x)
这是因为在给定 X X X 的条件下, Z Z Z 的取值取决于 Y Y Y 的取值和 X X X 的取值,而 Z Z Z 等于 X + Y X+Y X+Y。所以,我们可以使用条件概率来表示 Z Z Z 在给定 X X X 的条件下的分布。
具体来说,对于任意给定的 x x x 和 z z z,我们有:
p ( Z = z ∣ X = x ) = p ( X + Y = z ∣ X = x ) p(Z=z|X=x) = p(X+Y=z|X=x) p(Z=z∣X=x)=p(X+Y=z∣X=x)
由于 X X X 是已知的,我们可以将 X = x X=x X=x 代入等式中:
p ( Z = z ∣ X = x ) = p ( Y = z − x ∣ X = x ) p(Z=z|X=x) = p(Y=z-x|X=x) p(Z=z∣X=x)=p(Y=z−x∣X=x)
这表示在已知 X = x X=x X=x 的情况下, Z Z Z 的取值 z z z 与 Y Y Y 的取值 z − x z-x z−x 有关。这是因为 Z = X + Y Z=X+Y Z=X+Y 的定义决定了这种关系。因此,我们可以使用条件概率 p ( Y = z − x ∣ X = x ) p(Y=z-x|X=x) p(Y=z−x∣X=x) 来表示 Z Z Z 在给定 X = x X=x X=x 的条件下的分布。
H ( Z ∣ X ) = ∑ p ( x ) H ( Z ∣ X = x ) = − ∑ x p ( x ) ∑ z p ( Z = z ∣ X = x ) l o g p ( Z = z ∣ X = x ) = ∑ x p ( x ) ∑ y p ( Y = z − x ∣ X = x ) l o g p ( Y = z − x ∣ X = x ) = ∑ p ( x ) H ( Y ∣ X = x ) = H ( Y ∣ X ) H(Z|X)=\sum p(x)H(Z|X=x)=-\sum\limits_xp(x)\sum\limits_zp(Z=z|X=x)logp(Z=z|X=x)\\ =\sum\limits_xp(x)\sum\limits_yp(Y=z-x|X=x)logp(Y=z-x|X=x)=\sum p(x)H(Y|X=x)=H(Y|X) H(Z∣X)=∑p(x)H(Z∣X=x)=−x∑p(x)z∑p(Z=z∣X=x)logp(Z=z∣X=x)=x∑p(x)y∑p(Y=z−x∣X=x)logp(Y=z−x∣X=x)=∑p(x)H(Y∣X=x)=H(Y∣X)
让我解释一下你提到的这一步:
H ( Z ∣ X ) = ∑ x p ( x ) H ( Z ∣ X = x ) = − ∑ x p ( x ) ∑ z p ( Z = z ∣ X = x ) log p ( Z = z ∣ X = x ) H(Z|X) = \sum_x p(x) H(Z|X=x) = -\sum_x p(x) \sum_z p(Z=z|X=x) \log p(Z=z|X=x) H(Z∣X)=x∑p(x)H(Z∣X=x)=−x∑p(x)z∑p(Z=z∣X=x)logp(Z=z∣X=x)
这一步是使用了条件熵的定义,首先将 H ( Z ∣ X ) H(Z|X) H(Z∣X) 表示为关于 X X X 的边缘分布的条件熵,然后展开了条件熵的定义,将其写成了一个求和的形式。
= ∑ x p ( x ) ∑ y p ( Y = z − x ∣ X = x ) log p ( Y = z − x ∣ X = x ) = \sum_x p(x) \sum_y p(Y=z-x|X=x) \log p(Y=z-x|X=x) =x∑p(x)y∑p(Y=z−x∣X=x)logp(Y=z−x∣X=x)
接下来,你将 p ( Z = z ∣ X = x ) p(Z=z|X=x) p(Z=z∣X=x) 表示为 p ( Y = z − x ∣ X = x ) p(Y=z-x|X=x) p(Y=z−x∣X=x),这是因为在给定 X = x X=x X=x 的条件下, Z Z Z 的取值是由 Y Y Y 的取值和 X X X 的取值共同决定的,所以你可以用 p ( Y = z − x ∣ X = x ) p(Y=z-x|X=x) p(Y=z−x∣X=x) 来表示它。
= ∑ x p ( x ) H ( Y ∣ X = x ) = \sum_x p(x) H(Y|X=x) =x∑p(x)H(Y∣X=x)
然后,你计算了在给定 X = x X=x X=x 的条件下 Y Y Y 的条件熵 H ( Y ∣ X = x ) H(Y|X=x) H(Y∣X=x)。
最后,你对所有可能的 X X X 的取值求和,得到了 H ( Y ∣ X ) H(Y|X) H(Y∣X),这表示在给定 X X X 的条件下 Y Y Y 的条件熵。
这一步的推导是正确的,它从条件熵的定义出发,逐步展开和简化,最终得到了 H ( Z ∣ X ) H(Z|X) H(Z∣X) 与 H ( Y ∣ X ) H(Y|X) H(Y∣X) 相等的结果。这表明在给定 X X X 的条件下, Z Z Z 和 Y Y Y 的条件不确定性相同。
如果X和Y是独立的,那么 H ( Y ∣ X ) = H ( Y ) H(Y|X)=H(Y) H(Y∣X)=H(Y)。因为 I ( X ; Z ) ≥ 0 I(X;Z)≥0 I(X;Z)≥0,我们可以得到 H ( Z ) ≥ H ( Z ∣ X ) = H ( Y ∣ X ) = H ( Y ) H(Z)≥H(Z|X)=H(Y|X)=H(Y) H(Z)≥H(Z∣X)=H(Y∣X)=H(Y),相似的我们可以证明 H ( Z ) ≥ H ( X ) H(Z)≥H(X) H(Z)≥H(X)
首先,如果 X X X 和 Y Y Y 是独立的,那么 H ( Y ∣ X ) = H ( Y ) H(Y|X) = H(Y) H(Y∣X)=H(Y) 是成立的,这是因为在独立的情况下, Y Y Y 的条件不确定性与 X X X 无关,即在知道 X X X 的情况下,对 Y Y Y 的不确定性没有影响,因此 H ( Y ∣ X ) = H ( Y ) H(Y|X) = H(Y) H(Y∣X)=H(Y)。
现在,让我们讨论 H ( Z ) H(Z) H(Z)、 H ( Z ∣ X ) H(Z|X) H(Z∣X)、 H ( Y ) H(Y) H(Y) 和 H ( X ) H(X) H(X) 之间的关系。由于互信息的非负性质, I ( X ; Z ) ≥ 0 I(X;Z) \geq 0 I(X;Z)≥0,我们可以得到:
H ( Z ) ≥ H ( Z ∣ X ) H(Z) \geq H(Z|X) H(Z)≥H(Z∣X)
这是因为 H ( Z ∣ X ) H(Z|X) H(Z∣X) 是在给定 X X X 的情况下 Z Z Z 的条件熵,而 H ( Z ) H(Z) H(Z) 是 Z Z Z 的边缘熵,根据条件熵的性质,条件熵不会超过边缘熵。
另一方面,由于 X X X 和 Y Y Y 是独立的,我们知道 H ( Y ∣ X ) = H ( Y ) H(Y|X) = H(Y) H(Y∣X)=H(Y)。因此,我们可以将不等式 H ( Z ) ≥ H ( Z ∣ X ) H(Z) \geq H(Z|X) H(Z)≥H(Z∣X) 改写为:
H ( Z ) ≥ H ( Y ) H(Z) \geq H(Y) H(Z)≥H(Y)
这意味着 Z Z Z 的边缘熵不小于 Y Y Y 的熵。
类似地,根据独立性,我们可以得到 H ( Z ) ≥ H ( X ) H(Z) \geq H(X) H(Z)≥H(X),即 Z Z Z 的边缘熵不小于 X X X 的熵。
综上所述,如果 X X X 和 Y Y Y 是独立的,那么可以得出结论: H ( Z ) ≥ H ( Z ∣ X ) = H ( Y ∣ X ) = H ( Y ) H(Z) \geq H(Z|X) = H(Y|X) = H(Y) H(Z)≥H(Z∣X)=H(Y∣X)=H(Y) 和 H ( Z ) ≥ H ( X ) H(Z) \geq H(X) H(Z)≥H(X)。这表示在独立的情况下, Z Z Z 的边缘熵不小于 Y Y Y 和 X X X 的熵。
(b)考虑X和Y的联合概率密度使得
X = − Y = { 1 可能性 1 / 2 0 可能性 1 / 2 X=-Y=\begin{cases} 1 & 可能性1/2 \\ 0 & 可能性1/2 \end{cases} X=−Y={10可能性1/2可能性1/2
那么H(X)=H(Y)=1,而Z=0的概率是1,因此H(Z)=0
(c)我们已知
H ( Z ) ≤ H ( X , Y ) ≤ H ( X ) + H ( Y ) H(Z)≤H(X,Y)≤H(X)+H(Y) H(Z)≤H(X,Y)≤H(X)+H(Y)
因为Z是(X,Y)的函数,H(X,Y)=H(X)+H(Y|X)≤H(X)+H(Y)。
上述不等式反映了信息熵的基本性质,其中 H ( Z ) H(Z) H(Z) 表示随机变量 Z Z Z 的熵, H ( X , Y ) H(X, Y) H(X,Y) 表示随机变量 X X X 和 Y Y Y 的联合熵, H ( X ) H(X) H(X) 和 H ( Y ) H(Y) H(Y) 分别表示随机变量 X X X 和 Y Y Y 的独立熵。
- H ( Z ) ≤ H ( X , Y ) H(Z) \leq H(X, Y) H(Z)≤H(X,Y):
这是由信息熵的定义以及联合熵的性质决定的。信息熵是用来度量随机变量的不确定性的,而联合熵是用来度量多个随机变量一起的不确定性。 H ( Z ) H(Z) H(Z) 表示随机变量 Z Z Z 的不确定性,它是在给定 X X X 和 Y Y Y 的条件下 X + Y X+Y X+Y 的不确定性。因此,根据信息熵的定义, H ( Z ) H(Z) H(Z) 不会大于同时考虑 X X X 和 Y Y Y 的联合不确定性,即 H ( Z ) ≤ H ( X , Y ) H(Z) \leq H(X, Y) H(Z)≤H(X,Y)。
信息熵的定义是用来度量一个随机变量的不确定性的度量。对于一个随机变量 Z Z Z, H ( Z ) H(Z) H(Z) 表示了它的不确定性的度量。现在,假设我们有两个随机变量 X X X 和 Y Y Y,它们可以合并成一个新的随机变量 X + Y X+Y X+Y(这是因为它们的和仍然是一个随机变量)。
- 考虑情况一:我们首先计算随机变量 X + Y X+Y X+Y 的不确定性 H ( Z ) H(Z) H(Z),这表示在不知道 X X X 和 Y Y Y 之间的关系的情况下,我们对 X + Y X+Y X+Y 的不确定性的度量。
- 情况二:现在,我们考虑联合不确定性,即同时考虑 X X X 和 Y Y Y 的联合不确定性 H ( X , Y ) H(X, Y) H(X,Y)。这表示我们已知 X X X 和 Y Y Y 之间的关系,并且在这个关系下考虑它们的联合不确定性。
- 根据信息熵的定义,对于情况一, H ( Z ) H(Z) H(Z) 应该表示 X + Y X+Y X+Y 的不确定性,因为我们不知道它们之间的关系。
- 对于情况二, H ( X , Y ) H(X, Y) H(X,Y) 表示已知 X X X 和 Y Y Y 之间的关系时的联合不确定性。在这种情况下,我们有更多的信息,因为我们知道它们之间的关系,所以联合不确定性可能会降低。
因此, H ( Z ) H(Z) H(Z) 不会大于同时考虑 X X X 和 Y Y Y 的联合不确定性 H ( X , Y ) H(X, Y) H(X,Y),因为在情况一中,我们没有利用关于 X X X 和 Y Y Y 之间的关系的信息,而在情况二中,我们利用了这些信息来计算联合不确定性。这就是为什么可以说 H ( Z ) ≤ H ( X , Y ) H(Z) \leq H(X, Y) H(Z)≤H(X,Y)。
2.11 相关性的度量
设 X 1 X_1 X1与 X 2 X_2 X2同分布,但不一定独立。设
ρ = 1 − H ( X 2 ∣ X 1 ) H ( X 1 ) \rho=1-\frac{H(X_2|X_1)}{H(X_1)} ρ=1−H(X1)H(X2∣X1)
( A )证明 ρ = I ( X 1 ; X 2 ) H ( X 1 ) \rho=\frac{I(X_1;X_2)}{H(X_1)} ρ=H(X1)I(X1;X2)
( B )证明 0 ≤ ρ ≤ 1 0≤\rho≤1 0≤ρ≤1
( C )何时有 ρ = 0 \rho=0 ρ=0
( D )何时有 ρ = 1 \rho=1 ρ=1
(a) ρ = H ( X 1 ) − H ( X 2 ∣ X 1 ) H ( X 1 ) = H ( X 2 ) − H ( X 2 ∣ X 1 ) H ( X 1 ) = I ( X 1 ; X 2 ) H ( X 1 ) \rho=\frac{H(X_1)-H(X_2|X_1)}{H(X_1)}=\frac{H(X_2)-H(X_2|X_1)}{H(X_1)}=\frac{I(X_1;X_2)}{H(X_1)} ρ=H(X1)H(X1)−H(X2∣X1)=H(X1)H(X2)−H(X2∣X1)=H(X1)I(X1;X2)
(B)因为 0 ≤ H ( X 2 ∣ X 1 ) ≤ H ( X 2 ) = H ( X 1 ) 0≤H(X_2|X_1)≤H(X_2)=H(X_1) 0≤H(X2∣X1)≤H(X2)=H(X1)
0 ≤ H ( X 2 ∣ X 1 ) H ( X 1 ) ≤ 1 0≤\frac{H(X_2|X_1)}{H(X_1)}≤1 0≤H(X1)H(X2∣X1)≤1 0 ≤ ρ ≤ 1 0≤\rho ≤1 0≤ρ≤1
(c)当且仅当 I ( X 1 ; X 2 ) = 0 I(X_1;X_2)=0 I(X1;X2)=0,即 X 1 X_1 X1和 X 2 X_2 X2独立
(d)当且仅当 I ( X 1 ; X 2 ) = 1 I(X_1;X_2)=1 I(X1;X2)=1,即 X 1 X_1 X1和 X 2 X_2 X2互为对方的函数
2.25
I ( X ; Y ; Z ) = I ( X ; Y ) − I ( X ; Y ∣ Z ) = I ( X ; Y ) − ( I ( X ; Y , Z ) − I ( X ; Z ) ) = I ( X ; Y ) + I ( X ; Z ) − I ( X ; Y , Z ) I(X;Y;Z)=I(X;Y)-I(X;Y|Z)=I(X;Y)-(I(X;Y,Z)-I(X;Z))=I(X;Y)+I(X;Z)-I(X;Y,Z) I(X;Y;Z)=I(X;Y)−I(X;Y∣Z)=I(X;Y)−(I(X;Y,Z)−I(X;Z))=I(X;Y)+I(X;Z)−I(X;Y,Z)
这是基于信息论中的互信息(Mutual Information)和条件互信息(Conditional Mutual Information)的性质得出的等式。让我解释一下每一步是如何得出的:
首先,这个等式是互信息和条件互信息的定义和性质的应用。
- I ( X ; Y ; Z ) I(X;Y;Z) I(X;Y;Z) 是指随机变量 X、Y 和 Z 之间的互信息。它可以表示为 I ( X ; Y ; Z ) = I ( X ; Y ) − I ( X ; Y ∣ Z ) I(X;Y;Z) = I(X;Y) - I(X;Y|Z) I(X;Y;Z)=I(X;Y)−I(X;Y∣Z)。
- I ( X ; Y ∣ Z ) I(X;Y|Z) I(X;Y∣Z) 是给定 Z 条件下 X 和 Y 之间的条件互信息。所以, I ( X ; Y ; Z ) = I ( X ; Y ) − I ( X ; Y ∣ Z ) I(X;Y;Z) = I(X;Y) - I(X;Y|Z) I(X;Y;Z)=I(X;Y)−I(X;Y∣Z) 表示了在已知 Z 的情况下,X 和 Y 之间的互信息减去了条件互信息。
- 接下来,我们使用条件互信息的定义: I ( X ; Y ∣ Z ) = I ( X ; Y , Z ) − I ( X ; Z ) I(X;Y|Z) = I(X;Y,Z) - I(X;Z) I(X;Y∣Z)=I(X;Y,Z)−I(X;Z),将 I ( X ; Y ∣ Z ) I(X;Y|Z) I(X;Y∣Z) 展开为 I ( X ; Y , Z ) − I ( X ; Z ) I(X;Y,Z) - I(X;Z) I(X;Y,Z)−I(X;Z)。
-
将这个表达式代入第一步的等式中,我们得到 I ( X ; Y ; Z ) = I ( X ; Y ) − ( I ( X ; Y , Z ) − I ( X ; Z ) ) I(X;Y;Z) = I(X;Y) - (I(X;Y,Z) - I(X;Z)) I(X;Y;Z)=I(X;Y)−(I(X;Y,Z)−I(X;Z))。
-
最后,重新排列项,得到 I ( X ; Y ; Z ) = I ( X ; Y ) + I ( X ; Z ) − I ( X ; Y , Z ) I(X;Y;Z) = I(X;Y) + I(X;Z) - I(X;Y,Z) I(X;Y;Z)=I(X;Y)+I(X;Z)−I(X;Y,Z)。
这个等式的含义在于,X、Y 和 Z 之间的互信息可以分解成两个独立部分:X 和 Y 之间的互信息以及 X 和 Z 之间的互信息,减去 X、Y 和 Z 三者之间的联合互信息。这种分解可以在信息论中的各种应用中很有用,帮助理解信息的流动和依赖关系。
相关文章:
信息论基础第二章部分习题
2.5 证明若H(Y|X)0,则Y是X的函数 若 H ( Y ∣ X ) 0 H(Y|X) 0 H(Y∣X)0,意味着在已知 X X X 的条件下, Y Y Y 的不确定性为零,即给定 X X X 的值,我们完全确定了 Y Y Y 的值。这表明 Y Y Y 的取值完全由 X X…...
信息化发展73
数字经济 数字经济是继农业经济、工业经济之后的更高级经济形态。从本质上看,数字经济是一种新的技术经济范式,它建立在信息与通信技术的重大突破的基础上,以数字技术与实体经济融合驱动的产业梯次转型和经济创新发展的主引擎,在…...
560. 和为 K 的子数组
题目描述 给你一个整数数组 nums 和一个整数 k ,请你统计并返回 该数组中和为 k 的连续子数组的个数 。 示例 1: 输入:nums [1,1,1], k 2 输出:2示例 2: 输入:nums [1,2,3], k 3 输出:2…...
24 mysql all 查询
前言 这里主要是 探究一下 explain $sql 中各个 type 诸如 const, ref, range, index, all 的查询的影响, 以及一个初步的效率的判断 这里会调试源码来看一下 各个类型的查询 需要 lookUp 的记录 以及 相关的差异 此系列文章建议从 mysql const 查询 开始看 测试表结构…...
【Excel单元格数值统计】python实现-附ChatGPT解析
1.题目 Excel单元格数值统计 知识点: 递归、循环数组 时间限制:2s 空间限制:256MB 限定语言:不限 题目描述: Excel工作表中对选定区域的数值进行统计的功能非常实用。仿照Excel的这个功能,请对给定表格中选中区域中的单元格进行求和统计,并输出统计结果。 为简化计算,假设当…...
爬虫项目实战——爬取B站视频
目标:对B站视频详情页url进行视频的爬取。 注:由于B站的音频和视频的链接是分开的,所以在提取是需要分别提取,然后进行合成。 这里只管提取,合成的工作以后再说。 具体步骤 发送请求 对于视频详情页url地址发送请求 …...
关掉在vscode使用copilot时的提示音
1. 按照图示的操作File --> Preferences --> Settings 2. 搜索框输入关键字Sound,因为是要关掉声音,所以找有关声音的设置 3. 找到如下图所示的选项 Audio Cues:Line Has Inline Suggetion,将其设置为Off 这样,就可以关掉suggest code时…...
【有限域除法】二元多项式除法电路原理及C语言实现
二元多项式除法电路原理 例: g ( x ) = x 4 + x 2 + x + 1 g(x)=x^4 + x^2+x+1...
RabbitMQ核心总结
AMQP协议核心概念 RabbitMQ是基于AMQP协议的,通过使用通用协议就可以做到在不同语言之间传递。 server:又称broker,接受客户端连接,实现AMQP实体服务。 connection:连接和具体broker网络连接。 channel:…...
Unicode与UTF-8
软件开发中乱码问题经常遇到,Unicode,UTF-8, ASCII等都是高频词语,不过具体是啥意思其实都不清楚。这个周末研究了一下,略有了解,记录一下。 Unicode Unicode本身是纯理论的东西,和具体计算机实现无关。它…...
A : DS单链表--类实现
Description 用C语言和类实现单链表,含头结点 属性包括:data数据域、next指针域 操作包括:插入、删除、查找 注意:单链表不是数组,所以位置从1开始对应首结点,头结点不放数据 类定义参考 #include<…...
React Hooks —— ref hooks
什么是Hooks Hooks从语法上来说是一些函数。这些函数可以用于在函数组件中引入状态管理和生命周期方法。 React Hooks的优点 简洁 从语法上来说,写的代码少了上手非常简单 基于函数式编程理念,只需要掌握一些JavaScript基础知识与生命周期相关的知识不…...
泛型与Gson解析
/*** 回调接口的一种实现* 用于把网络返回的json字符串转换成参数化类型* 泛型 T 就是用户输入的javaBean的类型*/ public abstract class HttpCallback<T> implements ICallback {Overridepublic void onSuccess (String result) {// result就是网络回来的数据// 把这个…...
c++使用ifstream和ofstream报错:不允许使用不完整的类型
学习《C Primer》关于IO库的部分,输入284页的的代码,出现了报错: 不允许使用不完整的类型 原来的代码: #include <iostream> #include <vector> using namespace std;int main(int argc, char **argv) {ifstream in…...
调试器通用波形显示工具
前言:事情起因是我们实验室买了个无线调试器是CMSIS-DAP的,无法使用J-SCOPE显示波形来方便调PID,所以我就在网上找到了个开源工具链接:http://t.csdnimg.cn/ZqZPY使用方法:工具是好工具,就是没有使用手册&a…...
Linux中getopt函数、optind等变量使用详解
getopt函数、optind等变量使用详解 最近在学习《Unix网络编程》vol2时,发现书中例子经常使用一个命令行解析getopt函数,因为函数声明比较特别,根据自己摸索,遂总结出使用方法。 1. getopt函数的声明 该函数是由Unix标准库提供的…...
RDP协议流程详解(二)Basic Settings Exchange 阶段
RDP连接建立过程,在Connection Initiation后,RDP客户端和服务端将进行双方基础配置信息交换,也就是basic settings exchange阶段。在此阶段,将包含两条消息Client MCS Connect Initial PDU和Server MCS Connect Response PDU&…...
实时人脸五观检测:基于libfacedetection(CNN模型)
一、前言 随着人工智能技术的不断发展,人脸检测已成为计算机视觉领域的重要应用之一。人脸检测是一种将输入图像中的人脸位置和轮廓提取出来的技术,广泛应用于人脸识别、智能监控、人机交互等领域。利用libfacedetection开源的人脸检测库,实现人脸检测。 libfacedetection…...
图像和视频上传平台Share Me
本文完成于 6 月,所以反代中,域名演示还是使用的 laosu.ml,不过版本并没有什么变化; 什么是 Share Me ? Share Me 是使用 Next.js 和 PocketBase 的自托管图像和视频上传平台,具有丰富的嵌入支持和 API&…...
JavaScript 在前端开发中有什么应用?
JavaScript(简称JS)是一种脚本语言,广泛应用于前端开发中。作为Web前端三大基石之一(HTML、CSS、JS),它可以使网页具备交互性、动态性和实时性,提高用户体验。在本文中,我将详细论述…...
【沐风老师】推荐2023年3DMAX的10个最佳插件!
推荐2023年3DMAX的10个最佳插件 3dMax是一款专业的三维建模、动画和渲染软件,供建筑师、工程师、游戏开发商和视觉效果艺术家使用。它提供了一系列用于建模、纹理、装配、动画和渲染3D对象和场景的工具。3ds Max包括粒子和流体模拟的高级功能,以及对各种…...
【visual studio 小技巧】项目属性->生成->事件
需求 我们有时会用到一些dll,需要把这些dll和我们生成的exe放到一起,一般我们是手动自己copy, 这样发布的时候,有时会忘记拷贝这个dll,导致程序运行出错。学会这个小技巧,就能实现自动copy,非…...
每日一题 279完全平方数(完全背包)
题目 完全平方数 给你一个整数 n ,返回 和为 n 的完全平方数的最少数量 。 完全平方数 是一个整数,其值等于另一个整数的平方;换句话说,其值等于一个整数自乘的积。例如,1、4、9 和 16 都是完全平方数,而…...
创意中秋与国庆贺卡 - 用代码为节日增添喜悦
目录 编辑 引言 贺卡的初始主题 - 中秋节 点击头像,切换至国庆主题 文本动画 用代码制作这个贺卡 获取完整代码(简单免费) 总结 引言 中秋佳节和国庆日是中国两个重要的传统节日,一个寓意团圆与祝福,另一个…...
专业综合课程设计 - 优阅书城项目(第一版)
此项目是《专业综合课程设计》带练项目 实现的功能有: 登录、注销、添加图书、删除图书、编辑图书 包含资源: 优阅书城(bookstore)源码 数据库数据 课程笔记 下载链接:https://wwpv.lanzoue.com/i79nx1av4doj 登录功…...
【剑指Offer】13.机器人的运动范围
题目 地上有一个 rows 行和 cols 列的方格。坐标从 [0,0] 到 [rows-1,cols-1] 。一个机器人从坐标 [0,0] 的格子开始移动,每一次只能向左,右,上,下四个方向移动一格,但是不能进入行坐标和列坐标的数位之和大于 thresh…...
【Qt基础篇】信号和槽
文章目录 一些常见的bug:字符集不对产生的错误VS平台中文乱码 QT的优点关于.pro文件QtCreator快捷键最简单的qt程序按钮的创建对象模型**Qt窗口坐标**体系信号和槽机制connect函数系统自带的信号和槽案例:实现点击按钮-关闭窗口的案例 自定义信号和槽案例…...
.netCore用DispatchProxy实现动态代理
在 .NET Core 中,你可以使用 DispatchProxy 类来实现动态代理。DispatchProxy 允许你在运行时创建一个代理对象,该代理对象可以拦截对其所代理的对象的方法调用,并在方法调用前后执行自定义的逻辑。这在 AOP(面向切面编程…...
好奇喵 | Tor浏览器——访问.onion网址,揭开Dark Web的神秘面纱
前言 在之前的博客中: 1.Surface Web —> Deep Web —> Dark Web,我们解释了表层网络、深层网络等的相关概念; 2.Tor浏览器——层层剥开洋葱,我们阐述了Tor的历史和基本工作原理; 3.Tor浏览器…...
Maven 中引用其他项目jar包出现BOOT-INF问题
问题 在B项目中引入A项目的类,但是发现怎么也引入不进来 A项目打包之后,想在B项目中引用jar 在B项目中发现类文件无法引用 参考网上进行清缓存等一系列操作都没有解决。 最后发现引用的jar包中包含BOOT-INF, 然后去A项目中查找ÿ…...
浙江建设职业技术学院官方网站/百度榜
1,需要下载的地方写: <a href"download.asp?filename文件路径" target"_blank">需要下载的地方</a> 2,添加一个页面:(保存为download.asp) <% languagevbscript codep…...
网站建设开发平台/青岛网络seo公司
00A. Ownable 合约:提供基本的认证控制 // 提供基本的认证控制 contract Ownable {address public owner; /*** dev The Ownable constructor sets the original owner of the contract to the sender* account.*/function Ownable() {owner msg.sender;}/*** dev …...
公司营销策划方案案例/西安网站seo
采写:王冠收听除了跑分、四核、1.5Ghz这些表面数字之外,你还想多了解一些关于手机芯片的故事吗?为什么ARM占据了这个市场90%的设计份额?为什么高通的芯片很贵依然是市场第一…[详细][评论]腾讯科技 王冠 9月20日报道 苹果新一代iP…...
小男孩与大人做的网站/aso优化师主要是干嘛的
Spark学习之RDD编程(2) 1. Spark中的RDD是一个不可变的分布式对象集合。 2. 在Spark中数据的操作不外乎创建RDD、转化已有的RDD以及调用RDD操作进行求值。 3. 创建RDD:1)读取一个外部数据集2)在驱动器程序里分发驱动器程序中的对象…...
网站设计答辩ppt/南京百度seo公司
1)实验平台:【正点原子】 NANO STM32F103 开发板2)摘自《正点原子STM32 F1 开发指南(NANO 板-HAL 库版)》关注官方微信号公众号,获取更多资料:正点原子第二十七章 DHT11 数字温湿度传感器实验上一章,我们介绍了数字温度传感器 DS1…...
wordpress豆瓣电影图书分享插件/海南百度首页广告
ip-link基于静态路由的配置与详解 ip-link(链路可达性检查),他可以与静态路由,策略路由,双机热备以及dhcp联动 如图,一般情况下,直连链路故障,防火墙是可以直接感知到的,…...