隐蔽通信中KL散度多码字联合与单码字分布
假设多个码字的观测是独立的,KL散度的推导可以利用独立性的性质来进行。KL散度是两个概率分布之间的非对称度量,表示了从一个分布到另一个分布的信息丧失情况。设每个码字的两个观测分布分别为 P P P 和 Q Q Q,我们想推导多个独立码字对应的两个观测分布 P multi P_{\text{multi}} Pmulti 和 Q multi Q_{\text{multi}} Qmulti 之间的KL散度。
单个码字的KL散度
对于单个码字,KL散度的定义是:
D
KL
(
P
∥
Q
)
=
∑
x
P
(
x
)
log
P
(
x
)
Q
(
x
)
D_{\text{KL}}(P \| Q) = \sum_x P(x) \log \frac{P(x)}{Q(x)}
DKL(P∥Q)=x∑P(x)logQ(x)P(x)
其中,
P
(
x
)
P(x)
P(x) 和
Q
(
x
)
Q(x)
Q(x) 是单个码字观测的两个分布。
多个独立码字的KL散度
假设我们有
n
n
n 个码字的独立观测,每个码字的分布是
P
(
x
)
P(x)
P(x) 和
Q
(
x
)
Q(x)
Q(x)。由于这些观测是独立的,多个码字的联合分布
P
multi
P_{\text{multi}}
Pmulti 和
Q
multi
Q_{\text{multi}}
Qmulti 分别是各个码字分布的乘积,即:
P
multi
(
x
1
,
x
2
,
…
,
x
n
)
=
∏
i
=
1
n
P
(
x
i
)
P_{\text{multi}}(x_1, x_2, \dots, x_n) = \prod_{i=1}^n P(x_i)
Pmulti(x1,x2,…,xn)=i=1∏nP(xi)
Q
multi
(
x
1
,
x
2
,
…
,
x
n
)
=
∏
i
=
1
n
Q
(
x
i
)
Q_{\text{multi}}(x_1, x_2, \dots, x_n) = \prod_{i=1}^n Q(x_i)
Qmulti(x1,x2,…,xn)=i=1∏nQ(xi)
因此,多个码字的联合分布间的KL散度为:
D
KL
(
P
multi
∥
Q
multi
)
=
∑
x
1
,
x
2
,
…
,
x
n
P
multi
(
x
1
,
x
2
,
…
,
x
n
)
log
P
multi
(
x
1
,
x
2
,
…
,
x
n
)
Q
multi
(
x
1
,
x
2
,
…
,
x
n
)
D_{\text{KL}}(P_{\text{multi}} \| Q_{\text{multi}}) = \sum_{x_1, x_2, \dots, x_n} P_{\text{multi}}(x_1, x_2, \dots, x_n) \log \frac{P_{\text{multi}}(x_1, x_2, \dots, x_n)}{Q_{\text{multi}}(x_1, x_2, \dots, x_n)}
DKL(Pmulti∥Qmulti)=x1,x2,…,xn∑Pmulti(x1,x2,…,xn)logQmulti(x1,x2,…,xn)Pmulti(x1,x2,…,xn)
代入联合分布的表达式:
D
KL
(
P
multi
∥
Q
multi
)
=
∑
x
1
,
x
2
,
…
,
x
n
∏
i
=
1
n
P
(
x
i
)
log
∏
i
=
1
n
P
(
x
i
)
∏
i
=
1
n
Q
(
x
i
)
D_{\text{KL}}(P_{\text{multi}} \| Q_{\text{multi}}) = \sum_{x_1, x_2, \dots, x_n} \prod_{i=1}^n P(x_i) \log \frac{\prod_{i=1}^n P(x_i)}{\prod_{i=1}^n Q(x_i)}
DKL(Pmulti∥Qmulti)=x1,x2,…,xn∑i=1∏nP(xi)log∏i=1nQ(xi)∏i=1nP(xi)
利用对数的性质,得到:
D
KL
(
P
multi
∥
Q
multi
)
=
∑
x
1
,
x
2
,
…
,
x
n
∏
i
=
1
n
P
(
x
i
)
∑
i
=
1
n
log
P
(
x
i
)
Q
(
x
i
)
D_{\text{KL}}(P_{\text{multi}} \| Q_{\text{multi}}) = \sum_{x_1, x_2, \dots, x_n} \prod_{i=1}^n P(x_i) \sum_{i=1}^n \log \frac{P(x_i)}{Q(x_i)}
DKL(Pmulti∥Qmulti)=x1,x2,…,xn∑i=1∏nP(xi)i=1∑nlogQ(xi)P(xi)
=
∑
i
=
1
n
∑
x
i
P
(
x
i
)
log
P
(
x
i
)
Q
(
x
i
)
= \sum_{i=1}^n \sum_{x_i} P(x_i) \log \frac{P(x_i)}{Q(x_i)}
=i=1∑nxi∑P(xi)logQ(xi)P(xi)
这说明多个码字的联合分布的KL散度是每个独立码字的KL散度之和,即:
D
KL
(
P
multi
∥
Q
multi
)
=
∑
i
=
1
n
D
KL
(
P
∥
Q
)
D_{\text{KL}}(P_{\text{multi}} \| Q_{\text{multi}}) = \sum_{i=1}^n D_{\text{KL}}(P \| Q)
DKL(Pmulti∥Qmulti)=i=1∑nDKL(P∥Q)
结论
对于
n
n
n 个独立的码字,联合分布的KL散度是单个码字的KL散度的简单叠加,即:
D
KL
(
P
multi
∥
Q
multi
)
=
n
⋅
D
KL
(
P
∥
Q
)
D_{\text{KL}}(P_{\text{multi}} \| Q_{\text{multi}}) = n \cdot D_{\text{KL}}(P \| Q)
DKL(Pmulti∥Qmulti)=n⋅DKL(P∥Q)
这表明当观测是独立时,多个码字的KL散度就是每个码字的KL散度乘以码字的数量 n n n。