当前位置：首页 > article >正文

探秘基带算法：从原理到5G时代的通信变革【四】Polar 编解码（一）

article 2025/3/4 19:51:11

文章目录

- - 2.3 Polar 编解码
  - - 2.3.1 Polar 码简介与发展背景
    - 2.3.2 信道极化理论基础
    - - 对称容量与巴氏参数
      - 对称容量 $I (W)$
      - 巴氏参数 $Z (W)$
      - 常见信道
      - 信道联合
      - 信道分裂
      - 信道极化

本博客为系列博客，主要讲解各基带算法的原理与应用，包括：viterbi解码、Turbo编解码、Polar编解码、CORDIC算法、CRC校验、FFT/DFT、QAMtiaozhi/解调、QPSK调制/解调。其他博客链接如下：

探秘基带算法：从原理到5G时代的通信变革【一】引言
探秘基带算法：从原理到5G时代的通信变革【二】Viterbi解码
探秘基带算法：从原理到5G时代的通信变革【三】Turbo 编解码
探秘基带算法：从原理到5G时代的通信变革【四】Polar 编解码（一）
探秘基带算法：从原理到5G时代的通信变革【四】Polar 编解码（二）
探秘基带算法：从原理到5G时代的通信变革【五】CORDIC算法
探秘基带算法：从原理到5G时代的通信变革【六】CRC 校验
探秘基带算法：从原理到5G时代的通信变革【七】FFT/DFT
探秘基带算法：从原理到5G时代的通信变革【八】QAM 调制 / 解调
探秘基带算法：从原理到5G时代的通信变革【九】QPSK调制/解调
探秘基带算法：从原理到5G时代的通信变革【十】基带算法应用与对比

2.3 Polar 编解码

2.3.1 Polar 码简介与发展背景

在信息论中，香农（Shannon）提出了著名的信道容量理论，指出在加性白高斯噪声（AWGN）信道上，给定信噪比 (SNR) 和带宽 (W) Hz 的情况下，能够实现可靠传输的最大速率由公式 $C = W \log_2(1 + SNR)$ 给出。这意味着在理论上存在一种编码方式，可以在达到信道容量的同时保证通信的可靠性。然而，在香农提出这一理论后的几十年里，尽管多种信道编码技术被开发出来，但它们要么无法严格证明能达到信道容量，要么复杂度过高，难以实际应用。

直到 2008 年，土耳其学者 Erdal Arikan 提出了极化码（Polar Codes），这是第一种能够通过严格的数学方法证明可以达到信道容量的构造性编码方案。极化码的核心思想基于信道极化理论，该理论通过信道联合（Channel Combining）和信道分裂（Channel Splitting）两种操作，使得多个独立的二进制输入离散记忆无噪信道（BDMC, Binary-Input Discrete Memoryless Channel）经过特定处理后，逐渐“极化”为两类极端信道：一类是接近无噪信道（完全可靠的信道），另一类是接近全噪信道（完全不可靠的信道）。这种现象为极化码的设计提供了理论基础。在实际应用中，极化码利用无噪信道来传输用户的有用信息，而将全噪信道用于传输约定信息或不传信息，从而实现高效可靠的通信。

极化码的编译码复杂度较低，当码长为 $N$ 时，其复杂度仅为 $\log N)$ ，这使得它在大规模通信系统中具有显著优势。此外，极化码的性能随着码长的增加逐渐逼近信道容量，成为现代通信领域的重要研究方向之一。

2.3.2 信道极化理论基础

信道极化的实现依赖于两种关键操作：信道联合（Channel Combining）和信道分裂（Channel Splitting）。具体来说，假设我们有 $N$ 个相同的 BDMC 信道 $W$ ，通过线性变换将这些信道合并成一个等效信道 $W_N$ ，然后再将 $W_N$ 拆分为 $N$ 个相关的子信道。在这个过程中，随着 $N$ 趋于无穷大，信道极化现象开始显现：一部分子信道的可靠性逐渐接近完美（即信道容量接近 1），而另一部分子信道的可靠性趋于零（即信道容量接近 0）。这种现象使得我们可以选择那些接近无噪的信道来传输信息比特，而将接近全噪的信道用于传输固定值（如休眠比特，通常设为 0）或干脆不使用。

下图展示了信道极化过程中，从原始信道到组合信道再到分解信道的示意图，从图中可以直观地看到信道极化的过程和不同信道之间的关系。

对称容量与巴氏参数

在信息论中，一个二进制输入离散无记忆信道（B-DMC）可以用 $\to Y$ 表示，其中 $X$ 是输入符号集合， $Y$ 是输出符号集合，转移概率由 $W (y ∣ x)$ 定义，表示当输入为 $\in X$ 时，输出为 $\in Y$ 的概率。为了量化信道的传输能力和可靠性，引入了两个重要的度量指标：对称容量（Symmetric Capacity） 和 巴氏参数（Bhattacharyya Parameter）。

对称容量 $I (W)$

对称容量 $I (W)$ 是衡量信道传输能力的一个关键指标，定义为：
$\triangleq \sum_{y \in Y} \sum_{x \in X} \frac{1}{2} W(y|x) \log \frac{W(y|x)}{\frac{1}{2} W(y|0) + \frac{1}{2} W(y|1)}$
这里假设输入符号 $X = \{0, 1\}$ 等概率分布（即每个输入的概率为 $1/2$ ）。该公式描述了在等概率输入条件下，信道能够支持的最大信息传输速率。

对称容量的通俗解释

对称容量 $I (W)$ 是衡量信道传输能力的一个关键指标，它描述了在特定条件下信道能够可靠传输的最大信息量。为了更直观地理解这一概念，我们可以从其定义出发，并结合具体的例子进行说明。

公式分解与意义

对称容量的定义为：

$\triangleq \sum_{y \in Y} \sum_{x \in X} \frac{1}{2} W(y|x) \log \frac{W(y|x)}{\frac{1}{2} W(y|0) + \frac{1}{2} W(y|1)}$

这里：

- $W (y ∣ x)$ 表示信道的转移概率，即当输入为 $x$ 时，输出为 $y$ 的概率。
- $X = \{0, 1\}$ 是输入符号集合（假设二进制输入）。
- $Y$ 是输出符号集合。
- $\frac{1}{2}$ 表示输入符号 $0$ 和 $1$ 等概率分布的情况。

公式的本质是对输入符号等概率分布条件下，信道传递的信息量进行量化。具体来说，分子中的 $W (y ∣ x)$ 反映了输入和输出之间的依赖关系，而分母中的 $\frac{1}{2} W(y|0) + \frac{1}{2} W(y|1)$ 则表示输出 $y$ 的边缘分布。通过对数项计算两者之间的差异，可以衡量信道的有效性。

通俗理解

对称容量的核心思想是：在输入符号等概率分布的情况下，信道能够传递多少有用信息。换句话说，它衡量的是信道在理想输入条件下的“信息传输效率”。

例如，在一个噪声信道中，如果输入符号 $0$ 和 $1$ 都以相等的概率发送，那么对称容量告诉我们，信道能够在多大程度上区分这两个符号。如果信道噪声较大，导致输出符号 $y$ 的分布几乎相同（无论输入是 $0$ 还是 $1$ ），则对称容量会接近于零；反之，如果信道噪声较小，输出符号能很好地反映输入符号，则对称容量会较高。

示例说明

假设我们有一个简单的二进制对称信道（Binary Symmetric Channel, BSC），其转移概率矩阵为：

$\begin{bmatrix} 1-p & p \\ p & 1-p \end{bmatrix}$

其中：

输入符号 $\in \{0, 1\}$ 。
输出符号 $\in \{0, 1\}$ 。
- $p$ 是比特翻转概率，即输入为 $0$ 时输出为 $1$ 的概率，或者输入为 $1$ 时输出为 $0$ 的概率。

在这种情况下，我们可以计算对称容量 $I (W)$ 。首先，边缘分布为：

$\frac{1}{2} W(y|0) + \frac{1}{2} W(y|1)$

对于 $y = 0$ 或 $y = 1$ ，边缘分布为：

$\frac{1}{2}(1-p) + \frac{1}{2}p = \frac{1}{2}, \quad P(1) = \frac{1}{2}p + \frac{1}{2}(1-p) = \frac{1}{2}$

接下来计算对称容量：

$\sum_{y \in \{0, 1\}} \sum_{x \in \{0, 1\}} \frac{1}{2} W(y|x) \log \frac{W(y|x)}{P(y)}$

代入具体值后，可以得到：

$\frac{1}{2} \big[ (1-p) \log \frac{1-p}{\frac{1}{2}} + p \log \frac{p}{\frac{1}{2}} \big] + \frac{1}{2} \big[ p \log \frac{p}{\frac{1}{2}} + (1-p) \log \frac{1-p}{\frac{1}{2}} \big]$

化简后为：

$I (W) = 1 - H (p)$

其中， $H(p) = -p \log_2 p - (1-p) \log_2 (1-p)$ 是二元熵函数。

结果分析

通过上述计算可以看出：

当 $p = 0$ （无噪声信道）时， $H (p) = 0$ ，因此 $I (W) = 1$ ，表明信道能够完全可靠地传输信息。
当 $p = 0.5$ （完全随机信道）时， $H (p) = 1$ ，因此 $I (W) = 0$ ，表明信道无法传递任何有用信息。
当 $p$ 在 $0$ 和 $0.5$ 之间时，对称容量介于 $0$ 和 $1$ 之间，反映了信道的部分可靠性。

总结

对称容量 $I (W)$ 是一种衡量信道传输能力的重要指标，尤其适用于输入符号等概率分布的情况。通过具体的例子（如二进制对称信道），我们可以看到它如何量化信道在不同噪声条件下的信息传输效率。这一概念不仅有助于理解信道特性，也为设计高效的通信系统提供了理论基础。

根据香农信道容量理论，当输入符号等概率分布时， $I (W)$ 等于信道的香农容量 $C$ ，即：
$\max_{p(x_i)} I(X; Y) = \max_{p(x_i)} \sum_i \sum_j p(x_i) p(y_j|x_i) \log \frac{p(y_j|x_i)}{\sum_i p(x_i) p(y_j|x_i)}$
因此， $I (W)$ 可以看作是对信道速率的一种具体化度量。

通俗解释香农信道容量与对称容量的关系

根据香农信道容量理论，信道的最大传输能力（即信道容量 $C$ ）可以通过最大化输入符号分布 $p(x_i)$ 来实现。然而，当输入符号等概率分布时，对称容量 $I (W)$ 恰好等于信道的香农容量 $C$ 。这意味着，在输入符号均匀分布的情况下，我们可以直接用 $I (W)$ 来衡量信道能够可靠传输的最大信息速率。

公式分解与意义

香农信道容量的定义为：

$\max_{p(x_i)} I(X; Y) = \max_{p(x_i)} \sum_i \sum_j p(x_i) p(y_j|x_i) \log \frac{p(y_j|x_i)}{\sum_i p(x_i) p(y_j|x_i)}$

其中：

- $p(x_i)$ 是输入符号的概率分布。
- $p(y_j|x_i)$ 是信道的转移概率，表示在输入为 $x_i$ 的情况下输出为 $y_j$ 的概率。
- $\sum_i p(x_i) p(y_j|x_i)$ 是输出符号 $y_j$ 的边缘分布。

当输入符号等概率分布时，即 $p(x_i) = \frac{1}{|X|}$ （其中 $∣ X ∣$ 是输入符号集合的大小），上述公式可以简化为对称容量 $I (W)$ 的形式：

$\sum_{y \in Y} \sum_{x \in X} \frac{1}{|X|} W(y|x) \log \frac{W(y|x)}{\sum_{x' \in X} \frac{1}{|X|} W(y|x')}$

此时， $I (W)$ 就是对信道速率的一种具体化度量，反映了在输入符号均匀分布条件下信道的最大信息传输能力。

举例说明

为了更直观地理解这一概念，我们以二进制对称信道（Binary Symmetric Channel, BSC）为例进行说明。

二进制对称信道模型

假设一个二进制对称信道，其输入符号集合为 $X = \{0, 1\}$ ，输出符号集合为 $Y = \{0, 1\}$ ，转移概率矩阵为：

$\begin{bmatrix} 1-p & p \\ p & 1-p \end{bmatrix}$

其中， $p$ 是比特翻转概率，表示输入符号被错误传递的概率。

计算信道容量

根据香农信道容量公式，我们需要最大化互信息 $I (X; Y)$ 。假设输入符号等概率分布，即 $\frac{1}{2}$ ，则输出符号的边缘分布为：

$\frac{1}{2}(1-p) + \frac{1}{2}p = \frac{1}{2}$

$\frac{1}{2}p + \frac{1}{2}(1-p) = \frac{1}{2}$

因此，输出符号也等概率分布。

接下来计算对称容量 $I (W)$ ：

$\sum_{y \in Y} \sum_{x \in X} \frac{1}{2} W(y|x) \log \frac{W(y|x)}{\frac{1}{2} W(y|0) + \frac{1}{2} W(y|1)}$

对于 $y = 0$ 和 $x = 0$ ，有：

$\frac{1}{2} W(0|0) \log \frac{W(0|0)}{\frac{1}{2} W(0|0) + \frac{1}{2} W(0|1)} = \frac{1}{2}(1-p) \log \frac{1-p}{\frac{1}{2}[(1-p) + p]} = \frac{1}{2}(1-p) \log (1-p)$

类似地，可以计算其他项，并最终得到：

$I (W) = 1 - H (p)$

其中， $H(p) = -p \log_2 p - (1-p) \log_2 (1-p)$ 是二元熵函数。

结果分析

从计算结果可以看出：

当 $p = 0$ （无噪声信道）时， $H (p) = 0$ ，因此 $I (W) = 1$ ，表明信道能够完全可靠地传输信息。
当 $p = 0.5$ （完全随机信道）时， $H (p) = 1$ ，因此 $I (W) = 0$ ，表明信道无法传递任何有用信息。
当 $p$ 在 $0$ 和 $0.5$ 之间时， $I (W)$ 反映了信道的部分可靠性。

总结

通过上述分析可以看出，当输入符号等概率分布时，对称容量 $I (W)$ 等于信道的香农容量 $C$ 。这为我们提供了一种简单而有效的方法来衡量信道的传输能力。在实际应用中，通过对称容量的概念，我们可以快速评估信道性能，并设计高效的通信系统。

巴氏参数 $Z (W)$

巴氏参数 $Z (W)$ 是衡量信道可靠性的另一个重要指标，定义为：
$\triangleq \sum_{y \in Y} \sqrt{W(y|0) W(y|1)}$
它反映了信道输出分布之间的相似程度。直观上，如果 $Z (W)$ 接近 0，则说明信道输出分布差异较大，信道较为可靠；反之，如果 $Z (W)$ 接近 1，则说明信道输出分布高度相似，信道较为不可靠。

巴氏参数 $Z (W)$ 的通俗解释

巴氏参数 $Z (W)$ 是衡量信道可靠性的另一个重要指标，它通过量化信道输出分布之间的相似程度来评估信道性能。具体来说， $Z (W)$ 定义为：

$\triangleq \sum_{y \in Y} \sqrt{W(y|0) W(y|1)}$

这里的 $W (y ∣0)$ 和 $W (y ∣1)$ 分别表示在输入符号为 $0$ 和 $1$ 时，信道输出为 $y$ 的转移概率。直观上， $Z (W)$ 衡量了两个条件分布 $W (y ∣0)$ 和 $W (y ∣1)$ 的“重叠”程度：如果 $Z (W)$ 接近 0，则说明这两个分布差异较大，信道较为可靠；如果 $Z (W)$ 接近 1，则说明这两个分布高度相似，信道较为不可靠。

直观理解与几何意义

为了更好地理解 $Z (W)$ ，我们可以将其视为一种“距离”的度量。当 $Z (W)$ 较小时，意味着信道输出在不同输入符号下的分布区别明显，接收端更容易区分输入符号，从而降低误码率。相反，当 $Z (W)$ 较大时，信道输出的分布重叠较多，接收端难以区分输入符号，导致信道可靠性下降。

从几何角度看， $Z (W)$ 实际上是基于 Bhattacharyya 距离的一种度量。Bhattacharyya 距离越小，两个分布越相似；反之，距离越大，分布差异越大。

示例说明

假设我们有一个二进制对称信道（Binary Symmetric Channel, BSC），其转移概率矩阵为：

$\begin{bmatrix} 1-p & p \\ p & 1-p \end{bmatrix}$

其中， $p$ 是比特翻转概率，即输入符号被错误传递的概率。

计算 $Z (W)$

根据定义， $Z (W)$ 可以写为：

$\sum_{y \in Y} \sqrt{W(y|0) W(y|1)}$

对于 $y = 0$ 和 $y = 1$ ，分别有：

$\sqrt{W(0|0) W(0|1)} + \sqrt{W(1|0) W(1|1)}$

将转移概率代入，得到：

$\sqrt{(1-p)p} + \sqrt{p(1-p)}$

化简后为：

$2\sqrt{p(1-p)}$

结果分析

当 $p = 0$ （无噪声信道）时， $Z (W) = 0$ ，表明信道输出分布完全不重叠，信道非常可靠。
当 $p = 0.5$ （完全随机信道）时， $Z (W) = 1$ ，表明信道输出分布完全重叠，信道完全不可靠。
当 $p$ 在 $0$ 和 $0.5$ 之间时， $Z (W)$ 反映了信道的部分可靠性。

例如，假设 $p = 0.1$ ，则：

$2\sqrt{0.1 \cdot (1-0.1)} = 2\sqrt{0.09} = 0.6$

这说明信道输出分布有一定重叠，但仍然可以较好地区分输入符号。

总结

通过上述分析可以看出，巴氏参数 $Z (W)$ 是一个简单而有效的信道可靠性度量工具。它通过量化信道输出分布之间的相似程度，帮助我们直观地评估信道性能。在实际应用中， $Z (W)$ 常用于极化码等现代编码技术的设计中，指导信道选择和编码优化。

此外， $Z (W)$ 还可以作为信道一次使用最大似然判决（ML）错误概率的上限。具体来说，ML判决下的错误概率 $P_e^{ML}$ 可以表示为：
$P_e^{ML} = \frac{1}{2} \sum_{y \in Y} \min\{W(y|0), W(y|1)\}$
由于 $\min\{W(y|0), W(y|1)\} \leq \sqrt{W(y|0) W(y|1)}$ ，因此有 $P_e^{ML} \leq Z(W)$ ，且 $\in [0, 1]$ 。

通俗解释 $Z (W)$ 作为最大似然判决错误概率的上限

巴氏参数 $Z (W)$ 不仅可以衡量信道输出分布之间的相似程度，还可以用作信道一次使用时最大似然判决（Maximum Likelihood, ML）错误概率 $P_e^{ML}$ 的上限。这一关系揭示了 $Z (W)$ 在评估信道性能中的重要作用。

最大似然判决错误概率

在通信系统中，接收端通常根据最大似然原则来判断发送端发送的符号。具体来说，当接收到符号 $y$ 时，接收端会选择使得 $W (y ∣ x)$ 最大的输入符号 $x$ 作为判决结果。如果判决错误，则会导致误码。

最大似然判决下的错误概率 $P_e^{ML}$ 可以表示为：

$P_e^{ML} = \frac{1}{2} \sum_{y \in Y} \min\{W(y|0), W(y|1)\}$

这里， $min\{W(y|0), W(y|1)\}$ 表示在接收到符号 $y$ 时，两个可能输入符号（ $0$ 和 $1$ ）对应的转移概率中较小的那个。这个值反映了在该输出符号下发生判决错误的可能性。

$Z (W)$ 作为 $P_e^{ML}$ 的上限

为了进一步简化分析，我们可以利用不等式 $\min\{W(y|0), W(y|1)\} \leq \sqrt{W(y|0) W(y|1)}$ 。这意味着，对于每个输出符号 $y$ ，判决错误的概率可以用一个更宽松的上界来近似。将这一不等式代入 $P_e^{ML}$ 的公式，得到：

$P_e^{ML} \leq \frac{1}{2} \sum_{y \in Y} \sqrt{W(y|0) W(y|1)}$

而右侧的表达式恰好是巴氏参数 $Z (W)$ 的定义：

$\sum_{y \in Y} \sqrt{W(y|0) W(y|1)}$

因此，我们有：

$P_e^{ML} \leq Z(W)$

这表明， $Z (W)$ 提供了一个简单且有效的上界，用于估计最大似然判决下的错误概率。

示例说明

假设我们有一个二进制对称信道（Binary Symmetric Channel, BSC），其转移概率矩阵为：

$\begin{bmatrix} 1-p & p \\ p & 1-p \end{bmatrix}$

其中， $p$ 是比特翻转概率。

计算 $P_e^{ML}$ 和 $Z (W)$

根据定义，最大似然判决错误概率为：

$P_e^{ML} = \frac{1}{2} \sum_{y \in Y} \min\{W(y|0), W(y|1)\}$

对于 $y = 0$ 和 $y = 1$ ，分别有：

$\min\{W(0|0), W(0|1)\} = \min\{1-p, p\}, \quad \min\{W(1|0), W(1|1)\} = \min\{p, 1-p\}$

因此：

$P_e^{ML} = \frac{1}{2} [\min\{1-p, p\} + \min\{p, 1-p\}] = \min\{p, 1-p\}$

接下来计算 $Z (W)$ ：

$\sum_{y \in Y} \sqrt{W(y|0) W(y|1)}$

对于 $y = 0$ 和 $y = 1$ ，分别有：

$\sqrt{W(0|0) W(0|1)} = \sqrt{(1-p)p}, \quad \sqrt{W(1|0) W(1|1)} = \sqrt{p(1-p)}$

因此：

$\sqrt{(1-p)p} + \sqrt{p(1-p)} = 2\sqrt{p(1-p)}$

比较 $P_e^{ML}$ 和 $Z (W)$

当 $p = 0.1$ 时：
$P_e^{ML} = \min\{0.1, 0.9\} = 0.1, \quad Z(W) = 2\sqrt{0.1 \cdot 0.9} \approx 0.6$

可以看到， $P_e^{ML} \leq Z(W)$ 成立。

当 $p = 0.5$ 时：
$P_e^{ML} = \min\{0.5, 0.5\} = 0.5, \quad Z(W) = 2\sqrt{0.5 \cdot 0.5} = 1$

这时， $P_e^{ML} = Z(W)$ ，表明信道完全不可靠。

总结

通过上述分析可以看出，巴氏参数 $Z (W)$ 不仅衡量了信道输出分布的相似程度，还提供了最大似然判决错误概率的一个简单上界。这一特性使得 $Z (W)$ 在信道性能评估和编码设计中具有重要意义。例如，在极化码的设计中， $Z (W)$ 被用来选择可靠的子信道，从而提高系统的整体性能。

##### $I (W)$ 与 $Z (W)$ 的关系

对称容量 $I (W)$ 和巴氏参数 $Z (W)$ 存在以下关系：

当且仅当 $\approx 0$ 时， $\approx 1$ ，表示信道接近完美。
当且仅当 $\approx 1$ 时， $\approx 0$ ，表示信道接近全噪。

这种关系表明， $I (W)$ 和 $Z (W)$ 分别从不同的角度刻画了信道的性能： $I (W)$ 关注信道的传输能力，而 $Z (W)$ 关注信道的可靠性。

常见信道

DMC（离散无记忆信道）

离散无记忆信道（DMC, Discrete Memoryless Channel）是一种理想的通信模型，其特点是在某时刻的输出仅与当前输入有关，而不依赖于之前的输入或输出。转移概率矩阵 $\{q(y_j|x_k)\}_{K \times J}$ 描述了输入 $x_k$ 到输出 $y_j$ 的概率分布。

对称 DMC

如果 DMC 的转移概率矩阵具有以下特性，则称为对称 DMC：

输入对称：每一行都是第一行的置换。
输出对称：每一列都是第一列的置换。
如果同时满足输入和输出对称性，则称为完全对称 DMC。

BSC（二进制对称信道）

二进制对称信道（BSC, Binary Symmetric Channel）是最简单的对称 DMC，其输入和输出均为二进制符号 ${0, 1\}$ ，并且每个符号翻转的概率为 $p$ （即交叉概率）。其转移概率矩阵为：
$\begin{bmatrix} 1-p & p \\ p & 1-p \end{bmatrix}$

BEC（二进制删除信道）

二进制删除信道（BEC, Binary Erasure Channel）是一种特殊的信道模型，其输出除了可能为 ${0, 1\}$ 外，还可能为一个特殊符号“?”，表示输入符号被删除。其转移概率矩阵为：
$
Q =
\begin{bmatrix}
1-\epsilon & 0 & \epsilon \
0 & 1-\epsilon & \epsilon
\end{bmatrix}
$
其中 $\epsilon$ 表示删除概率。

信道联合

在极化码理论中，信道联合（Channel Combining） 是指将 $N$ 个独立的二进制输入离散无记忆信道（B-DMC, Binary-Discrete Memoryless Channel）通过递归变换合并成一个具有“集体意义”的向量信道 $W_N: X^N \to Y^N$ 。这里的“集体意义”来源于递归变换过程，该过程将多个独立信道组合成一个新的信道，从而形成更复杂的传输结构。这种递归过程可以表示为从 $N$ 到 $N /2$ 再到 $1$ 的逐步简化形式。

基础概念

假设 $N = 2^n$ ，其中 $\geq 0$ ，即 $N$ 是 2 的幂次。通过递归方式将 $N$ 个独立的 B-DMC 信道 $W$ 联合起来，最终生成一个向量信道 $W_N: X^N \to Y^N$ 。这一过程的核心在于使用特定的矩阵变换来定义状态转移概率。

当 $n = 0$ 时，只有一个信道 $W$ ，此时直接定义 $W_1 = W$ 。这意味着最简单的情况是一个单一的 B-DMC 信道。

当 $n = 1$ 时，递归地将两个独立的 $W_1$ 合并为 $W_2: X^2 \to Y^2$ 。

状态转移概率定义为：
$W_2(y_1, y_2 | u_1, u_2) = W(y_1 | u_1 \oplus u_2) W(y_2 | u_2)$
这里：

- $x_1 = u_1 \oplus u_2$ 和 $x_2 = u_2$ 表示输入符号经过特定的线性变换；
- $\oplus$ 表示模 2 加法；

矩阵形式可以写为：
$[x_1, x_2] = [u_1, u_2] \begin{bmatrix} 1 & 0 \\ 1 & 1 \end{bmatrix} = [u_1, u_2] G_2$
其中 $G_2$ 是一个 $\times 2$ 的生成矩阵。

当 $n = 2$ 时，生成一个 $W_4: X^4 \to Y^4$ 的向量信道，由两个 $W_2$ 复合而成。其状态转移概率可以表示为：
$W_4(y_1^4 | u_1^4) = W_2(y_1^2 | u_1 \oplus u_2, u_3 \oplus u_4) W_2(y_3^4 | u_2, u_4)$
进一步展开为：
$W_4(y_1^4 | u_1^4) = W(y_1 | u_1 \oplus u_2 \oplus u_3 \oplus u_4) W(y_2 | u_3 \oplus u_4) W(y_3 | u_2 \oplus u_4) W(y_4 | u_4) = W^4(y_1^4 | u_1^4G_4)$
对应的矩阵形式为：
$[x_1, x_2, x_3, x_4] = [u_1, u_2, u_3, u_4] \begin{bmatrix} 1 & 0 & 0 & 0 \\ 1 & 0 & 1 & 0 \\ 1 & 1 & 0 & 0 \\ 1 & 1 & 1 & 1 \end{bmatrix} = [u_1, u_2, u_3, u_4] G_4$
其中 $G_4$ 是一个 $\times 4$ 的生成矩阵。

等价结构

递归结构的等价形式可以通过分层的方式理解。例如，在 $n = 2$ 的情况下， $W_4$ 可以看作由两个 $W_2$ 复合而成，而每个 $W_2$ 又由两个 $W_1$ 构成。这种分层递归的思想使得信道联合过程能够高效实现，并且为后续的信道分裂奠定了基础。

通过上述递归过程，信道联合将 $N$ 个独立的 B-DMC 信道合并为一个具有复杂结构的向量信道 $W_N$ ，为后续的信道极化提供了必要的数学工具。

一般递归结构

对于任意 $n$ ，向量信道 $W_N: X^N \to Y^N$ 的状态转移概率可以写为：
$
W_N(y_1^N | u_1^N) = W_N(y_1^N | u_1^N G_N)
$
其中 $y_1^N \in Y^N$ 和 $u_1^N \in X^N$ 分别表示输出和输入符号序列， $G_N$ 是 $\times N$ 的生成矩阵，递归定义为：
$
G_N =
\begin{bmatrix}
G_{N/2} & 0 \
G_{N/2} & G_{N/2}
\end{bmatrix}
$
初始条件为 $G_2 = \begin{bmatrix} 1 & 0 \\ 1 & 1 \end{bmatrix}$ 。

信道分裂

在极化码理论中，信道分裂（Channel Splitting） 是信道极化过程中的关键步骤之一。通过信道联合，我们将 $N$ 个独立的信道合并为一个具有“集体意义”的向量信道 $W_N$ 。然而，由于无法直接确知各个子信道的具体输入和输出关系，我们需要对信道极化过程进行微观表达。这种微观表达正是通过信道分裂来实现的。信道分裂的过程可以形象地理解为将已经扭成一条粗线的联合信道重新分解为一个个单独的子信道，类似于两条绳子打结后再区分出两端谁是谁。

经过分裂后，每个子信道可以用单个信道的形式表示，例如分裂子信道 $W_N^{(i)}: X \to Y^N \times X^{i-1}$ ，其转移概率定义为：
$W_N^{(i)}(y_1^N, u_1^{i-1} | u_i) \triangleq \sum_{u_{i+1}^N \in X^{N-i}} \frac{1}{2^{N-1}} W_N(y_1^N | u_1^N)$
这里， $X$ 和 $Y$ 分别是输入符号集合和输出符号集合，转移概率完整地定义了每个分裂子信道的特性。

信道分裂的通俗解释

信道分裂是极化码（Polar Code）理论中的一个核心概念，它将一个联合信道分解为多个独立的子信道。这一过程可以形象地理解为：原本复杂的联合信道就像两条绳子打结后形成的一条粗线，而信道分裂的过程就是将这条粗线重新解开，区分出每一条原始的细绳（即子信道）。每个子信道都可以用单个信道的形式表示，并具有不同的传输特性。

经过分裂后，每个子信道的转移概率定义为：

$W_N^{(i)}(y_1^N, u_1^{i-1} | u_i) \triangleq \sum_{u_{i+1}^N \in X^{N-i}} \frac{1}{2^{N-1}} W_N(y_1^N | u_1^N)$

这里的 $X$ 和 $Y$ 分别是输入符号集合和输出符号集合， $W_N(y_1^N | u_1^N)$ 是联合信道的转移概率，而 $W_N^{(i)}(y_1^N, u_1^{i-1} | u_i)$ 则描述了第 $i$ 个分裂子信道的特性。

公式的直观理解

公式的核心思想是通过“部分求和”操作，将联合信道的复杂性分解到每个子信道中。具体来说：

输入符号的划分：对于长度为 $N$ 的输入序列 $u_1^N$ ，我们关注其中的某个特定位置 $i$ 的符号 $u_i$ ，并将其与其他符号分开处理。
- $u_1^{i-1}$ 表示在 $u_i$ 之前的符号序列。
- $u_{i+1}^N$ 表示在 $u_i$ 之后的符号序列。

平均化处理：为了确定第 $i$ 个子信道的特性，我们将所有可能的 $u_{i+1}^N$ 均匀加权求和（权重为 $\frac{1}{2^{N-i}}$ ），从而消除后续符号的影响。

条件化处理：同时，子信道的输出不仅包括信道的实际输出 $y_1^N$ ，还包括之前符号 $u_1^{i-1}$ 的信息。这使得每个子信道的特性依赖于其上下文环境。

通过这种方式，每个分裂子信道 $W_N^{(i)}$ 都被单独定义，且具有不同的可靠性。

示例说明

我们以二进制对称信道（Binary Symmetric Channel, BSC）为例，详细计算第 $i = 2$ 个分裂子信道的转移概率。假设 BSC 的转移概率矩阵为：

$\begin{bmatrix} 1-p & p \\ p & 1-p \end{bmatrix}$

其中， $p$ 是比特翻转概率。

联合信道的构建

为了构建长度为 $N = 4$ 的联合信道，我们需要通过递归的方式将多个 BSC 进行串联和并联。这里采用极化码的标准构造方法，使用克罗内克积（Kronecker Product）来定义联合信道的转移概率。

对于长度为 $N = 4$ 的联合信道，其输入符号序列为 $u_1^4 = (u_1, u_2, u_3, u_4)$ ，输出符号序列为 $y_1^4 = (y_1, y_2, y_3, y_4)$ 。联合信道的转移概率可以表示为：

$W_4(y_1^4 | u_1^4) = \prod_{i=1}^4 W(y_i | x_i)$

这里的 $x_i$ 是根据输入符号 $u_1^4$ 和编码矩阵 $G_4$ 计算得到的信道输入符号。

分裂子信道的定义

根据分裂子信道的定义，第 $i = 2$ 个子信道的转移概率为：

$W_4^{(2)}(y_1^4, u_1 | u_2) = \sum_{u_3, u_4 \in \{0, 1\}} \frac{1}{2^2} W_4(y_1^4 | u_1^4)$

这里：

- $u_1$ 是第 2 个符号之前的符号。
- $u_3, u_4$ 是第 2 个符号之后的符号。
- $W_4(y_1^4 | u_1^4)$ 是联合信道的转移概率。

具体计算

第一步：确定联合信道的转移概率

假设输入符号序列为 $u_1^4 = (u_1, u_2, u_3, u_4)$ ，经过编码矩阵 $G_4$ 后得到信道输入符号序列 $x_1^4 = (x_1, x_2, x_3, x_4)$ 。编码过程可以通过克罗内克积实现：

$x_1^4 = u_1^4 G_4$

其中， $G_4$ 是长度为 4 的极化码生成矩阵：

$G_4 = \begin{bmatrix} 1 & 0 & 0 & 0 \\ 1 & 1 & 0 & 0 \\ 1 & 0 & 1 & 0 \\ 1 & 1 & 1 & 1 \end{bmatrix}$

根据编码规则，我们可以计算出 $x_1^4$ 的具体值。

第二步：计算联合信道的转移概率

联合信道的转移概率为：

$W_4(y_1^4 | u_1^4) = \prod_{i=1}^4 W(y_i | x_i)$

例如，如果 $x_1^4 = (0, 1, 1, 0)$ ，则有：

$W_4(y_1^4 | u_1^4) = W(y_1 | 0) \cdot W(y_2 | 1) \cdot W(y_3 | 1) \cdot W(y_4 | 0)$

第三步：计算分裂子信道的转移概率

现在我们代入公式计算 $W_4^{(2)}(y_1^4, u_1 | u_2)$ 。以 $u_2 = 0$ 为例，固定 $u_1$ ，对所有可能的 $u_3, u_4$ 求和：

$W_4^{(2)}(y_1^4, u_1 | u_2 = 0) = \sum_{u_3, u_4 \in \{0, 1\}} \frac{1}{4} W_4(y_1^4 | u_1, 0, u_3, u_4)$

具体来说，我们需要枚举所有可能的 $u_3, u_4$ 组合，并计算对应的联合信道转移概率。例如：

当 $u_3 = 0, u_4 = 0$ 时，计算 $W_4(y_1^4 | u_1, 0, 0, 0)$ 。
当 $u_3 = 0, u_4 = 1$ 时，计算 $W_4(y_1^4 | u_1, 0, 0, 1)$ 。
当 $u_3 = 1, u_4 = 0$ 时，计算 $W_4(y_1^4 | u_1, 0, 1, 0)$ 。
当 $u_3 = 1, u_4 = 1$ 时，计算 $W_4(y_1^4 | u_1, 0, 1, 1)$ 。

将这些结果加权求和，即可得到 $W_4^{(2)}(y_1^4, u_1 | u_2 = 0)$ 。

第四步：重复计算其他情况

类似地，我们可以计算 $W_4^{(2)}(y_1^4, u_1 | u_2 = 1)$ 。最终，我们得到了第 $i = 2$ 个分裂子信道的完整转移概率。

结果分析

经过分裂后，不同子信道的可靠性会有所不同。例如，某些子信道可能接近理想信道（误码率接近 0），而另一些子信道可能接近纯噪声信道（误码率接近 0.5）。这种差异正是极化码设计的基础：选择可靠的子信道来传输信息比特，而将不可靠的子信道用于冻结比特。

总结

信道分裂是极化码理论中实现信道极化的关键步骤。通过将联合信道分解为多个独立的子信道，我们可以根据每个子信道的可靠性进行优化设计。这一过程不仅揭示了信道特性的变化规律，还为高效编码和解码提供了理论支持。在实际应用中，信道分裂的概念广泛应用于通信系统中，特别是在 5G 标准中，极化码已成为控制信道编码的主要方案之一。

然而，上述公式在实际计算中较为复杂，因此我们通常利用递归形式来简化计算。

根据信道联合的递归结构，整个信道极化过程可以通过两个递归公式计算各个分裂子信道的转移概率：
$W_N^{(2i-1)}(y_1^N, u_1^{2i-2} | u_{2i-1}) = \frac{1}{2} \sum_{u_{2i}} W_{N/2}^{(i)}(y_1^{N/2}, u_1,o^{2i-2} \oplus u_1,e^{2i-2} | u_{2i-1} \oplus u_{2i}) W_{N/2}^{(i)}(y_{N/2+1}^N, u_1,e^{2i-2} | u_{2i})$

$W_N^{(2i)}(y_1^N, u_1^{2i-2} | u_{2i}) = \frac{1}{2} W_{N/2}^{(i)}(y_1^{N/2}, u_1,o^{2i-2} \oplus u_1,e^{2i-2} | u_{2i-1} \oplus u_{2i}) W_{N/2}^{(i)}(y_{N/2+1}^N, u_1,e^{2i-2} | u_{2i})$

信道极化

通过观察 $W_2$ 信道的极化现象，我们可以进一步理解信道分裂的作用。

以 $W_2$ 的两个子信道为例，假设原始信道 $W$ 的对称容量为 0.5，则经过信道联合与分裂后，两个子信道的对称容量分别为：

对于子信道 $U_1$ ，只有在 $y_1$ 和 $y_2$ 均接收正确的情况下才能得到正确的 $U_1$ ，因此其信道容量 $I_1(W)$ 等于 $y_1$ 和 $y_2$ 的信道容量的乘积，即 $0.5 \times 0.5 = 0.25$ 。
对于子信道 $U_2$ ，如果 $U_1$ 已知，则 $U_2$ 只有在 $y_1$ 和 $y_2$ 均接收错误的情况下才无法得到正确的信号。因此， $U_2$ 的信道容量 $I_2(W)$ 为 $\times 0.5 - 0.5 \times 0.5 = 0.75$ 。

以此类推，在信道联合与分裂的交替作用下，原本相同的 $N$ 个 $W$ 信道逐渐产生极化现象：一部分信道的信道容量趋近于 1（好信道），另一部分信道的信道容量趋近于 0（差信道）。这种极化现象是极化码设计的核心思想。

极化现象的仿真分析

为了更直观地观察信道极化现象，可以通过 MATLAB 进行仿真。以下是一个简单的仿真示例，假设信道个数 $N = 2^{10}$ ，每个信道的初始对称容量均为 0.5：

index = 10; % 信道序号
n = 2.^(1:index);
W = zeros(n(10)); % 创建 1024x1024 的空矩阵
W(1, 1) = 0.5; % 设置坐标为 (1,1) 的信道容量 I(W)

for i = n
    for j = 1:i/2
        % 坏信道
        W(i, 2*j - 1) = W(i/2, j)^2;
        % 好信道
        W(i, 2*j) = 2 * W(i/2, j) - W(i/2, j)^2;
    end
end

% 绘制信道极化现象
scatter(1:1024, W(1024, 1:1024), 'r.');
axis([0 1024 0 1]);
xlabel('信道序号 i');
ylabel('对称信道容量 I(W)');

从仿真结果可以看出，随着信道数量的增加，信道容量逐渐呈现出两极分化趋势：一部分信道的容量接近 1，而另一部分信道的容量接近 0。

极化码的设计与应用

从信道极化中可以发现，信道合并与极化码的编码过程在形式上非常相似，而信道分裂与极化码的解码过程在形式上也非常相似。这表明：

在极化码的编码过程中，首要任务是构造生成矩阵，用于将信息位映射到好信道上。
在极化码的解码过程中，信道分裂的特性暗示了采用串行译码的方式可能是最优选择。

此外，信道极化现象展示了极化码的宏观特性。通过对极化现象中的特定参数（如对称容量）进行分析，可以确定极化码编码过程中的信息位选取方案。

关于差信道的用途

差信道（即信道容量趋近于 0 的信道）在极化码中主要用于传输固定值（如全零序列）或不传输任何数据。这样做的目的是避免将宝贵的带宽资源浪费在低可靠性信道上，从而提升整体通信系统的性能。虽然表面上看，差信道并未直接提升系统的总性能，但它们的存在使得好信道能够承载更多的有用信息，间接实现了系统性能的整体优化。

查看全文

http://www.kler.cn/a/570553.html