源编码定理

离散无记忆源产生的代码必须被有效地表示,这是通信中的一个重要问题。为了实现这一点,需要有代码字来表示这些源代码。

例如,在电报中,我们使用摩尔斯电码,其中的字母用标记空格表示。如果考虑最常用的字母 E,则用 "。" 表示,而很少使用的字母 Q 则用 "--.-"

表示

让我们看一下框图。

Block Diagram

其中 Sk 是离散无记忆源的输出,bk 是源编码器的输出,用 01 表示。

编码序列使得接收器可以方便地对其进行解码。

假设源有一个包含 k 个不同符号的字母表,并且第 k 个符号 Sk 出现的概率为 Pk,其中 k = 0, 1…k-1

让长度为 lk 的编码器分配给符号 Sk 的二进制码字,以位为单位。

因此,我们将源编码器的平均码字长度 L 定义为

$$\overline{L} = \displaystyle\sum\limits_{k=0}^{k-1} p_kl_k$$

L 表示每个源符号的平均位数

如果 $L_{min} = \: \overline{L}$ 的最小 \: 可能 \: 值 \:

那么 编码效率 可以定义为

$$\eta = \frac{L{min}}{\overline{L}}$$

当 $\overline{L}\geq L_{min}$ 时,我们将得到 $\eta \leq 1$

但是,当 $\eta = 1$ 时,源编码器被认为是有效的

为此,必须确定 $L_{min}$ 的值。

让我们参考定义,"给定一个离散无记忆熵源 $H(\delta)$,平均码字长度 任何源编码的 L 都有界于 $\overline{L} \geq H(\delta)$。"

用更简单的话来说,代码字(例如:单词 QUEUE 的摩尔斯电码为 -.- ..- . ..- . )始终大于或等于源代码(示例中为 QUEUE)。这意味着,代码字中的符号大于或等于源代码中的字母。

因此,当 $L_{min} = H(\delta)$ 时,源编码器在熵 $H(\delta)$ 方面的效率可以写成

$$\eta = \frac{H(\delta)}{\overline{L}}$$

该源编码定理称为无噪声编码定理,因为它建立了无错误编码。它也被称为香农第一定理