概率分布在生成模型中的作用
机器学习 (ML) 和深度学习 (DL) 的进步使机器能够从过去的数据中学习,甚至从看不见的数据中进行预测。生成模型就是这样一种进步,它捕获数据的底层分布并生成与原始训练数据相当的新数据。但他们是如何做到的呢?
借助概率分布,生成模型可以管理数据中的不确定性和变化。阅读本章以了解概率分布、其类型、其在生成模型中的用途及其应用。
什么是概率分布?
概率分布是一个数学函数,表示给定范围内随机变量的不同可能值的概率。我们可以使用图形或概率表来描述概率分布。
例如,想象一下抛硬币,有一个概率分布告诉我们掷出正面或反面的概率。以下概率表对此进行了描述 −
结果 | 概率 |
---|---|
正面 | 0.5 |
反面 | 0.5 |
概率分布是频率分布 (FD) 的理论表示。在统计学中,FD 描述数据集中变量出现的次数。另一方面,概率分布与发生次数的频率一起,也为它们分配概率。
我们知道概率,表示某事发生的可能性是一个数字,介于 0(表示不可能)和 1(表示肯定)之间。这就是为什么一个值的概率越高,代表它在样本中出现的频率就越高。
概率分布的类型
有两种类型的概率分布 −
- 离散概率分布
- 连续概率分布
让我们仔细看看这两种类型的概率分布。
离散概率分布
离散概率分布是描述离散或分类随机变量中不同事件发生概率的数学函数。
离散概率分布仅包括具有可能概率的值。简而言之,它不包括任何概率为零的值。例如,5.5 不是掷骰子的可能结果,因此它不包括掷骰子的概率分布。
离散概率分布中所有可能值的概率总和始终为 1。
让我们看一些常见的离散概率分布 −
离散概率分布 | 解释 | 示例 |
---|---|---|
伯努利分布 | 它描述了单次实验中成功 (1) 或失败 (0) 的概率。 | 单次抛硬币的结果。 |
二项分布 | 它以 p 概率对固定次数 n 的试验中的成功次数进行建模。 | 抛硬币 10 次,出现正面的次数。 |
泊松分布 | 预测在固定时间间隔或空间内发生的 k 个事件。 | 每天收到的电子邮件数量。 |
几何分布 | 表示在一系列试验中第一次成功所需的试验次数。 | 抛硬币直到正面的次数。 |
超几何分布 | 计算从有限总体中抽出特定数量的成功的概率。 | 从一袋混合颜色的球中抽出的红球数量球。 |
连续概率分布
顾名思义,连续概率分布是描述连续值范围内不同事件发生概率的数学函数。
连续概率分布包含无限多个可能值。例如,在区间 [4, 5] 中,4 到 5 之间有无限多个值。
让我们看看一些常见的连续概率分布 −
连续概率分布 | 解释 | 示例 |
---|---|---|
连续均匀分布 | 它为相等大小间隔内的所有值分配相等的概率。 | 一个人的身高在 5 到 6 英尺之间。 |
正态(高斯)分布 | 它形成一个钟形曲线,并描述聚集在平均值和对称尾部周围的数据。 | 智商得分 |
指数分布 | 它模拟泊松过程中事件之间的时间,其中事件以恒定速率发生。 | 到下一个客户的时间到达。 |
对数正态分布 | 它表示在对数刻度上绘制时右偏数据。 | 股票价格、收入分布等。 |
Beta 分布 | 它描述限制在有限间隔内的随机变量。它经常用于贝叶斯统计。 | 二项式试验成功的概率。 |
概率分布在生成模型中的应用
概率分布在生成模型中起着至关重要的作用。让我们来看看概率分布在生成模型中的一些重要用途 −
- 数据分布 − 生成模型旨在捕捉样本所取数据的底层概率分布。
- 生成新样本 − 一旦了解了数据分布,生成模型就可以生成与原始数据集相当的新数据。
- 评估和训练 − 概率分布用于评估和训练生成模型。 可能性、困惑度和 Wasserstein 距离等评估指标用于评估生成的样本与原始数据集相比的质量。
- 可变性和不确定性 − 概率分布用于查找数据中存在的可变性和不确定性。生成模型可以使用这些信息来生成独特且真实的样本。
概率分布的应用
在各个领域中,有大量使用概率分布的生成建模任务,其中一些列在下面 −
- 图像生成 − 生成对抗网络 (GAN) 和变分自动编码器 (VAE) 等生成模型使用概率分布从头开始生成逼真的图像。这在计算机图形学、创意设计和内容生成中都有应用。
- 文本合成 − 语言模型(例如 OpenAI 的 ChatGPT)使用概率分布根据给定的提示或输入生成相关的文本输出。这在聊天机器人、虚拟助手和自动内容生成系统中都有应用。
- 异常检测 − 生成模型通过学习正常数据的底层概率分布,可用于数据集中的异常检测和异常值识别。这在欺诈检测、网络安全和医疗诊断中都有应用。
结论
在本章中,我们解释了概率分布在生成建模中的关键作用。我们首先介绍了什么是概率分布及其类型,即离散概率分布和连续概率分布。
离散概率分布描述离散或分类随机变量中不同事件发生的概率,而连续概率分布描述连续值范围内不同事件发生的概率。我们还重点介绍了离散和连续概率分布下的一些常见概率分布。
我们展示了数据分布、生成新样本、评估和训练是如何在生成模型中使用概率分布来生成新样本的一些重要方式。我们还重点介绍了概率分布在生成模型任务(如图像生成、文本合成和异常检测)中的各种应用。