假阳性与假阴性

machine learningpythonserver side programming

简介

准确预测与不准确预测的比率绘制在一个称为混淆矩阵的矩阵中。这指的是二元分类器的真阴性和真阳性(正确预测)与假阴性和假阳性(错误预测)的比率。在数据清理、预处理和解析之后，我们要做的第一件事就是将数据输入到一个有效的模型中，该模型自然会产生概率结果。不过请稍等!但我们如何评估模型的性能?

更高的性能，更好的效率——这正是我们想要的。这时，混淆矩阵就派上用场了。机器学习分类的过程评估就是混淆矩阵。本文将介绍假阳性和假阴性之间的区别。

它是使用机器学习进行分类问题的性能指标，其输出可以是两个甚至更多的类别。表中有四种可能的预测值和实际值组合。

与混淆矩阵相关的术语有 −

混淆矩阵的格式如下 −

让我们看一个例子 -

假设，我们想弄清楚血癌测试能多好地预测患者的感染状态。这里的冠状病毒测试用于区分两种可能的状态:感染和正常。

以下是假阳性和假阴性之间的一些主要区别 -

假阳性	假阴性
实际值为负，预测值为正的情况	实际值为正，预测值为负的情况。
也称为"I 类错误"	也称为"II 类错误"
具有两个类 True 和 False 的二元分类示例可以让您理解这一点。假阳性值是那些被认为属于"真"类的值，而实际上它们不属于，而是属于"假"类。	具有两个类 True 和 False 的二元分类场景可以让您理解这一点。假阴性值是那些被认为属于"假类别"但实际上属于"真类别"的值。
这显示了分类器错误预测期望结果的频率。	此错误显示了分类器错误预测不利结果的频率。
假阳性率，也称为误差，可以定义为假阳性与假阳性和真阴性之和的比率	假阴性与假阴性和真阳性之和的比率称为假阴性率，通常称为漏检率率
一封非垃圾邮件被错误地识别为垃圾邮件。	一封垃圾邮件被错误地识别为非垃圾邮件。