基础机器学习

人工智能 (AI) 是任何使计算机能够模仿人类认知行为或智能的代码、算法或技术。机器学习 (ML) 是人工智能的一个子集,它使用统计方法使机器学习并通过经验进行改进。深度学习是机器学习的一个子集,它使多层神经网络的计算成为可能。机器学习被视为浅层学习,而深度学习被视为具有抽象的分层学习。

机器学习涉及广泛的概念。概念列于下方 −

  • 监督
  • 无监督
  • 强化学习
  • 线性回归
  • 成本函数
  • 过度拟合
  • 欠拟合
  • 超参数等

在监督学习中,我们学习从标记数据中预测值。一种有用的 ML 技术是分类,其中目标值是离散值;例如,猫和狗。机器学习中另一种可以提供帮助的技术是回归。回归作用于目标值。目标值是连续值;例如,可以使用回归分析股票市场数据。

在无监督学习中,我们从未标记或结构化的输入数据中进行推断。如果我们有一百万份医疗记录,并且必须理解它,找到底层结构、异常值或检测异常,我们会使用聚类技术将数据划分为广泛的集群。

数据集分为训练集、测试集、验证集等。

2012 年的一项突破使深度学习的概念脱颖而出。一种算法使用 2 个 GPU 和大数据等最新技术成功地将 100 万张图像分为 1000 个类别。

深度学习与传统机器学习的关系

传统机器学习模型遇到的主要挑战之一是称为特征提取的过程。程序员需要具体地告诉计算机需要注意的特征。这些特征将有助于做出决策。

将原始数据输入算法很少奏效,因此特征提取是传统机器学习工作流程的关键部分。

这给程序员带来了巨大的责任,算法的效率在很大程度上取决于程序员的创造力。对于诸如对象识别或手写识别等复杂问题,这是一个巨大的问题。

深度学习具有学习多层表示的能力,是帮助我们自动提取特征的少数方法之一。可以假设较低的层正在执行自动特征提取,几乎不需要程序员的指导。