Python 中的逻辑回归 - 案例分析

假设一家银行联系您开发一个机器学习应用程序,该应用程序将帮助他们识别愿意开立定期存款(某些银行也称为定期存款)的潜在客户。 银行定期通过电话或网络表格的方式进行调查,以收集有关潜在客户的信息。该调查本质上是一般性的,并且是在非常大的受众中进行的,其中许多人可能对与该银行本身打交道不感兴趣。 在其余的人中,只有少数人可能有兴趣开设定期存款。其他人可能对银行提供的其他便利感兴趣。 因此,该调查不一定是为了识别开 TD 的客户。 您的任务是从银行将要与您共享的大量调查数据中识别出所有那些很有可能开设 TD 的客户。

幸运的是,对于那些有志于开发机器学习模型的人来说,这样的数据是公开可用的。此数据由加州大学欧文分校的一些学生在外部资助下提供。 该数据库作为 UCI 机器学习库 的一部分提供,被全世界的学生、教育工作者和研究人员广泛使用。 数据可以从 https://archive.ics.uci.edu/ml/datasets/bank+marketing 下载。

在接下来的章节中,让我们现在使用相同的数据进行应用程序开发。