敏捷数据科学 - 部署预测系统
在此示例中,我们将学习如何创建和部署预测模型,该模型有助于使用 python 脚本预测房价。 用于部署预测系统的重要框架包括Anaconda和"Jupyter Notebook"。
按照以下步骤部署预测系统 −
步骤 1 − 实现以下代码将 csv 文件中的值转换为关联值。
import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import mpl_toolkits %matplotlib inline data = pd.read_csv("kc_house_data.csv") data.head()
上面的代码生成以下输出−
步骤 2 − 执行describe函数获取csv文件属性中包含的数据类型。
data.describe()
步骤 3 − 我们可以根据我们创建的预测模型的部署删除关联值。
train1 = data.drop(['id', 'price'],axis=1) train1.head()
步骤 4 − 您可以根据记录可视化数据。 数据可用于数据科学分析和白皮书输出。
data.floors.value_counts().plot(kind='bar')