敏捷数据科学 - 部署预测系统

在此示例中,我们将学习如何创建和部署预测模型,该模型有助于使用 python 脚本预测房价。 用于部署预测系统的重要框架包括Anaconda和"Jupyter Notebook"。

按照以下步骤部署预测系统 −

步骤 1 − 实现以下代码将 csv 文件中的值转换为关联值。

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import mpl_toolkits

%matplotlib inline
data = pd.read_csv("kc_house_data.csv")
data.head()

上面的代码生成以下输出−

上述代码生成

步骤 2 − 执行describe函数获取csv文件属性中包含的数据类型。

data.describe()
描述函数

步骤 3 − 我们可以根据我们创建的预测模型的部署删除关联值。

train1 = data.drop(['id', 'price'],axis=1)
train1.head()
关联值

步骤 4 − 您可以根据记录可视化数据。 数据可用于数据科学分析和白皮书输出。

data.floors.value_counts().plot(kind='bar')

数据科学分析