敏捷数据科学 - 使用报告
在本章中,我们将学习报告创建,这是敏捷方法论的一个重要模块。 敏捷冲刺将通过可视化创建的图表页面转化为成熟的报告。 通过报告,图表变得交互式,静态页面变得动态且与网络相关的数据。 数据价值金字塔报告阶段的特征如下图所示−
我们将更加注重创建csv文件,该文件可以用作数据科学分析的报告,并得出结论。 尽管敏捷侧重于减少文档,但始终会考虑生成报告以提及产品开发的进度。
import csv #---------------------------------------------------------------------- def csv_writer(data, path): """ Write data to a CSV file path """ with open(path, "wb") as csv_file: writer = csv.writer(csv_file, delimiter=',') for line in data: writer.writerow(line) #---------------------------------------------------------------------- if __name__ == "__main__": data = ["first_name,last_name,city".split(","), "Tyrese,Hirthe,Strackeport".split(","), "Jules,Dicki,Lake Nickolasville".split(","), "Dedric,Medhurst,Stiedemannberg".split(",") ] path = "output.csv" csv_writer(data, path)
上面的代码将帮助您生成如下所示的"csv文件"−
让我们考虑一下 csv(逗号分隔值)报告的以下好处 −
- 它人性化且易于手动编辑。
- 实现和解析都很简单。
- CSV 可以在所有应用程序中进行处理。
- 它更小,处理速度更快。
- CSV 遵循标准格式。
- 它为数据科学家提供了简单的架构。