敏捷数据科学 - 敏捷工具和安装
在本章中,我们将了解不同的敏捷工具及其安装。 敏捷方法的开发堆栈包括以下一组组件−
事件
事件是指发生或记录的事件及其特征和时间戳。
事件可以有多种形式,例如服务器、传感器、金融交易或用户在我们的应用程序中采取的操作。 在这个完整的教程中,我们将使用 JSON 文件来促进不同工具和语言之间的数据交换。
收集器
收集器是事件聚合器。 它们以系统的方式收集事件,以存储和聚合大量数据,使实时工作人员能够采取行动。
分发文档
这些文档包括以特定格式存储文档的多节点(多个节点)。 在本教程中我们将重点关注 MongoDB。
Web 应用程序服务器
Web应用程序服务器通过可视化方式通过客户端将数据以JSON形式提供,并且开销最小。 这意味着 Web 应用程序服务器有助于测试和部署使用敏捷方法创建的项目。
现代浏览器
它使现代浏览器或应用程序能够将数据作为用户的交互工具呈现。
本地环境设置
对于管理数据集,我们将重点关注 python 的 Anaconda 框架,其中包括用于管理 excel、csv 和更多文件的工具。 Anaconda框架安装完成后的仪表板如下图所示。 它也被称为"Anaconda Navigator"−
导航器包含"Jupyter 框架",这是一个有助于管理数据集的笔记本系统。 启动框架后,它将托管在浏览器中,如下所述−