什么是 BigQuery Studio?
在建立了基础产品知识和理论后,是时候返回 Google Cloud Console 并进入 BigQuery Studio 了。 BigQuery Studio 曾被简称为"SQL 工作区",用户不仅可以在其中运行 BigQuery 查询,还可以在其中运行一系列其他数据和 AI 工作流。
BigQuery 的目标是提供一个与 GitHub 类似的空间,让用户能够编写和部署 SQL、Spark 甚至 Python 代码,同时保留版本历史记录并促进数据团队之间的协作。
SQL 查询、Python Notebook、数据画布
第一次打开 BigQuery Studio 时,会让人联想到任何其他 SQL IDE。但是,与本地 SQL IDE 不同的是,BigQuery 打开时会为您提供三种操作选择 −
- SQL 查询
- Python 笔记本
- 数据画布
单击 SQL 查询应打开一个空白页,您可以在其中编写和运行查询。因此,SQL 查询和 Python 笔记本选项应该是不言自明的。数据画布是一种 AI 集成,本教程不会介绍它。
假设您已经创建或有权访问 BigQuery 项目,在左侧菜单中,您将看到项目名称的下拉菜单,后跟该项目范围内的任何数据集。
单击其中任何数据集,您将看到在该数据集内创建的表。
在底部,您将看到与您运行的 SQL 作业相关的信息。这些作业分为"个人"作业(由您的个人资料创建和运行的查询)或"项目"作业(允许您查看项目内运行的作业的所有元数据)。
在 BigQuery Studio 中保存工作可以通过没有版本历史记录、"经典"保存查询或有版本历史记录来实现。保存功能还允许轻松创建视图,这将在后面的章节中更深入地介绍。