BigQuery - 编写第一个查询
可以在查询编辑器中打开一个空白页,但最好直接从表选择步骤编写第一个查询以避免语法错误。
要以这种方式编写第一个查询,请先导航到包含您要查询的表的数据集。单击"查看表"。在上面的面板中,选择"查询"。按照此过程将打开一个新窗口,其中已填充表名以及创建者添加的任何限制。
例如,表可能需要 WHERE 子句,或者建议的查询可能会将用户限制为 1000 行。为了遵循最佳实践,请将" * "替换为您要查询的列的名称。
- 如果向 SELECT 添加任何聚合,请注意包含 GROUP BY 子句
- 如果您想格外警惕语法错误,还可以通过单击提供的架构中的列名来选择它们。
如果您按照这些步骤操作,则无需编写表名。但是,要养成制定正确表引用的习惯,请记住公式为:project.dataset.table。这些元素都括在反引号(而不是引号)中。
BigQuery Studio 的一个独特元素是 IDE 会告诉您查询是否会运行。这将通过绿色复选标记表示。
确认一切正确后,点击运行。查询运行时,您将看到执行指标,例如处理的数据、查询运行所需的时间和所需的步骤数。如果您查看底部面板,您还会看到运行所需的插槽(Slot)数量。
在 Cloud Shell 终端上编写您的第一个查询
与在 UI 中查询一样,在 Cloud Shell 终端中查询遵循类似的结构,并允许用户使用 SQL 语法访问和操作数据。
"bq"查询及其常用标志
使用命令 bq query,在 Cloud Shell 中编写和执行查询非常简单。在同一行中,用户可以提供指示执行某些方面的标志。
bq 查询命令的一些更常见标志包括 −
- –allow-large-results(不会因结果较大而取消作业)
- –batch = {true | false
- –clustering-fields = [ ]
- –destination-table = table_name
您可能会注意到,所有这些参数都对应于在 UI 中创建表或运行查询时出现的下拉菜单。
要在 Cloud Shell 中运行查询 −
- 登录 GCP
- 进入 Cloud Shell 终端
- 身份验证(自动完成)
- 编写并执行查询
看起来像 −
(ornate-reaf-332816)$ bq query --use_legacy_sql=false \ 'SELECT * FROM ornate-reef-332816.sample_dataset.bikeshare_2022_stsore_date';
结果显示为终端输出。虽然结果不像 BigQuery UI 结果那样呈现,但输出仍然整洁且易于理解。