我们有一个进程,我们在GCP桶中接收.csv文件。我们已经创建了一个指向该源的外部表。我们希望向表中添加一个额外的列,该列存储文件中每条记录的row number。我做了一些研究,但无法找到一种方法来添加此列而不触及文件。如果我想在从这个表读取的查询中添加一个row_number(),我也需要一个order by列,但我没有任何列。如果我不添加order by,结果是不确定的。还有别的办法吗?
row number
order by
eqzww0vc1#
您可以使用gcs存储桶中存储的csv文件为您的需求创建外部表,可以考虑以下查询:
Create EXTERNAL table `project-id.dataset.table` options (format='csv' ,uris=["gs://file-location.csv"])
CSV数据:
A,B,C 47803,629,785 3809, 897,657
要添加row_number()列,可以考虑以下查询。
SELECT ROW_NUMBER() OVER() row_number, * from `project-id.dataset.table`
输出:
1条答案
按热度按时间eqzww0vc1#
您可以使用gcs存储桶中存储的csv文件为您的需求创建外部表,可以考虑以下查询:
CSV数据:
要添加row_number()列,可以考虑以下查询。
输出: