如何在googlebigquery中从连续上传的kafka文本文件创建表到google云存储中

gj3fmq9x  于 2021-06-04  发布在  Kafka
关注(0)|答案(1)|浏览(302)

我想从云存储创建bigquery表。Kafka蒸汽作为文本文件上传到云存储每5分钟。我想创建bigquery表使用的是每5分钟更新一次,从更新的文件到bigquery。最好的方法是什么?请给我一些建议

zqdjd7g9

zqdjd7g91#

您可以使用googlecloud函数来检测文件何时上载,然后执行一些代码来索引该文件。
或者,我相信已经存在一个bigquery-kafka连接器,所以您可以跳过gcs,除非您需要原始数据(注意:二进制文件的存储成本比纯文本低,而且bigquery支持读取各种格式)

相关问题