有没有可能在自定义格式的文件上使用作业书签和aws胶水作业?

4dbbbstv  于 2021-05-27  发布在  Hadoop
关注(0)|答案(1)|浏览(357)

请查看本文:https://docs.aws.amazon.com/glue/latest/dg/monitor-continuations.html
它说可以为json格式的文件启用作业书签。
我们的格式是基于行的,如下所示:

[{"a":"a"}, {"b":"b"}]
[{"c":"c"}, {"d":"d"}]
...

所以每一行都是一个有效的json,但整个文件不是。
有没有可能使用作业书签与aws胶水作业,有我们的格式?

11dmarpk

11dmarpk1#

1) 问题的一部分,回复:s3中的文件,“对于AmazonS3输入源,aws glue job书签检查对象的上次修改时间,以验证哪些对象需要重新处理。如果您的输入源数据在上次运行作业后已被修改,则在再次运行作业时将重新处理这些文件。“

相关问题