如果使用create\u dynamic\u frame\u from \u catalog(),则提供数据库名称和表名称,例如,从粘合爬虫创建的,它有效地命名特定的输入文件。我希望能够做同样的(命名一个特定的输入文件)没有爬虫和数据库。
我尝试使用create\u dynamic\u frame\u from\u options(),但是“path”连接选项显然不允许我命名文件。有什么办法吗?
如果使用create\u dynamic\u frame\u from \u catalog(),则提供数据库名称和表名称,例如,从粘合爬虫创建的,它有效地命名特定的输入文件。我希望能够做同样的(命名一个特定的输入文件)没有爬虫和数据库。
我尝试使用create\u dynamic\u frame\u from\u options(),但是“path”连接选项显然不允许我命名文件。有什么办法吗?
1条答案
按热度按时间vhipe2zx1#
iiuc,您想从一个特定的s3路径读取多个文件,并希望文件名在您的Dataframe中。您可以通过使用spark会话并将其读取为pysparkDataframe来实现这一点