我必须将一个df与另一个df进行比较,后者与从特定路径读取的模式相同,但可能在该路径中没有文件,因此我认为必须将其与一个空df进行比较,后者的列与原始df相同。
所以我试图用另一个包含很多列的df的模式创建一个df,但是我找不到解决这个问题的方法。我一直在读以下帖子,但没有人帮我:
如何用指定的模式创建空Dataframe?
如何创建空Dataframe?为什么“valueerror:rdd为空”?
如何在spark中创建空Dataframe
在斯卡拉我怎么做?还是换个选择好?
我必须将一个df与另一个df进行比较,后者与从特定路径读取的模式相同,但可能在该路径中没有文件,因此我认为必须将其与一个空df进行比较,后者的列与原始df相同。
所以我试图用另一个包含很多列的df的模式创建一个df,但是我找不到解决这个问题的方法。我一直在读以下帖子,但没有人帮我:
如何用指定的模式创建空Dataframe?
如何创建空Dataframe?为什么“valueerror:rdd为空”?
如何在spark中创建空Dataframe
在斯卡拉我怎么做?还是换个选择好?
1条答案
按热度按时间vawmfj5a1#
originalDF.limit(0)
将返回具有相同架构的空Dataframe。