假设我有一个tar.gz档案,里面有7个csv文件。如何操作这样一个tar.gz归档文件,以在单独的rdd或Dataframe中获取每个csv文件。我已经尝试过这里提到的可能性,但是我在一个rdd中获得了所有的7个csv文件,这和做一个简单的 sc.textFile() .我用的是spark 2*
sc.textFile()
目前还没有任何答案,快来回答吧!
暂无答案!
目前还没有任何答案,快来回答吧!