我有一个10 tb大小的表,有2k+个分区,每个分区有大约300个小文件,你能帮我在不影响目录结构的情况下解决小文件问题吗。我尝试过shuffle选项,它减少了小表的文件,但不适用于大表。
目前还没有任何答案,快来回答吧!
暂无答案!
目前还没有任何答案,快来回答吧!