关于删除spark rdd的第一行,我看到了很多问题,每个解决方案都是这样的:
val header = data.first val rows = data.filter(line => line != header)
这个解决方案是否扫描了整个rdd,并对rdd的每一行进行了if检查,只是为了删除最上面的一行?没有更好的方法获得没有第一行的rdd吗?
目前还没有任何答案,快来回答吧!
暂无答案!
目前还没有任何答案,快来回答吧!