我不是一个Maven,我不希望使用hadoop的Spark出于各种原因。我已经编写了一些简单的spark代码,在独立模式下似乎可以很好地扩展。
我们计划购买一个新的服务器,它有大量的内核(>=64),运行在外部nfs上。不过,服务器也有一个不错的本地存储容量(约20 tb)。在我们购买之前,我打算要求一些对数据科学有用的基准。然而,像英特尔的hibench这样的需要hadoop。
你能推荐一些spark的基准测试,可以在linux兼容的fs(比如ext4、xfs等)上运行吗?我试着找到好的候选人,但找不到太多。任何反馈都将不胜感激。
暂无答案!
目前还没有任何答案,快来回答吧!