**结束了。**这个问题离题了。它目前不接受答案。
**想改进这个问题吗?**更新问题,使其成为堆栈溢出的主题。
8年前关门了。
改进这个问题
我正在寻找一个多服务器大数据示例应用程序,它可以用来(a)试验安装和配置大数据应用程序,以及(b)作为开发此类应用程序的示例起点-编辑代码、进行一些更改等。。。在大多数技术(例如javaee)中,这样的应用程序非常常见,作为一个起点非常有用。
如果它可以用于基准测试,那就更好了。
如果它使用hadoop、cassandra、hbase、mongodb、hive、redis中的一个(或多个),那就太好了。
谢谢!
1条答案
按热度按时间js5cn81o1#
您可以使用terasort,这是hadoop打包的基准测试。它对数TB的数据进行排序,并用于对新的hadoop集群进行压力测试。这是世界的一部分
hadoop-x.y.z-examples.jar
hadoop安装附带的文件。要使用它,请使用teragen将数据生成到hdfs中,然后运行terasort。