用hadoop绘制大型数据集

k3fezbri  于 2021-06-03  发布在  Hadoop
关注(0)|答案(1)|浏览(463)

就目前的情况来看,这个问题并不适合我们的问答形式。我们希望答案能得到事实、参考资料或专业知识的支持,但这个问题可能会引发辩论、争论、投票或广泛讨论。如果您觉得这个问题可以改进,并可能重新打开,请访问帮助中心寻求指导。
8年前关门了。
我正在寻找一个框架,一个框架的组合,最佳实践,或者一个关于用hadoop可视化大型数据集的教程。
我不是在寻找一个框架来可视化运行hadoop作业或在hadoop上管理磁盘空间的机制。我正在寻找一种方法或一个可视化的数据包含在hdfs使用图形和图表等指导方针。
例如,假设我有一组数据点存储在hdfs中的多个文件中,我想显示数据的直方图。我唯一的选择是编写一个自定义的map/reduce作业,它将尝试找出哪些点落在哪个bucket中,将总数写入一个文件,然后使用绘图库将其可视化?
我需要推出一个定制的解决方案,还是有其他人在做这种事情?我试着在网上找,但找不到与此直接相关的东西。
谢谢你的帮助

bvuwiixz

bvuwiixz1#

我们在datameer做类似的事情。这些文件需要更多的处理步骤来实现我们的可视化,但是我们在hadoop上本机运行,所以这些文件不会太远。

相关问题