使用hadoop对json或从web中提取的非结构化数据进行文本分析和统计分析

a0zr77ik  于 2021-06-02  发布在  Hadoop
关注(0)|答案(0)|浏览(262)

我正在从web上提取数据,将其转换成json格式,然后使用apacheflume将其存储到hadoopfs中。因此,flume在hadoop上存储数据时将其作为我们的文件。现在我想随机访问这些数据,然后对其进行文本分析或统计分析。做这件事的最佳方法是什么?

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题