我在hdfs中有pst或email文件。现在,我想用hadoop中最适合的组件进行文本分析。我该怎么开始呢。我是否必须首先从这些文件中提取实际内容并将其存储在某个位置(例如,在文本文件中),然后对文本文件运行分析?请建议我。p、 s:我是在谷歌搜索的时候发现这个的。这是唯一的选择还是其他解决方案。
目前还没有任何答案,快来回答吧!
暂无答案!
目前还没有任何答案,快来回答吧!