从文本中提取近实时表情符号

polkgigr  于 2021-06-06  发布在  Kafka
关注(0)|答案(0)|浏览(435)

我有一个可能包含表情符号的文本流。我需要提取到数组中的规模接近实时,然后存储在ElasticSearch。这个流在apachenifi中以大约每秒100条tweet的速度流动。
对于这种需求,最好或更好的解决方案/体系结构是什么?我有以下几个想法。
a) 创建一个web服务,从输入文本中提取emoji,然后将nifi流发送给它,然后收集响应。

b) 与上一步相同,加上使用apachekafka。

c) 更改架构以使用apachespark、storm或flink的某些功能。

d) elasticsearch自定义Map?

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题