数字数据-高容量+高速度+快速检索

t3psigkw  于 2021-06-03  发布在  Hadoop
关注(0)|答案(1)|浏览(326)

我的数据看起来像是每帧1000万个数值(实数+二进制数)(比如数组,一行数组中有1000万个元素),每秒大约有100帧。有点像时间序列。
我面临的挑战是:
(1) 存储-数据量
(2) 数据处理速度
(3) 实时分析
Cassandra适合这样吗?有谁能给我一点关于应用程序体系结构的指导(想想hadoop、cassandra、kafka、storm等等),它将在上面的场景中得到解决(从一个非常高的层次来看)。
我知道我问了个大问题。在实验之前我需要一个方向。

tyky79it

tyky79it1#

作为数据的存储引擎或处理速度,cassandra和hadoop将大放异彩。
现在进入实时部分,cassandra可以为您提供一个近乎实时的解决方案,其中仅使用hadoop是不够的(批处理性质,map reduce作业)。您可以尝试使用hadoop和storm,这将为您提供近乎实时的功能,但它会增加解决方案的复杂性(使用喷口和螺栓)。您也可以尝试一些规则引擎,这将为您提供一个额外的优势,对实时解决方案。

相关问题