面向web应用的数据库hadoop

eeq64g8w  于 2021-06-04  发布在  Hadoop
关注(0)|答案(3)|浏览(300)

我是hadoop的初学者。我只是想知道我是否可以使用hadoop作为web应用程序的后端,而不是使用关系数据库?

ppcbkaq5

ppcbkaq51#

在1行中…不…hadoop是用来批量处理大数据的。。。。

5cnsuln7

5cnsuln72#

你不能把hadoop和rdbms进行比较,因为它不是一个数据库。它只是为您提供了一个文件系统(hdfs),与其他文件系统一样,它缺乏随机读/写的能力。如果你真的想为你的web应用提供一个分布式的后端,你可以在hadoop之上使用hbase之类的东西。它将为您提供实时、随机的读/写功能。是的,最重要的是,hadoop最适合批处理,正如@abhinav已经说过的那样。

kqlmhetl

kqlmhetl3#

我认为答案是“不,你不应该”,但正如上面有人指出的那样,这并不是全部答案。
hadoop并不是rdbms的替代品,它既是一种分布式文件存储机制,也是一种分布式计算机制。这两件事本身并不能帮助一个网站。
现在有可能在hadoop中有大量的“大数据”,如果它本质上是一个“键/值”查找,就可以通过hbase获得这些数据。但是有相当多的键值存储可能更合适。
如果您仍然需要sql,那么有一些工具,比如hive或impala,以及其他一些可以提供类似sql的行为的工具。使用hive的缺点是它使用mapreduce—这意味着每个查询可能需要一分钟以上的时间!!!大报告可以,但其他的都不行。 Impala 应该会加速,但我没有实际的经验。

相关问题