我在做spotify的案例研究。我发现spotify使用cassandra作为数据库,还使用hadoop。我的问题是,hadoop与数据库有何不同。hadoop datanode存储什么类型的文件?为什么每个公司都有db和hadoop。我知道hadoop不是db,但是如果有db cluster来保存数据,它是用来做什么的呢?
iaqfqrcu1#
hadoop根本不是一个数据库。hadoop是一组用于分布式存储和处理的工具,如分布式文件系统(hdfs)、mapreduce框架库、yarn资源管理器。其他工具如hive、spark、pig、giraph、sqoop等都可以使用hadoop或其组件。例如,hive是一个数据库。它使用hdfs存储数据,使用mapreduce框架原语构建查询执行图。
1条答案
按热度按时间iaqfqrcu1#
hadoop根本不是一个数据库。hadoop是一组用于分布式存储和处理的工具,如分布式文件系统(hdfs)、mapreduce框架库、yarn资源管理器。
其他工具如hive、spark、pig、giraph、sqoop等都可以使用hadoop或其组件。例如,hive是一个数据库。它使用hdfs存储数据,使用mapreduce框架原语构建查询执行图。