我们有来自操作系统的事务性每小时数据和每日批量加载数据,我们将这些数据设计成ms sql server环境中的数据仓库维度(和事实)。如果推荐,我们可以应用什么快速有效的技术(flume、sqoop、kafka、hdfs、hbase、hive、kudu、spark、impla)在hadoop中实现这一点?假设mssqlserver数据仓库每小时使用这些维度。
我们有来自操作系统的事务性每小时数据和每日批量加载数据,我们将这些数据设计成ms sql server环境中的数据仓库维度(和事实)。如果推荐,我们可以应用什么快速有效的技术(flume、sqoop、kafka、hdfs、hbase、hive、kudu、spark、impla)在hadoop中实现这一点?假设mssqlserver数据仓库每小时使用这些维度。
1条答案
按热度按时间htrmnn0y1#
一个可能的选择是nifi或minifi
https://nifi.apache.org/