是否可以在Streamsets数据收集器中读取hive表(或parquet格式的HDFS数据)?我不想使用Transformer。
rsaldnfx1#
在parquet中阅读原始文件与数据收集器的工作方式相反,因此这将是transformer的一个更好的用例。但是我已经成功地使用了来自Impala或Hive的jdbc源代码来实现这一点,使用jdbc源代码还有一些额外的障碍。
1条答案
按热度按时间rsaldnfx1#
在parquet中阅读原始文件与数据收集器的工作方式相反,因此这将是transformer的一个更好的用例。
但是我已经成功地使用了来自Impala或Hive的jdbc源代码来实现这一点,使用jdbc源代码还有一些额外的障碍。