我通过kafka传输增量web日志,然后将其存储到hdfs中。我的web日志包含部分信息,例如,如果我的配置单元表架构中有10列,我可能只通过修改其值的日志接收6个字段。现在在更新/合并到配置单元表期间,6个字段被新值修改,其余4个字段被空值替换。目前,我正在为这些任务探索kylo/nifi框架。我在hive中寻找的方法是,这4列将与以前的状态保持一致。
目前还没有任何答案,快来回答吧!
暂无答案!
目前还没有任何答案,快来回答吧!