我正在尝试连接ksql中的两个表。其思想是在联接查询的顶部创建一个持久表。我使用的是完全外连接。
来源1:kafka主题->ksql流->ksql表
按表格顺序排列的示例数据:
Key,Product_Name,Product_category
Product_1|Category_1|2018-08-25,Product_1,Category_1
Product_2|Category_2|2018-08-25,Product_2,Category_2
Product_3|Category_3|2018-08-25,Product_3,Category_3
Product_4|Category_4|2018-08-25,Product_4,Category_4
Product_5|Category_5|2018-08-25,Product_5,Category_5
来源2:kafka主题->ksql流->ksql表
表产品中的示例数据:
Key,Product_Name,Product_category
Product_1|Category_1|2018-08-25,Product_1,Category_1
Product_2|Category_2|2018-08-25,Product_2,Category_2
Product_3|Category_3|2018-08-25,Product_3,Category_3
Product_4|Category_4|2018-08-25,Product_4,Category_4
Product_5|Category_5|2018-08-25,Product_5,Category_5
源1中的数据流是连续的,而源2中的数据流是固定的,设置为每天一次。
联接查询:
Create Table Order_Joined_Product as
select
A.key as Order_Key,
A.Product_Name as Order_Product,
A.Product_Category as Order_category,
B.key as Product_Key,
B.Product_Name as Product,
B.Product_Category as Product_category
from Order as A
FULL JOIN PRODUCT as B on A.Key=B.Key
现在,问题是如果我对联接表it进行计数,order\u key计数会随着时间的推移不断增加,product\u key计数会随着时间的推移不断减少。
我想达到的是,在一天结束时,我想看到产品的数量,其中在来源1,而不是在2和产品的数量是来源2,而不是在1。
暂无答案!
目前还没有任何答案,快来回答吧!