为什么来自rodbc的sqlquery在查询impala数据库时不总是返回相同的数据?

uemypmqf  于 2021-06-26  发布在  Impala
关注(0)|答案(1)|浏览(258)

我试图使用rodbc包中的sqlquery函数从impala数据库中获取一些数据。我从一个查询执行到另一个完全相同的查询执行的结果发生了变化。
我得到的data.frame并不总是具有相同的行数:

library("RODBC")
conn <- odbcConnect("Cloudera Impala DSN;host=mydb;port=21050")    
df<-sqlQuery(conn, "select * from hydrau.hydr where flight= 'V0051'")
dim(df)
[1] 26600   220
df<-sqlQuery(conn, "select * from hydrau.hydr where flight= 'V0051'")
dim(df)
[1] 142561   220
df<-sqlQuery(conn, "select * from hydrau.hydr where flight= 'V0051'")
dim(df)
[1] 23500   220

这个查询实际上应该返回一个142561 x 220的Dataframe。
另一方面,以下查询总是返回相同(正确)的结果:

sqlQuery(conn, "select count(*) from hydr where flight= 'V0051' ")
  count(*)
1   142561
fv2wmkja

fv2wmkja1#

看来我的问题是 Impala 没有足够的记忆力来表现好。

相关问题