我试图使用rodbc包中的sqlquery函数从impala数据库中获取一些数据。我从一个查询执行到另一个完全相同的查询执行的结果发生了变化。
我得到的data.frame并不总是具有相同的行数:
library("RODBC")
conn <- odbcConnect("Cloudera Impala DSN;host=mydb;port=21050")
df<-sqlQuery(conn, "select * from hydrau.hydr where flight= 'V0051'")
dim(df)
[1] 26600 220
df<-sqlQuery(conn, "select * from hydrau.hydr where flight= 'V0051'")
dim(df)
[1] 142561 220
df<-sqlQuery(conn, "select * from hydrau.hydr where flight= 'V0051'")
dim(df)
[1] 23500 220
这个查询实际上应该返回一个142561 x 220的Dataframe。
另一方面,以下查询总是返回相同(正确)的结果:
sqlQuery(conn, "select count(*) from hydr where flight= 'V0051' ")
count(*)
1 142561
1条答案
按热度按时间fv2wmkja1#
看来我的问题是 Impala 没有足够的记忆力来表现好。