我正在尝试从数据库中的数据库的每个表中获取最小和最大日期。
我已经从以下内容开始:
results =[]
tables_list = spark.sql('show tables in table')
for row in tables_list.collect():
tablename = row.tableName
min_update = spark.sql(f"SELECT MIN(date) FROM table.{tablename}").collect()[0][0]
max_update = spark.sql(f"SELECT MAX(date) FROM table.{tablename}").collect()[0][0]
results.append((tablename,min_update,max_update))
df_update = spark.createDataFrame(results, schema = ['tablename', 'min_update', 'max_update'])
但是当我df_update.display()
时,我只得到了最后一个表,其中我希望有60个表,每个表的每行都有最大和最小日期。
1条答案
按热度按时间w1jd8yoj1#