有一个包含多个视图和表的数据库。我需要创建一个报告(数据库文档),其中包含这些表中所有字段的列表,这些字段指示类型,如果可能,还指示第一行的最小值/最大值和值。例如:
.------------.--------.--------.--------------.--------------.--------------.
| Table name | Column | Type | MinValue | MaxValue | FirstRow |
:------------+--------+--------+--------------+--------------+--------------:
| Table1 | day | date | ‘2010-09-17’ | ‘2016-12-10’ | ‘2016-12-10’ |
:------------+--------+--------+--------------+--------------+--------------:
| Table1 | price | double | 1030.8 | 29485.7 | 6023.8 |
:------------+--------+--------+--------------+--------------+--------------:
| … | | | | | |
:------------+--------+--------+--------------+--------------+--------------:
| TableN | day | date | ‘2014-06-20’ | ‘2016-11-28’ | ‘2016-11-16’ |
:------------+--------+--------+--------------+--------------+--------------:
| TableN | owner | string | NULL | NULL | ‘Joe’ |
'------------'--------'--------'--------------'--------------'--------------'
我认为执行许多查询
SELECT MAX(column_name) as max_value, MIN(column_name) as min_value
FROM table_name
对于存储在hadoop中的大型表将是无效的。
阅读文档后发现一篇关于“Hive中的统计信息”的文章,似乎我必须这样使用请求:
ANALYZE TABLE tablename COMPUTE STATISTICS FOR COLUMNS;
但此命令以错误结束:
处理语句时出错:失败:执行错误,从org.apache.hadoop.hive.ql.exec.columnstatsttask返回代码1
我是否正确理解此请求将信息添加到表的描述中而不显示结果?这个请求对view有效吗?
请建议如何有效地自动为配置单元中的数据库创建文档?
暂无答案!
目前还没有任何答案,快来回答吧!