自动生成有关数据库结构的文档

798qvoo8  于 2021-05-29  发布在  Hadoop
关注(0)|答案(0)|浏览(122)

有一个包含多个视图和表的数据库。我需要创建一个报告(数据库文档),其中包含这些表中所有字段的列表,这些字段指示类型,如果可能,还指示第一行的最小值/最大值和值。例如:

.------------.--------.--------.--------------.--------------.--------------.
| Table name | Column |  Type  |   MinValue   |   MaxValue   |   FirstRow   |
:------------+--------+--------+--------------+--------------+--------------:
| Table1     | day    | date   | ‘2010-09-17’ | ‘2016-12-10’ | ‘2016-12-10’ |
:------------+--------+--------+--------------+--------------+--------------:
| Table1     | price  | double | 1030.8       | 29485.7      | 6023.8       |
:------------+--------+--------+--------------+--------------+--------------:
| …          |        |        |              |              |              |
:------------+--------+--------+--------------+--------------+--------------:
| TableN     | day    | date   | ‘2014-06-20’ | ‘2016-11-28’ | ‘2016-11-16’ |
:------------+--------+--------+--------------+--------------+--------------:
| TableN     | owner  | string | NULL         | NULL         | ‘Joe’        |
'------------'--------'--------'--------------'--------------'--------------'

我认为执行许多查询

SELECT MAX(column_name) as max_value, MIN(column_name) as min_value
FROM table_name

对于存储在hadoop中的大型表将是无效的。
阅读文档后发现一篇关于“Hive中的统计信息”的文章,似乎我必须这样使用请求:

ANALYZE TABLE tablename COMPUTE STATISTICS FOR COLUMNS;

但此命令以错误结束:
处理语句时出错:失败:执行错误,从org.apache.hadoop.hive.ql.exec.columnstatsttask返回代码1
我是否正确理解此请求将信息添加到表的描述中而不显示结果?这个请求对view有效吗?
请建议如何有效地自动为配置单元中的数据库创建文档?

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题