kite-sdk数据集和配置单元表之间的区别

tf7tbtn2  于 2021-06-03  发布在  Hadoop
关注(0)|答案(1)|浏览(357)

我正在阅读kite sdk的文档。我无法理解kite数据集和hive表之间的区别
例如,如果要在配置单元中创建产品数据集,可以使用此uri。 dataset:hive:products 这是否意味着,使用hivecli我们可以访问同一个表 products

eimct9ow

eimct9ow1#

kitesdk创建的数据集和通过hivecli查看的表之间没有区别。之所以是这样,是因为当您使用kitesdk在hive中创建数据集时,您正在hive中创建的是一个表。混淆之处在于术语。kite文档所指的数据集在hive中称为表。
从名为“数据集、视图和存储库URI”的kite sdk页面(http://kitesdk.org/docs/1.1.0/uris.html),将数据导入配置单元表的uri格式如下所示。

dataset:hive:<namespace>/<dataset>
``` `<namespace>` 相当于数据库名称。注意:如果留空,kite将采用默认数据库。 `<dataset>` 相当于表名。
等效命令:
从操作系统终端:

./kite-dataset show tv_shows/sitcoms

从配置单元>终端:

hive> select * from tv_show.sitcoms;

相关问题