我正在阅读kite sdk的文档。我无法理解kite数据集和hive表之间的区别例如,如果要在配置单元中创建产品数据集,可以使用此uri。 dataset:hive:products 这是否意味着,使用hivecli我们可以访问同一个表 products
dataset:hive:products
products
eimct9ow1#
kitesdk创建的数据集和通过hivecli查看的表之间没有区别。之所以是这样,是因为当您使用kitesdk在hive中创建数据集时,您正在hive中创建的是一个表。混淆之处在于术语。kite文档所指的数据集在hive中称为表。从名为“数据集、视图和存储库URI”的kite sdk页面(http://kitesdk.org/docs/1.1.0/uris.html),将数据导入配置单元表的uri格式如下所示。
dataset:hive:<namespace>/<dataset> ``` `<namespace>` 相当于数据库名称。注意:如果留空,kite将采用默认数据库。 `<dataset>` 相当于表名。 等效命令: 从操作系统终端:
从配置单元>终端:
hive> select * from tv_show.sitcoms;
1条答案
按热度按时间eimct9ow1#
kitesdk创建的数据集和通过hivecli查看的表之间没有区别。之所以是这样,是因为当您使用kitesdk在hive中创建数据集时,您正在hive中创建的是一个表。混淆之处在于术语。kite文档所指的数据集在hive中称为表。
从名为“数据集、视图和存储库URI”的kite sdk页面(http://kitesdk.org/docs/1.1.0/uris.html),将数据导入配置单元表的uri格式如下所示。
./kite-dataset show tv_shows/sitcoms
hive> select * from tv_show.sitcoms;