我在hdinsight(azure)上创建了集群,创建了ipython笔记本,并将文本文件上传到blob存储。如何上传到笔记本?希望blob存储中有这个文件的url。
sxissh061#
jupyter笔记本是一个基于web的ui,可以对hdinsight(和其他数据源)运行查询。它们没有将数据上传到blob存储的机制;他们只能告诉apachespark(例如)查询blob存储中的数据。要在hdinsight azure中处理数据,需要将文件上载到hdfs或blob存储(后者是更常见的机制)。要将数据上载到blob存储中,以下是一些很好的参考资料:在hdinsight中上载hadoop作业的数据在hdinsight中将hdfs兼容的azure blob存储与hadoop一起使用
1条答案
按热度按时间sxissh061#
jupyter笔记本是一个基于web的ui,可以对hdinsight(和其他数据源)运行查询。它们没有将数据上传到blob存储的机制;他们只能告诉apachespark(例如)查询blob存储中的数据。
要在hdinsight azure中处理数据,需要将文件上载到hdfs或blob存储(后者是更常见的机制)。要将数据上载到blob存储中,以下是一些很好的参考资料:
在hdinsight中上载hadoop作业的数据
在hdinsight中将hdfs兼容的azure blob存储与hadoop一起使用