sqoop中的并发

vwoqyblh  于 2021-06-02  发布在  Hadoop
关注(0)|答案(2)|浏览(612)

我已经阅读了一些文档,其中建议在edgenode上安装sqoop的原因很多,这是可以理解的,并且对于每个Map器,都建立了到源数据库的连接。我的问题是,是否所有4个连接都是从edgenode或sqoop客户端建立的,edgenode只是创建了某种驱动程序,在datanodes连接到数据库时监视摄取,获取数据(部分)并将其本地拆分,然后放入hdfs。

nbnkbykc

nbnkbykc1#

sqoop是map reduce上的 Package 器,用于执行导入导出操作。
Map程序将在集群中运行,而sqoop客户机将运行边缘节点。
每个Map器都将打开到数据库的连接。
Map程序使用的行由客户端在提交作业时决定。

mm9b1k5b

mm9b1k5b2#

边缘节点作为hadoop集群的接口,sqoop导入/导出基于泛型和特定参数启动mapreduce作业。
mapreduce作业根据给定的-m或--num mappers参数运行Map器的数量。
有关详细信息,请参见以下链接:http://www.dummies.com/programming/big-data/hadoop/edge-nodes-in-hadoop-clusters/
https://sqoop.apache.org/docs/1.4.0-incubating/sqoopuserguide.html#id1764013

相关问题