HDP 3.1.0 集成 Sqoop2
HDP 3.1.0 集成 Sqoop2
环境
- 由三台主机组成的 HDP 3.1.0 集群
- 配置好时间同步
步骤
- 下载
Sqoop2
的安装包 - 解压安装包到
/usr/lib
目录下 - 修改
sqoop.sh
环境变量 - 修改
sqoop.properties
配置 - 导入第三方
jar
包 - 配置第三方
jar
包引用路径 - 修改
Ambari
上组件配置 - 验证配置是否正确
- 开启服务器
下载 Sqoop2 的安装包
下载地址:http://mirror.bit.edu.cn/apache/sqoop/1.99.7/
下载命令
1 | cd ~ |
解压安装包到 /usr/lib
目录下
解压 Sqoop2
压缩包
1 | tar -xvf sqoop-<version>-bin-hadoop<hadoop-version>.tar.gz |
移动到 /usr/lib/sqoop
目录
1 | mv sqoop-<version>-bin-hadoop<hadoop version> /usr/lib/sqoop |
修改 sqoop.sh 环境变量
编辑 /usr/lib/sqoop/bin/sqoop.sh
文件
1 | sudo vim /usr/lib/sqoop/bin/sqoop.sh |
找到 function sqoop_server_classpath_set
函数,将其中的环境变量改一下就可以了,如下:
1 | function sqoop_server_classpath_set { |
将这些环境变量都注释掉,改为下面的内容即可:
1 | function sqoop_server_classpath_set { |
修改 sqoop.properties 配置
修改 sqoop.properties
1 | sudo vim /usr/lib/sqoop/conf/sqoop.properties |
找到 org.apache.sqoop.submission.engine.mapreduce.configuration.directory
参数,如下:
1 | org.apache.sqoop.submission.engine.mapreduce.configuration.directory=/etc/hadoop/conf/ |
根据集群实际信息将其改为下面的内容即可:
1 | org.apache.sqoop.submission.engine.mapreduce.configuration.directory=/usr/hdp/3.1.0.0-78/hadoop/conf/ |
导入第三方 jar 包
1 | mkdir /usr/lib/sqoop/extra |
配置第三方 jar 包引用路径
1 | sudo vim ~/.bashrc |
添加环境变量,如下:
1 | export SQOOP_HOME=/usr/lib/sqoop |
运行如下命令,使环境变量生效:
1 | source ~/.bashrc |
修改 Ambari 上组件配置
修改组件 HDFS 配置
配置项 | 参数名 | 初始值 | 修改值 |
---|---|---|---|
Advanced hdfs-site | dfs.permissions.enabled | True | False |
Custom core-site | hadoop.proxyuser.hive.hosts | * |
|
Custom core-site | hadoop.proxyuser.root.hosts | * |
|
Custom core-site | hadoop.proxyuser.sqoop2.groups | * |
|
Custom core-site | hadoop.proxyuser.sqoop2.hosts | * |
|
Custom core-site | hadoop.proxyuser.yarn.groups | * |
|
Custom core-site | hadoop.proxyuser.yarn.hosts | * |
修改组件 MapRduce2 配置
将
${hdp.version}
替换成实际hdp
的版本:3.1.0.0-78
配置项 | 参数名 | 初始值 | 修改值 |
---|---|---|---|
Advanced mapred-site | mapreduce.admin.map.child.java.opts | -server -XX:NewRatio=8 -Djava.net.preferIPv4Stack=true -Dhdp.version=${hdp.version} |
-server -XX:NewRatio=8 -Djava.net.preferIPv4Stack=true -Dhdp.version=3.1.0.0-78 |
Advanced mapred-site | mapreduce.admin.reduce.child.java.opts | -server -XX:NewRatio=8 -Djava.net.preferIPv4Stack=true -Dhdp.version=${hdp.version} |
-server -XX:NewRatio=8 -Djava.net.preferIPv4Stack=true -Dhdp.version=3.1.0.0-78 |
Advanced mapred-site | mapreduce.admin.user.env | LD_LIBRARY_PATH=/usr/hdp/${hdp.version}/hadoop/lib/native:/usr/hdp/${hdp.version}/hadoop/lib/native/Linux-{{architecture}}-64 |
LD_LIBRARY_PATH=/usr/hdp/3.1.0.0-78/hadoop/lib/native:/usr/hdp/3.1.0.0-78/hadoop/lib/native/Linux-{{architecture}}-64 |
Advanced mapred-site | mapreduce.application.classpath | $PWD/mr-framework/hadoop/share/hadoop/mapreduce/*:$PWD/mr-framework/hadoop/share/hadoop/mapreduce/lib/*:$PWD/mr-framework/hadoop/share/hadoop/common/*:$PWD/mr-framework/hadoop/share/hadoop/common/lib/*:$PWD/mr-framework/hadoop/share/hadoop/yarn/*:$PWD/mr-framework/hadoop/share/hadoop/yarn/lib/*:$PWD/mr-framework/hadoop/share/hadoop/hdfs/*:$PWD/mr-framework/hadoop/share/hadoop/hdfs/lib/*:$PWD/mr-framework/hadoop/share/hadoop/tools/lib/*:/usr/hdp/${hdp.version}/hadoop/lib/hadoop-lzo-0.6.0.${hdp.version}.jar:/etc/hadoop/conf/secure |
$PWD/mr-framework/hadoop/share/hadoop/mapreduce/*:$PWD/mr-framework/hadoop/share/hadoop/mapreduce/lib/*:$PWD/mr-framework/hadoop/share/hadoop/common/*:$PWD/mr-framework/hadoop/share/hadoop/common/lib/*:$PWD/mr-framework/hadoop/share/hadoop/yarn/*:$PWD/mr-framework/hadoop/share/hadoop/yarn/lib/*:$PWD/mr-framework/hadoop/share/hadoop/hdfs/*:$PWD/mr-framework/hadoop/share/hadoop/hdfs/lib/*:$PWD/mr-framework/hadoop/share/hadoop/tools/lib/*:/usr/hdp/3.1.0.0-78/hadoop/lib/hadoop-lzo-0.6.0.3.1.0.0-78.jar:/etc/hadoop/conf/secure |
Advanced mapred-site | mapreduce.application.framework.path | /hdp/apps/${hdp.version}/mapreduce/mapreduce.tar.gz#mr-framework |
/hdp/apps/3.1.0.0-78/mapreduce/mapreduce.tar.gz#mr-framework |
Advanced mapred-site | yarn.app.mapreduce.am.admin-command-opts | -Dhdp.version=${hdp.version} |
-Dhdp.version=3.1.0.0-78 |
Advanced mapred-site | MR AppMaster Java Heap Size | -Xmx819m -Dhdp.version=${hdp.version} |
-Xmx819m -Dhdp.version=3.1.0.0-78 |
验证配置是否正确
1 | $ sqoop2-tool verify |
开启服务器
1 | $ sqoop2-server start |
查看是否启动成功
1 | $ jps | grep Sqoop |
如出现 SqoopJettyServer
进程则表示已启动成功。
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Sitoi!
评论