当前位置: 首页 > news >正文

别再复制粘贴了!手把手教你用三台CentOS 7虚拟机搭建Hadoop 3.1.3集群(含SSH免密登录完整流程)

三节点Hadoop集群搭建实战从SSH互信到分布式部署全解析刚接触分布式系统的开发者往往在搭建多节点环境时遇到各种拦路虎。其中SSH免密登录配置是最容易卡壳的环节——明明照着教程操作却总是出现Permission denied或Connection refused。本文将用三台CentOS 7虚拟机带你完整走通从SSH互信到Hadoop 3.1.3集群部署的全流程特别针对密钥分发、权限设置等易错点进行深度解析。1. 环境准备与基础配置在开始Hadoop部署前需要确保三台虚拟机处于干净的初始状态。建议使用最小化安装的CentOS 7系统内存建议每台不低于2GB。首先在三台机器上执行以下基础配置# 关闭SELinux需要重启生效 sed -i s/SELINUXenforcing/SELINUXdisabled/g /etc/selinux/config # 关闭防火墙 systemctl stop firewalld systemctl disable firewalld # 安装必要工具 yum install -y vim wget net-tools主机命名规范建议采用master,worker1,worker2的格式修改方法如下# 在三台机器分别执行注意替换主机名 hostnamectl set-hostname master # 第一台 hostnamectl set-hostname worker1 # 第二台 hostnamectl set-hostname worker2 # 第三台/etc/hosts文件需要包含所有节点的IP映射三台机器保持相同配置192.168.1.101 master 192.168.1.102 worker1 192.168.1.103 worker2提示使用ping hostname测试网络连通性确保三台机器可以互相通信后再继续后续步骤。2. SSH免密登录深度配置SSH互信是Hadoop集群正常工作的基础。许多初学者在此步骤遇到问题主要是因为忽略了权限设置或配置文件细节。下面分步骤详解2.1 密钥生成与分发在master节点执行以下命令生成密钥对三台机器都需要执行ssh-keygen -t rsa -P -f ~/.ssh/id_rsa关键点说明-t rsa指定密钥类型为RSA-P 设置空密码-f指定密钥文件路径将公钥分发到所有节点包括自身# 在master节点执行 ssh-copy-id master ssh-copy-id worker1 ssh-copy-id worker2常见问题排查如果出现port 22: Connection refused检查sshd服务是否运行systemctl status sshd systemctl start sshd遇到Permission denied错误检查目标机器的~/.ssh目录权限应为700authorized_keys文件权限应为6002.2 SSH服务端关键配置编辑/etc/ssh/sshd_config文件确保以下参数正确设置RSAAuthentication yes PubkeyAuthentication yes AuthorizedKeysFile .ssh/authorized_keys PasswordAuthentication no # 禁用密码登录增强安全性修改后重启服务systemctl restart sshd2.3 多节点互信测试使用以下命令验证免密登录是否成功ssh master date # 从worker1测试连接master ssh worker1 date # 从master测试连接worker1 ssh worker2 date # 跨worker节点测试注意如果某条命令仍要求输入密码请检查对应节点的authorized_keys文件是否包含所有公钥以及文件权限是否正确。3. Hadoop集群安装部署3.1 JDK环境配置Hadoop依赖Java环境建议安装OpenJDK 8yum install -y java-1.8.0-openjdk-devel配置环境变量三台机器都需要echo export JAVA_HOME/usr/lib/jvm/java-1.8.0-openjdk /etc/profile echo export PATH$PATH:$JAVA_HOME/bin /etc/profile source /etc/profile验证安装java -version3.2 Hadoop安装与配置在master节点下载并解压Hadoopwget https://archive.apache.org/dist/hadoop/common/hadoop-3.1.3/hadoop-3.1.3.tar.gz tar -xzf hadoop-3.1.3.tar.gz -C /opt/ mv /opt/hadoop-3.1.3 /opt/hadoop配置环境变量三台机器都需要echo export HADOOP_HOME/opt/hadoop /etc/profile echo export PATH$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin /etc/profile source /etc/profile3.3 关键配置文件修改需要配置的核心文件位于$HADOOP_HOME/etc/hadoop/目录下core-site.xml- 核心全局配置configuration property namefs.defaultFS/name valuehdfs://master:9000/value /property property namehadoop.tmp.dir/name value/opt/hadoop/tmp/value /property /configurationhdfs-site.xml- HDFS相关配置configuration property namedfs.replication/name value3/value /property property namedfs.namenode.name.dir/name value/opt/hadoop/dfs/name/value /property property namedfs.datanode.data.dir/name value/opt/hadoop/dfs/data/value /property /configurationworkers- 指定所有工作节点worker1 worker2hadoop-env.sh- 补充JAVA_HOME配置export JAVA_HOME/usr/lib/jvm/java-1.8.0-openjdk4. 集群启动与验证4.1 配置文件分发将配置好的Hadoop目录复制到所有worker节点scp -r /opt/hadoop worker1:/opt/ scp -r /opt/hadoop worker2:/opt/ scp -r /etc/profile worker1:/etc/ scp -r /etc/profile worker2:/etc/在worker节点上执行source /etc/profile4.2 格式化HDFS在master节点执行hdfs namenode -format成功格式化会看到Storage directory /opt/hadoop/dfs/name has been successfully formatted提示。4.3 启动集群在master节点执行start-dfs.sh start-yarn.sh验证各节点进程master节点应有NameNode、ResourceManagerworker节点应有DataNode、NodeManager使用jps命令检查jps4.4 Web界面访问Hadoop提供Web管理界面HDFS: http://master:9870YARN: http://master:8088在集群运行后可以执行测试作业验证功能完整性hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar pi 10 100
http://www.zskr.cn/news/1353128.html

相关文章:

  • 从Multisim仿真到Basys3上板:一个数码管实验项目的完整开发流程与项目管理心得
  • Visio流程图导出PDF总模糊?试试这3个隐藏设置(含Mac/Win双平台方案)
  • Windows 10/11本地开发Spark程序,用IDEA+Maven搞定环境(附Scala 2.12.15和Spark 3.2.1配置)
  • 2026年评价高的自建房/登封乡村自建房/大包建房热选公司推荐 - 品牌宣传支持者
  • Unity微信小游戏移植避坑指南:渲染、资源、输入与性能实战
  • 工业通信基石Modbus协议:从串口到TCP/IP的实战解析与应用指南
  • SAP HANA Studio不只是个数据库客户端:解锁它的四大工作视角(管理、建模、开发、运维)能做什么?
  • 2026 树洞平台口碑排行|树洞陪聊 + 树洞陪玩 + 树洞倾诉 真实测评 - 时讯资讯
  • StarRocks导入数据:从本地文件导入数据(Stream Load)
  • 2026年比较好的冶金设备/单齿辊冶金设备/金属冷锯冶金设备/金属热锯冶金设备厂家推荐与选型指南 - 行业平台推荐
  • Multisim仿真避坑指南:手把手教你调好MOS管放大电路的静态工作点
  • 老带新转介绍 vs 数据化获客:上游销售的两种获客逻辑,该怎么选
  • 工厂接单:短账期高单价,还是长账期低单价?这道题最考验老板的算盘
  • 为你的Agent工具快速接入多模型能力使用Taotoken配置指南
  • 2026年质量好的空调/余姚松井空调/余姚海尔空调/余姚迈迪龙空调优选公司推荐 - 品牌宣传支持者
  • 2026年知名的大包盖别墅/登封工厂自建房/登封自建办公楼高评分公司推荐 - 行业平台推荐
  • 分光计调平调焦保姆级教程:手把手教你搞定三棱镜折射率实验(附避坑清单)
  • 如何用XUnity.AutoTranslator为Unity游戏添加实时AI翻译:新手完整指南
  • 渗透测试靶场部署指南:从协议层到运维层的真实感构建
  • Audition变调进阶指南:利用‘共振变换’和‘恒定元音’让男声变女声更自然
  • 手把手教你用DiskGenius专业版恢复误删文件(附实测步骤与避坑指南)
  • 【Linux】Linux中常用操作命令总结
  • linux服务器操作系统有哪些
  • 2026年热门的空调/大金空调可靠服务公司 - 品牌宣传支持者
  • [开源] 院感手卫生数字孪生仿真系统:面向感控科的干预效果事前推演工具
  • 深圳连续模五金冲压件
  • 生成模型选型实战指南:Diffusion、GAN、VAE如何按需选用
  • Unity Live2D模型提取实战:AssetBundle二进制解析与资源还原
  • 国产DSP FT-M6678中断开发避坑指南:从CIC配置到向量表编写的完整流程
  • 如何识别并拒绝AI领域虚假技术信息