首页 理论教育启动Hadoop集群-大数据挖掘技术及其在医药领域的应用

启动Hadoop集群-大数据挖掘技术及其在医药领域的应用

【摘要】:格式化命令如下,该操作需要在HadoopMaster节点上执行。看到如图9-46所示的打印信息表示格式化成功,INFO util.ExitUtil:Exiting with status 1,INFO namenode.NameNode:SHUTDOWN_MSG;如果出现Exception/Error,则表示出问题。图9-48Web UI查看集群是否成功启动检查Yarn是否正常。在HadoopMaster上启动Firefox浏览器,在浏览器地址栏中输入http://master:18088/,页面如图9-49所示。进入Hadoop安装主目录,执行下面的命令:完成后,会看到如下的执行结果,输出:Estimated value ofPi is 3.20000000000000000000,集群正常启动。配置Hadoop时,路径和实际Hadoop安装路径必须一致。

格式化文件系统。格式化命令如下,该操作需要在HadoopMaster节点上执行。

看到如图9-46所示的打印信息表示格式化成功,INFO util.ExitUtil:Exiting with status 1,INFO namenode.NameNode:SHUTDOWN_MSG;如果出现Exception/Error,则表示出问题。

图9-46 master的进程成功

图9-47 slave的进程成功

Web UI查看集群是否成功启动。在HadoopMaster上启动Firefox浏览器,在浏览器地址栏中输入http://master:50070/,检查namenode和datanode是否正常。UI如图9-48所示。

图9-48 Web UI查看集群是否成功启动(www.chuimin.cn)

检查Yarn是否正常。在HadoopMaster上启动Firefox浏览器,在浏览器地址栏中输入http://master:18088/,页面如图9-49所示。

图9-49 检查Yarn是否正常

运行PI实例检查集群是否成功。进入Hadoop安装主目录,执行下面的命令:

完成后,会看到如下的执行结果,输出:Estimated value ofPi is 3.20000000000000000000,集群正常启动。

图9-50 运行PI实例检查集群

安装Hadoop需要注意的问题:(1)基础Linux命令必须熟悉,使用频率最高的Linux命令如su root,cd,ping slave,ifconfigure,tar-xvf~。(2)master和slave的IP地址。(3)找不到jps,hdfs等,看jdk环境,看dadoop配置环境,然后再梳理其他配置文件。(4)注意哪些在slave上配置,哪些在master上配置。(5)使改动生效命令,source/home/zkpk/.bash_profile。(6)gedit命令无法修改系统环境变量问题的解决办法是注销用户,用root用户登录,获得最高权限,再修改环境变量。(7)配置Hadoop时,路径和实际Hadoop安装路径必须一致。