hadoop集群中每台都必须启动DataNode吗,可以只启动NN而不启动DN吗?

贾倩倩

三个datanode 当有一个出现错误会怎么样

hadoop集群中每台都必须启动DataNode吗,可以只启动NN而不启动DN吗?

打开hdfs-site.xml里配置的datanode和namenode对应的目录,分别打开current文件夹里的VERSION,可以看到clusterID项正如日志里记录的一样,确实不一致,修改datanode里VERSION文件的clusterID 与namenode里的一致,再重新启动dfs(执行start-dfs.sh)再执行jps命令可以看到datanode已正常启动.出现该问题的原因:在第一次格式化dfs后,启动并使用了hadoop,后来又重新执行了格式化命令(hdfs namenode -format),这时namenode的clusterID会重新生成,而datanode的clusterID 保持不变.

hadoop启动datanode在克隆里没有

,就当是抛砖引玉了.相信楼主知道,hadoop的文件系统叫做hdfs,就是hadoop分. 可以直接链接进入hadoop集群,而不用重新启动集群.命令是bin/hadoop-daemon.sh .

Hadoop集群中namenode节点需要安装zookeeper吗

ZooKeeper是一个独立的组件,它可以和HDFS配合使用,但没有非得部署在一起的要求,只要网络通就可以.另外,ZooKeeper建议最少安装在3个节点上,且数目为奇数.

hdfs启动的详细过程:具体到类似nn怎么校验客户端请求,反正具体越好

展开全部、客户端请求nameNode给某个目录下写数据,2、nameNode给客户端返回一个是可以写还是不可以写,3、一旦答应可以写,客户端再次请求写一个block(这些.

Hadoop集群的主节点会存储数据吗

主节点不会存储数据,数据节点专门存储数据,主节点存储了元数据信息.主节点的磁盘中存储了文件到块的关系,集群启动后,数据节点会报告名字节点 机器和块的关系,这两个关系组合起来便可找到文件所在机器的位置.如果名字节点所在的机器也配置到slave文件里,那么此台机器即是名字节点也是数据节点!

搭建Hadoop集群,一个月6T的数量需要几台服务器

最好是两个做成HA关于硬盘:6T的数据容量,看你副本数量设置是多少,一般默认. 根据你的指标去评定要多少台机器 hadoop集群的性能和节点个数近似成正向关系

hadoop集群重新格式化namenode会不会把hdfs中的数据也格掉?

当然会啊,datanode起不来用不着重新格式化namenode吧,又不是namenode出问题了.对于HDFS没什么数据的重新格式化namenode当然不是个事儿,还是想其他解决方案吧,也肯定会有的.datanode起不来的话,建议你想办法重新把它加进来,这个应该不是难事.但是存在这个datanode上的数据肯定只能通过副本恢复了,如果没副本,那没办法,只能自己重新导入.

另一台机器怎么连接本地yum源

1、首先预备好一台nginx或者apache的server来做本地的YUM源(我喜欢nginx),该操作可以去参考“YUM本地源搭建,且Rsync同步官方”的操作.2、搭建好的本地.

集群中各Datanode磁盘占用合理吗

这个参数是本地生效的,就是说配置的参数仅在本节点生效.你datanode1可以配置3个路径(分别是3块盘下的),datanode2可以配置10个路径.如datanode1上配置dfs.data.dir/home/u/hdfs/data1,/home/u/hdfs/data2,/home/u/hdfs/data3datanode2上配置dfs.data.dir/data0,/data1,/data2,/data3,/data4,/data5,/data6,/data7,/data8,/data9

hadoop一般部署在什么系统上

集群建立好之后,最好不要再master节点上直接访问提交作业,你可以通过hadoop客户端访问HDFD以及提交作业,只需要你部署hadoop 的conf目录以及bin,lib目录即可,最简单的方法,直接拷贝一你master的hadoop目录到任意机器,就是你的客户端机器,设置HADOOP_HOME环境变量即可,或者不用设置也行,就可以访问Hadoop现在已经广泛应用于包 括 FaceBook,Twitter, Yahoo! 等公司,通常情况下这些机群包括数以千计的服务器和数以万计的CPU. Hadoop 作为基础云计算平台 ,包括了超过 100 个的用户可配置参数 ( 版本 0.19.2) ,

TAG: 集群 Hadoop