Hadoop2.2集群安装

由于数据量的增加和业务的需求,公司从14年年初,开始调研和使用Hadoop生态圈的相关技术,在这期间,我们逐渐上了Hadoop、Hive、Flume等服务,并完成了对老统计业务的迁移。 Hadoop从2.x实现了用来管理集群资源的YARN框架,可以面向任何需要使用基于HDFS存储来计算的需要,MapReduce作为外围的插件式的计算框架,你可以根据需要开发或者选择合适的计算框架。 Hadoop集群节点规划与配置 Hadoop集群中节点的配置信息,以及各个节点的角色,整理如下表…