大快网站:如何选择正确的hadoop版本
Hadoop的环境安装部署是所有刚开始学习hadoop必然要面对的一个问题,对于新手而言基本不会一次性部署成功,甚至可能要花费好几天的时间才能完成hadoop运行环境部署。所以对于新手来说,hadoop版本的选择还是比较重要的。Hadoop除了Apache这个版本,还有许多第三方的版本,版本虽多但能够像大快DKH有效解决hadoop部署管理复杂的问题很少。
目前hadoop的发行版除了我们熟知的Apache的开源版本之外,还有Intel发行版、Cloudera发行版(CDH)、Hortonworks发行版(HDP)、MapR等。国产的发行版如大快搜索DKH、华为发行版等。无论是国外的第三方发行版,还是国产的发行版基本都是基于Apache hadoop衍生出来的。由于hadoop诞生于国外,所以规则都是由国外制定的,国产发行版hadoop当然不止大快搜索一家,但敢做hadoop底层开发的也只有大快搜索!也正是由于大快所具备的技术优势,DKH与其他第三方发行版hadoop才有这非常明显的不同。
综上所述,hadoop版本的选择是具备多样性的,理论上你可以选择Apache发行版,或者是国外的第三方发行版,当然也有国内的发行版可供选择。但对于入门级的新手而言,那些需要进行复杂环境部署的版本似乎不太适合,我们应该将学习的重点放在hadoop应用开发,而不是把研究的重点放在基础环境的安装。解决基础环境安装复杂问题的是我们这些做大数据底层技术开发的责任和义务。
如果要给hadoop入门级新手做一个hadoop版本的推荐,可以使用DKH的发行版hadoop。DKH标准版有三个不同的子版本:用于开发调试的单机版;支持三节点的学习版;支持五节点以上的标准服务器版。DKH-分布式SQL版有两个子版本:学习版和服务器版。入门级新手可以选择DKH标准版中的支持三节点的学习版。
DKH有效的集成了整个HADOOP生态系统的全部组件,并深度优化,重新编译为一个完整的更高性能的大数据通用计算平台,实现了各部件的有机协调。如果说的再简单点就是基础运行环境的部署变得异常简单,一键安装,随时调用!重点是,标准三节点的学习版是免费提供提下载的!
DKH标准版 DKH-分布式SQL版 DK.HADOOP发行版
DKH标准版有三个不同的子版本:用于开发调试的单机版;支持三节点的学习版;支持5节点以上的标准服务器版
DKH-分布式SQL版有两个子版本:学习版、服务器版