当前位置: Oracle DBA培训网-优技培训 >> Hadoop大数据 > Hadoop培训教程 >

Hadoop入门教程:Hadoop源代码编译

Hadoop入门教程:Hadoop源代码编译

Linux环境下编译源代码之前,需进行以下准备工作:

确保安装的Maven版本在3.0.2以上;

Protocol Buffers安装版本为2.5.0;

如果要启用findbugs,则需确认已经安装了Findbugs;

如果要编译native code,则需确认安装了CMake 2.6或者更新版本;

第一次编译代码,需确认可以连接互联网(Maven要从代码库中下载依赖包)。

Maven编译命令如表1-2所示。

Maven编译命令

如果仅编译生成JAR包而无须编译native code、测试用例和生成文档,可在Hadoop安装目录下并输入以下命令(推荐使用该命令编译Hadoop源代码):

mvn package -Pdist -DskipTests -Dtar

如果编译JAR包、native code并生成文档,可使用以下命令:

mvn package -Pdist,native,docs -DskipTests -Dtar

每个子模块编译后生成的JAR包放到了与源代码目录平级的target目录中,比如ResourceManager的源代码目录是:

${YARN_HOME}/hadoop-yarn-project/hadoop-yarn/hadoop-yarn-server/hadoop-yarn-server-resourcemanager/src

它对应生成JAR包放在了以下目录中:

${YARN_HOME}/hadoop-yarn-project/hadoop-yarn/hadoop-yarn-server/hadoop-yarn-server-resourcemanager/target

如果修改了某个模块的代码,可编译后,将对应的JAR包覆盖到${HADOOP_HOME} /share/hadoop目录中对应的JAR包上。

如果仅编译Hadoop的某一个子模块,需将该模块依赖的JAR包作为它的第三方库引入。一种简单的实现方式是在Hadoop安装目录下输入以下命令编译所有源代码:

mvn install -DskipTests

然后进入子模块目录,编译生成对应的JAR包。

技术沙龙MORE+

Oracle技术沙龙:【数据保护顶尖技术-MAA】首次全国首播12c MAA技术 云数据库加上MAA技术组成最豪华的技...
Oracle技术沙龙第49期:【Oracle 数据库云技术分享】Oracle技术沙龙第49期:【Oracle 数据库云技术分享】本次技术沙...
Oracle技术沙龙第48期:【Oracle 12c RAC安装】小编:今天讲什么内容呢?以后有什么用呢? 大师:今天讲的是12c...
我要参加技术沙龙

关闭