Hadoop是Apache软件基金会的开源分布式计算系统。它被广泛用于处理大数据,其中包含处理海量数据集和运行在大规模集群上的计算。Hadoop由两个主要组件组成:Hadoop分布式文件系统(HDFS)和Hadoop MapReduce计算框架。在Linux系统上编译Hadoop是一项必要的技能,因为它确保了所有必需的库和组件都得到正确的安装和配置。
网站建设哪家好,找成都创新互联公司!专注于网页设计、网站建设、微信开发、小程序定制开发、集团企业网站建设等服务项目。为回馈新老客户创新互联还提供了相城免费建站欢迎大家使用!
在这篇文章中,我们将讨论如何在Linux上编译Hadoop以及如何在Hadoop中进行支持和开发。
步骤1:安装Java
Java是Hadoop的前提条件之一,所以我们需要确保Java在系统上正确安装。为了安装Java,请按照以下步骤操作:
在终端中输出以下命令
sudo apt-get update
sudo apt-get install default-jdk
步骤2:安装Apache Maven
Maven是一个用于自动化构建、管理依赖、编译项目和生成文档的开源软件项目管理和理解工具。Hadoop的源代码和构建脚本使用Maven来构建,所以我们需要确保Maven在系统上正确安装。
在终端中输出以下命令千万不要忘记设置环境变量参数
sudo apt-get update
sudo apt-get install maven
步骤3:安装Python
为了编译Hadoop的部分组件,需要Python支持。Python是一种高级编程语言,在Linux系统上相当常见。可以使用以下命令安装Python:
sudo apt-get update
sudo apt-get install python
步骤4:下载Hadoop源代码
接下来,我们需要下载Hadoop源代码。从Hadoop官方网站上下载源代码,将它解压到当前目录并进入解压目录,输入以下命令:
wget http://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-3.3.1/hadoop-3.3.1-src.tar.gz
tar zxvf hadoop-3.3.1-src.tar.gz
cd hadoop-3.3.1-src
步骤5:运行Maven构建
现在,我们已准备好在Linux上编译Hadoop了!使用以下命令运行Maven构建,构建过程需要一定时间(取决于您的计算机性能和Hadoop版本):
mvn package -Pdist,native -DskipTests -Dtar
编译成功后,我们可以在hadoop-dist/target中找到编译出的二进制文件。从这个目录中,可以将Hadoop二进制文件拷贝到其他节点,或者在本地基于Hadoop构建应用程序。
:
本文中,我们讨论了如何在Linux上编译Hadoop。我们首先安装了Java、Maven和Python,然后下载了Hadoop源代码,并使用Maven构建了它。现在,您已准备好在Hadoop上支持和开发应用程序了!
相关问题拓展阅读:
v : 显示动作,即解压任何文件时均显示其文件名及相对路径
x : 解压缩
z : 表名该空者压缩文件是以gzip格式压缩的
f : 该参数后面跟着纯亏被解压的文件名
注:在Linux中解压tar.gz包可以不加z参做亏神数,tar命令会自动识别其支持的任何压缩格式,即该命令也可写成如下形式
tar -vxf hadoop-2.7.0.tar.gz
在不使用eclipse情况使java程序在hadoop 2.2中运行的完整过程。整个过程中其实分为java程序的编译,生成jar包,运行测试。
这三个步骤运用的命令都比较简单,主要的还是液袭悉如何找到hadoop 2.2提供给java程序用来编译的jar包。具体可以查看:
HADOOP_HOME/share/hadoop/httpfs/tomcat/webapps/webhdfs/WEB-INF/lib目录
下面会通过一个在hadoop中创建一个目录的JAVA例子来进行演示
具体代码如下:
package com.wan.demo;
import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
public class HADemo {
public static void main(String args) {
// TODO Auto-generated method stub
mkdir(args);
}
public static void mkdir(String dir){
Configuration configuration=new Configuration();
FileSystem fs;
try {
fs = FileSystem.get(configuration);
fs.mkdirs(new Path(dir));
fs.close();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}
把HADemo.java文件拷贝到linux环境中
配置HADOOP_HOME/bin到环境中闹乎,启动集群,进入HADemo.java文件目录中
注:下面的lib目录里面的文件由HADOOP_HOME/share/hadoop/httpfs/tomcat/webapps/ webhdfs/WEB-INF/lib目录中获取,下面做的目的是为了缩减命令长度
1.编译java
# mkdir class
#Javac -classpath .:lib/hadoop-common-2.2.0.jar:lib/hadoop-annotations-2.2.0.jar -d class HADemo.java
2.生成jar包
#jar -cvf hademo.jar -C class/ .
added manifest
adding: com/(in = 0) (out= 0)(stored 0%)
adding: com/wan/(in = 0) (out= 0)(stored 0%)
adding: com/wan/demo/(in = 0) (out= 0)(stored 0%)
adding: com/wan/demo/HADemo.class(in = 844) (out= 520)(deflated 38%)
3.测试运行
#hadoop jar hademo.jar com.wan.demo.HADemo /test
检禅坦测:
#hadoop fs -ls /
在很多人依然是在windows上开发的,毕竟生活拦锋离不开很多有趣的软件,人性化的软件。
现在想用windows下eclipse连接服务器centos上hadoop。我们该如何搞定呢?
我尝试了很多遍自己做插件,做到想死了。
编译结果终于successful,但是我的eclipse始终无法识别。
后毕段来我尝试用网上的插件简数晌,也是费尽心机,终于找到一款合适的插件:
linux 编译hadoop的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于linux 编译hadoop,如何在Linux上编译Hadoop?,Linux命令中,请问下tar -vxzf hadoop-2.7.0.tar.gz是什么意思?尤其是-vxzf,为什么hadoop2.6.0没有hadoop-client-2.6.0.jar,windows eclipse连接linux的hadoop吗的信息别忘了在本站进行查找喔。
香港服务器选创新互联,2H2G首月10元开通。
创新互联(www.cdcxhl.com)互联网服务提供商,拥有超过10年的服务器租用、服务器托管、云服务器、虚拟主机、网站系统开发经验。专业提供云主机、虚拟主机、域名注册、VPS主机、云服务器、香港云服务器、免备案服务器等。
文章标题:如何在Linux上编译Hadoop?(linux编译hadoop)
转载注明:http://www.shufengxianlan.com/qtweb/news45/528745.html
网站建设、网络推广公司-创新互联,是专注品牌与效果的网站制作,网络营销seo公司;服务项目有等
声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联