大数据 | MinChiang的博客

# 大数据

# 环境搭建

安装Java环境，配置apt install openjdk-8-jdk

创建hadoop用户

groupadd hadoop
useradd -g hadoop hadoop

1
2

到https://downloads.apache.org/hadoop/common/hadoop-3.3.6/中下载对应的版本，我这边选择使用hadoop-3.3.6.tar.gz并且解压到目录中

使用root用户修改配置/etc/profile，添加下面语句

export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64
export HADOOP_HOME=/mnt/d/Hadoop/hadoop-3.3.6
export PATH=$PATH:${JAVA_HOME}/bin:${HADOOP_HOME}/bin:${HADOOP_HOME}/sbin

1
2
3

切换到hadoop用户，在~/.bashrc配置添加下面内容
```
export HADOOP_CLASSPATH=`hadoop classpath`
```
1
保存后记得使用source ~/.bashrc命令重新加载.bashrc配置

创建目录

cd /mnt/d/Hadoop/data
mkdir -p data name secondary tmp

1
2

修改Hadoop配置

修改hadoop-3.3.6/etc/hadoop/core-site.xml配置

  <property>
    <name>hadoop.tmp.dir</name>
    <value>/mnt/d/Hadoop/data/tmp</value>
  </property>
  <property>
    <name>fs.defaultFS</name>
    <value>hdfs://localhost:9000</value>
  </property>

1
2
3
4
5
6
7
8

修改hadoop-3.3.6/etc/hadoop/hdfs-site.xml配置

  <property>
    <name>dfs.namenode.name.dir</name>
    <value>/mnt/d/Hadoop/data/name</value>
  </property>
  <property>
    <name>dfs.datanode.data.dir</name>
    <value>/mnt/d/Hadoop/data/data</value>
  </property>
  <property>
    <name>dfs.replication</name>
    <value>1</value>
  </property>

1
2
3
4
5
6
7
8
9
10
11
12

修改hadoop-3.3.6/etc/hadoop/mapred-site.xml配置

  <property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
  </property>

1
2
3
4

修改hadoop-3.3.6/etc/hadoop/yarn-site.xml配置

  <property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
  </property>
  <property>
    <name>yarn.resourcemanager.hostname</name>
    <value>localhost</value>
  </property>

1
2
3
4
5
6
7
8

格式化HDFS，使用命令hdfs namenode -format
启动Hadoop，执行/mnt/d/Hadoop/hadoop-3.3.6/sbin/start-all.sh

使用jps观察是否有以下java进程

ResourceManager
NodeManager
SecondaryNameNode
DataNode
NameNode

1
2
3
4
5

Hadoop环境搭建1

验证安装，打开浏览器，输入下面的url以验证Hadoop是否启动成功
- hdfs健康信息：http://localhost:9870
- hadoop集群信息：http://127.0.0.1:8088/
- hadoop ipc地址：http://127.0.0.1:9000

运行一个MapReduce作用以验证是否成功

hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.6.jar

Hadoop环境搭建4

← Terraform