Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.

Hadoop hadoop 2.6.0 기동(에코시스템 포함)및 wordcount 어플리케이션을 이용한 테스트

총관리자 2015.05.05 17:22 조회 수 : 3900

* 해결되지 않는 문제가 발생되면

==>rm -r /data/hadoop/dfs/*으로 dfs정보가 저장되는 폴더를 모두 지우고 아래의 수동 기동방법을 따른다...

주의할점은 기존의 데이타등 모든 정보를 잃게 되므로 주의할것

0. data및 log파일의 경로를 아래와 같이 수정함(내용이 다르게 적혀있으므로 참고해서 봐야함)

가. data경로 : /data/hadoop/dfs, /data/zookeeper/data ...

나. log파일 : /logs/hadoop/logs, /logs/zookeeper/logs ...

0-1. 단축실행(start-all.sh을 사용하는 경우)

가. zookeeper기동(master, node1, node2의 3개 서버에서 각각 실행시켜줌)

bin/zkServer.sh start

나. JobHistoryServer기동(hadoop master에서 실행)

sbin/mr-jobhistory-daemon.sh start historyserver

다. hbase기동 (hbase master가 설치된 노드에서 실행함)

bin/start-hbase.sh

bin/hbase-daemon.sh start master (secondary master 노드에서 실행)

라. hive(설치된 서버에서 실행)

- hive server시작(hive가 설치된 master에서 실행)

:nohup hive server2 &

- hive metastore서버 시작(hive가 설치된 master에서 실행)

:nohup hive --service metastore &

마. hadoop 실행(master서버에서만 실행)

- hdfs구동 : sbin/start-dfs.sh

- yarn구동 : sbin/start-yarn.sh

* standby resourcemanager가 기동이 안될때 : sbin/yarn-daemon.sh start resourcemanager

바. oozied.sh start (oozie가 설치된 노드에서 실행함)

사. spark 실행

- master기동(active, standby에서 각각 실행) : sbin/start-master.sh

- Worker기동(active에서 실행) : sbin/start-slaves.sh

- history서버 기동(active에서 실행) : sbin/start-history-server.sh

아. kafka 실행(broker서버 각각에서 실행)

- bin/kafka-server-start.sh config/server-1.properties &

- bin/kafka-server-start.sh config/server-2.properties &

- bin/kafka-server-start.sh config/server-3.properties &

---아래는 start-all.sh을 사용하지 않고 각각을 실행하는 경우이다(수동으로 기동).----------

1. 모든 데몬이 내려간 상태에서 HA관련 설정을 마무리하고 적용하는 경우를 가정한다.

2. zookeeper기동(master, node1, node2의 3개 서버에서 각각 실행시켜줌)

bin/zkServer.sh start

3. zookeeper에 HA를 위한 znode를 추가한다(namenode중 하나의 노드에서 실행하면 됨, 최초한번)

root@master:/root# sbin/hdfs zkfc -formatZK

15/05/05 16:12:34 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable

15/05/05 16:12:34 INFO tools.DFSZKFailoverController: Failover controller configured for NameNode NameNode at master/192.168.10.100:9000

15/05/05 16:12:35 INFO zookeeper.ZooKeeper: Client environment:zookeeper.version=3.4.6-1569965, built on 02/20/2014 09:09 GMT

15/05/05 16:12:35 INFO zookeeper.ZooKeeper: Client environment:host.name=master

15/05/05 16:12:35 INFO zookeeper.ZooKeeper: Client environment:java.version=1.7.0_60

15/05/05 16:12:35 INFO zookeeper.ZooKeeper: Client environment:java.vendor=Oracle Corporation

15/05/05 16:12:35 INFO zookeeper.ZooKeeper: Client environment:java.home=/usr/local/jdk1.7.0_60/jre

15/05/05 16:12:35 INFO zookeeper.ZooKeeper: Client environment:java.class.path=...

15/05/05 16:12:35 INFO ha.ActiveStandbyElector: Session connected.

===============================================

The configured parent znode /hadoop-ha/mycluster already exists.

Are you sure you want to clear all failover information from

ZooKeeper?

WARNING: Before proceeding, ensure that all HDFS services and

failover controllers are stopped!

===============================================

Proceed formatting /hadoop-ha/mycluster? (Y or N) Y

15/05/05 16:12:56 INFO ha.ActiveStandbyElector: Recursively deleting /hadoop-ha/mycluster from ZK...

15/05/05 16:12:57 INFO ha.ActiveStandbyElector: Successfully deleted /hadoop-ha/mycluster from ZK.

15/05/05 16:12:57 INFO ha.ActiveStandbyElector: Successfully created /hadoop-ha/mycluster in ZK.

15/05/05 16:12:57 INFO zookeeper.ClientCnxn: EventThread shut down

15/05/05 16:12:57 INFO zookeeper.ZooKeeper: Session: 0x24d2320df3b0000 closed

4. QJM로 사용할 서버마다 JournalNode를 실행한다.(예, node1, node2, node3)

root@master:/root# sbin/hadoop-daemon.sh start journalnode

starting journalnode, logging to /usr/local/hadoop/logs/hadoop-root-journalnode-master.out

*각각 실행시켜주지 않으면 namenode format할때 journalnode에 접속하지 못해서 아래와 같은 오류가 발생함

(아래는 node3에서 journalnode기동되지 않은 경우임)

--------------------------------------------------------------------------------------

rg.apache.hadoop.hdfs.qjournal.client.QuorumException: Unable to check if JNs are ready for formatting. 2 exceptions thrown:

192.168.10.101:8485: Call From master/192.168.10.100 to node1:8485 failed on connection exception: java.net.ConnectException: Connection refused; For more details see: http://wiki.apache.org/hadoop/ConnectionRefused

192.168.10.102:8485: Call From master/192.168.10.100 to node2:8485 failed on connection exception: java.net.ConnectException: Connection refused; For more details see: http://wiki.apache.org/hadoop/ConnectionRefused

at org.apache.hadoop.hdfs.qjournal.client.QuorumException.create(QuorumException.java:81)

at org.apache.hadoop.hdfs.qjournal.client.QuorumCall.rethrowException(QuorumCall.java:223)

at org.apache.hadoop.hdfs.qjournal.client.QuorumJournalManager.hasSomeData(QuorumJournalManager.java:232)

at org.apache.hadoop.hdfs.server.common.Storage.confirmFormat(Storage.java:884)

at org.apache.hadoop.hdfs.server.namenode.FSImage.confirmFormat(FSImage.java:171)

at org.apache.hadoop.hdfs.server.namenode.NameNode.format(NameNode.java:937)

at org.apache.hadoop.hdfs.server.namenode.NameNode.createNameNode(NameNode.java:1379)

at org.apache.hadoop.hdfs.server.namenode.NameNode.main(NameNode.java:1504)

15/05/05 16:18:04 FATAL namenode.NameNode: Failed to start namenode.

org.apache.hadoop.hdfs.qjournal.client.QuorumException: Unable to check if JNs are ready for formatting. 2 exceptions thrown: