Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.

mycluster not formatted 오류시 조치사항

총관리자 2016.07.29 14:49 조회 수 : 2705

./sbin/hadoop-daemon.sh start namenode를 실행할때 아래와 같은 오류가 뜨면서 namenode가 기동하지 못하는 경우가 있는데

이때는 "hdfs namenode -initializeSharedEdits" 명령을 master 서버에 실행하면 Re-format filesystem in QJM 여부를 묻는데

이때 Y를 선택하면 된다.

------hdfs namenode -initializeSharedEdits명령 실행시 로그내용----------------

16/07/29 15:16:01 INFO namenode.NameNode: registered UNIX signal handlers for [TERM, HUP, INT]

16/07/29 15:16:01 INFO namenode.NameNode: createNameNode [-initializeSharedEdits]

16/07/29 15:16:01 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable

16/07/29 15:16:01 WARN namenode.FSNamesystem: Only one image storage directory (dfs.namenode.name.dir) configured. Beware of data loss due to lack of redundant storage directories!

16/07/29 15:16:01 WARN namenode.FSNamesystem: Only one namespace edits storage directory (dfs.namenode.edits.dir) configured. Beware of data loss due to lack of redundant storage directories!

16/07/29 15:16:01 INFO namenode.FSNamesystem: No KeyProvider found.

16/07/29 15:16:01 INFO namenode.FSNamesystem: fsLock is fair:true

16/07/29 15:16:01 INFO blockmanagement.DatanodeManager: dfs.block.invalidate.limit=1000

16/07/29 15:16:01 INFO blockmanagement.DatanodeManager: dfs.namenode.datanode.registration.ip-hostname-check=true

16/07/29 15:16:01 INFO blockmanagement.BlockManager: dfs.namenode.startup.delay.block.deletion.sec is set to 000:00:00:00.000

16/07/29 15:16:01 INFO blockmanagement.BlockManager: The block deletion will start around 2016 7월 29 15:16:01

16/07/29 15:16:01 INFO util.GSet: Computing capacity for map BlocksMap

16/07/29 15:16:01 INFO util.GSet: VM type = 64-bit

16/07/29 15:16:01 INFO util.GSet: 2.0% max memory 958.5 MB = 19.2 MB

16/07/29 15:16:01 INFO util.GSet: capacity = 2^21 = 2097152 entries

16/07/29 15:16:01 INFO blockmanagement.BlockManager: dfs.block.access.token.enable=false

16/07/29 15:16:01 INFO blockmanagement.BlockManager: defaultReplication = 3

16/07/29 15:16:01 INFO blockmanagement.BlockManager: maxReplication = 512

16/07/29 15:16:01 INFO blockmanagement.BlockManager: minReplication = 1

16/07/29 15:16:01 INFO blockmanagement.BlockManager: maxReplicationStreams = 2

16/07/29 15:16:01 INFO blockmanagement.BlockManager: replicationRecheckInterval = 3000

16/07/29 15:16:01 INFO blockmanagement.BlockManager: encryptDataTransfer = false

16/07/29 15:16:01 INFO blockmanagement.BlockManager: maxNumBlocksToLog = 1000

16/07/29 15:16:01 INFO namenode.FSNamesystem: fsOwner = root (auth:SIMPLE)

16/07/29 15:16:01 INFO namenode.FSNamesystem: supergroup = supergroup

16/07/29 15:16:01 INFO namenode.FSNamesystem: isPermissionEnabled = false

16/07/29 15:16:01 INFO namenode.FSNamesystem: Determined nameservice ID: mycluster

16/07/29 15:16:01 INFO namenode.FSNamesystem: HA Enabled: true

16/07/29 15:16:01 INFO namenode.FSNamesystem: Append Enabled: true

16/07/29 15:16:01 INFO util.GSet: Computing capacity for map INodeMap

16/07/29 15:16:01 INFO util.GSet: VM type = 64-bit

16/07/29 15:16:01 INFO util.GSet: 1.0% max memory 958.5 MB = 9.6 MB

16/07/29 15:16:01 INFO util.GSet: capacity = 2^20 = 1048576 entries

16/07/29 15:16:01 INFO namenode.FSDirectory: ACLs enabled? false

16/07/29 15:16:01 INFO namenode.FSDirectory: XAttrs enabled? true

16/07/29 15:16:01 INFO namenode.FSDirectory: Maximum size of an xattr: 16384

16/07/29 15:16:01 INFO namenode.NameNode: Caching file names occuring more than 10 times

16/07/29 15:16:01 INFO util.GSet: Computing capacity for map cachedBlocks

16/07/29 15:16:01 INFO util.GSet: VM type = 64-bit

16/07/29 15:16:01 INFO util.GSet: 0.25% max memory 958.5 MB = 2.4 MB

16/07/29 15:16:01 INFO util.GSet: capacity = 2^18 = 262144 entries

16/07/29 15:16:01 INFO namenode.FSNamesystem: dfs.namenode.safemode.threshold-pct = 0.9990000128746033

16/07/29 15:16:01 INFO namenode.FSNamesystem: dfs.namenode.safemode.min.datanodes = 0

16/07/29 15:16:01 INFO namenode.FSNamesystem: dfs.namenode.safemode.extension = 30000

16/07/29 15:16:01 INFO metrics.TopMetrics: NNTop conf: dfs.namenode.top.window.num.buckets = 10

16/07/29 15:16:01 INFO metrics.TopMetrics: NNTop conf: dfs.namenode.top.num.users = 10

16/07/29 15:16:01 INFO metrics.TopMetrics: NNTop conf: dfs.namenode.top.windows.minutes = 1,5,25

16/07/29 15:16:01 INFO namenode.FSNamesystem: Retry cache on namenode is enabled

16/07/29 15:16:01 INFO namenode.FSNamesystem: Retry cache will use 0.03 of total heap and retry cache entry expiry time is 600000 millis

16/07/29 15:16:01 INFO util.GSet: Computing capacity for map NameNodeRetryCache

16/07/29 15:16:01 INFO util.GSet: VM type = 64-bit

16/07/29 15:16:01 INFO util.GSet: 0.029999999329447746% max memory 958.5 MB = 294.5 KB

16/07/29 15:16:01 INFO util.GSet: capacity = 2^15 = 32768 entries

16/07/29 15:16:01 INFO common.Storage: Lock on /data/hadoop/dfs/namenode/in_use.lock acquired by nodename 58145@sda1

16/07/29 15:16:01 INFO namenode.FSImage: No edit log streams selected.

16/07/29 15:16:01 INFO namenode.FSImageFormatPBINode: Loading 34148 INodes.

16/07/29 15:16:02 INFO namenode.FSImageFormatProtobuf: Loaded FSImage in 0 seconds.

16/07/29 15:16:02 INFO namenode.FSImage: Loaded image for txid 831713 from /data/hadoop/dfs/namenode/current/fsimage_0000000000000831713

16/07/29 15:16:02 INFO namenode.FSNamesystem: Need to save fs image? false (staleImage=true, haEnabled=true, isRollingUpgrade=false)

16/07/29 15:16:02 INFO namenode.NameCache: initialized with 222 entries 30740 lookups

16/07/29 15:16:02 INFO namenode.FSNamesystem: Finished loading FSImage in 272 msecs

Re-format filesystem in QJM to [XXX.XXX.XXX.44:8485, XXX.XXX.XXX.31:8485, XXX.XXX.XXX.32:8485] ? (Y or N) Y

16/07/29 15:16:33 INFO namenode.FileJournalManager: Recovering unfinalized segments in /data/hadoop/dfs/namenode/current

16/07/29 15:16:33 INFO client.QuorumJournalManager: Starting recovery process for unclosed journal segments...

16/07/29 15:16:33 INFO client.QuorumJournalManager: Successfully started new epoch 1

16/07/29 15:16:34 INFO util.ExitUtil: Exiting with status 0

16/07/29 15:16:34 INFO namenode.NameNode: SHUTDOWN_MSG:

/************************************************************

SHUTDOWN_MSG: Shutting down NameNode at sda1/XXX.XXX.XXX.43

************************************************************/

------------------------------오류내용-------------------------------

2016-06-12 15:02:34,760 INFO org.apache.hadoop.hdfs.server.namenode.FSImage: Start loading edits file http://so2:8480/getJournal?jid=mycluster&segmentTxId=185317&storageInfo=-63%3A1278801372%3A0%3ACID-c643ab86-79a1-481f-bd2e-f638d722ff4e, http://sda2:8480/

getJournal?jid=mycluster&segmentTxId=185317&storageInfo=-63%3A1278801372%3A0%3ACID-c643ab86-79a1-481f-bd2e-f638d722ff4e

"hadoop-root-namenode-sda1.log" 587921L, 201223721C

        at org.apache.hadoop.ipc.RPC$Server.call(RPC.java:969)

        at org.apache.hadoop.ipc.Server$Handler$1.run(Server.java:2049)

        at org.apache.hadoop.ipc.Server$Handler$1.run(Server.java:2045)

        at java.security.AccessController.doPrivileged(Native Method)

        at javax.security.auth.Subject.doAs(Subject.java:422)

        at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1657)

        at org.apache.hadoop.ipc.Server$Handler.run(Server.java:2043)

        at org.apache.hadoop.hdfs.qjournal.client.QuorumException.create(QuorumException.java:81)

        at org.apache.hadoop.hdfs.qjournal.client.QuorumCall.rethrowException(QuorumCall.java:223)

        at org.apache.hadoop.hdfs.qjournal.client.AsyncLoggerSet.waitForWriteQuorum(AsyncLoggerSet.java:142)

        at org.apache.hadoop.hdfs.qjournal.client.QuorumJournalManager.selectInputStreams(QuorumJournalManager.java:471)

        at org.apache.hadoop.hdfs.server.namenode.JournalSet.selectInputStreams(JournalSet.java:278)

        at org.apache.hadoop.hdfs.server.namenode.FSEditLog.selectInputStreams(FSEditLog.java:1508)

        at org.apache.hadoop.hdfs.server.namenode.FSEditLog.selectInputStreams(FSEditLog.java:1532)

        at org.apache.hadoop.hdfs.server.namenode.ha.EditLogTailer.doTailEdits(EditLogTailer.java:214)

        at org.apache.hadoop.hdfs.server.namenode.ha.EditLogTailer$EditLogTailerThread.doWork(EditLogTailer.java:331)

        at org.apache.hadoop.hdfs.server.namenode.ha.EditLogTailer$EditLogTailerThread.access$200(EditLogTailer.java:284)

        at org.apache.hadoop.hdfs.server.namenode.ha.EditLogTailer$EditLogTailerThread$1.run(EditLogTailer.java:301)

        at org.apache.hadoop.security.SecurityUtil.doAsLoginUserOrFatal(SecurityUtil.java:415)

        at org.apache.hadoop.hdfs.server.namenode.ha.EditLogTailer$EditLogTailerThread.run(EditLogTailer.java:297)

2016-07-29 14:11:14,799 INFO org.apache.hadoop.hdfs.server.namenode.FSNamesystem: Stopping services started for standby state

2016-07-29 14:11:14,799 WARN org.apache.hadoop.hdfs.server.namenode.ha.EditLogTailer: Edit log tailer interrupted

java.lang.InterruptedException: sleep interrupted

        at java.lang.Thread.sleep(Native Method)

        at org.apache.hadoop.hdfs.server.namenode.ha.EditLogTailer$EditLogTailerThread.doWork(EditLogTailer.java:347)

        at org.apache.hadoop.hdfs.server.namenode.ha.EditLogTailer$EditLogTailerThread.access$200(EditLogTailer.java:284)

        at org.apache.hadoop.hdfs.server.namenode.ha.EditLogTailer$EditLogTailerThread$1.run(EditLogTailer.java:301)

        at org.apache.hadoop.security.SecurityUtil.doAsLoginUserOrFatal(SecurityUtil.java:415)

        at org.apache.hadoop.hdfs.server.namenode.ha.EditLogTailer$EditLogTailerThread.run(EditLogTailer.java:297)

2016-07-29 14:11:14,800 INFO org.apache.hadoop.hdfs.server.namenode.FSNamesystem: Starting services required for active state

2016-07-29 14:11:14,807 INFO org.apache.hadoop.hdfs.qjournal.client.QuorumJournalManager: Starting recovery process for unclosed journal segments...

2016-07-29 14:11:14,831 FATAL org.apache.hadoop.hdfs.server.namenode.FSEditLog: Error: recoverUnfinalizedSegments failed for required journal (JournalAndStream(mgr=QJM to [XXX.XXX.XXX.44:8485, XXX.XXX.XXX.31:8485, XXX.XXX.XXX.32:8485], stream=null))

org.apache.hadoop.hdfs.qjournal.client.QuorumException: Got too many exceptions to achieve quorum size 2/3. 1 successful responses:

XXX.XXX.XXX.44:8485: lastPromisedEpoch: 22

httpPort: 8480

fromURL: "http://0.0.0.0:8480"

2 exceptions thrown:

XXX.XXX.XXX.32:8485: Journal Storage Directory /data/hadoop/journal/data/mycluster not formatted

        at org.apache.hadoop.hdfs.qjournal.server.Journal.checkFormatted(Journal.java:461)

        at org.apache.hadoop.hdfs.qjournal.server.Journal.getLastPromisedEpoch(Journal.java:244)

        at org.apache.hadoop.hdfs.qjournal.server.JournalNodeRpcServer.getJournalState(JournalNodeRpcServer.java:123)

        at org.apache.hadoop.hdfs.qjournal.protocolPB.QJournalProtocolServerSideTranslatorPB.getJournalState(QJournalProtocolServerSideTranslatorPB.java:118)

        at org.apache.hadoop.hdfs.qjournal.protocol.QJournalProtocolProtos$QJournalProtocolService$2.callBlockingMethod(QJournalProtocolProtos.java:25415)

        at org.apache.hadoop.ipc.ProtobufRpcEngine$Server$ProtoBufRpcInvoker.call(ProtobufRpcEngine.java:616)

        at org.apache.hadoop.ipc.RPC$Server.call(RPC.java:969)

        at org.apache.hadoop.ipc.Server$Handler$1.run(Server.java:2049)

        at org.apache.hadoop.ipc.Server$Handler$1.run(Server.java:2045)

        at java.security.AccessController.doPrivileged(Native Method)

        at javax.security.auth.Subject.doAs(Subject.java:422)

        at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1657)

        at org.apache.hadoop.ipc.Server$Handler.run(Server.java:2043)

XXX.XXX.XXX.31:8485: Journal Storage Directory /data/hadoop/journal/data/mycluster not formatted

        at org.apache.hadoop.hdfs.qjournal.server.Journal.checkFormatted(Journal.java:461)

        at org.apache.hadoop.hdfs.qjournal.server.Journal.getLastPromisedEpoch(Journal.java:244)

        at org.apache.hadoop.hdfs.qjournal.server.JournalNodeRpcServer.getJournalState(JournalNodeRpcServer.java:123)

        at org.apache.hadoop.hdfs.qjournal.protocolPB.QJournalProtocolServerSideTranslatorPB.getJournalState(QJournalProtocolServerSideTranslatorPB.java:118)

        at org.apache.hadoop.hdfs.qjournal.protocol.QJournalProtocolProtos$QJournalProtocolService$2.callBlockingMethod(QJournalProtocolProtos.java:25415)

        at org.apache.hadoop.ipc.ProtobufRpcEngine$Server$ProtoBufRpcInvoker.call(ProtobufRpcEngine.java:616)

        at org.apache.hadoop.ipc.RPC$Server.call(RPC.java:969)

        at org.apache.hadoop.ipc.Server$Handler$1.run(Server.java:2049)

        at org.apache.hadoop.ipc.Server$Handler$1.run(Server.java:2045)

        at java.security.AccessController.doPrivileged(Native Method)

        at javax.security.auth.Subject.doAs(Subject.java:422)

        at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1657)

        at org.apache.hadoop.ipc.Server$Handler.run(Server.java:2043)

        at org.apache.hadoop.hdfs.qjournal.client.QuorumException.create(QuorumException.java:81)

        at org.apache.hadoop.hdfs.qjournal.client.QuorumCall.rethrowException(QuorumCall.java:223)

이 게시물을

이 글의 추천인 목록 목록

번호	제목	날짜	조회 수
147	AIX 7.1에 Hadoop설치(정리중#2)	2016.09.20	1153
146	AIX 7.1에 Hadoop설치(정리중)	2016.09.12	2154
145	No broker partitions consumed by consumer thread오류 발생시 확인/조치할 사항	2016.09.02	2005
144	kafka 0.9.0.1버젼의 producer와 kafka버젼이 0.10.0.1인 consumer가 서로 대화하는 모습	2016.08.18	1646
143	down된 broker로 메세지를 전송하려는 경우의 오류 내용및 조치사항	2016.08.12	1274
142	kafkaWordCount.scala의 producer와 consumer 클래스를 이용하여 kafka를 이용한 word count 테스트 하기	2016.08.02	1813
141	bin/start-hbase.sh실행시 org.apache.hadoop.hbase.util.FileSystemVersionException: HBase file layout needs to be upgraded오류가 발생하면 조치사항	2016.08.01	1586
140	start-all.sh로 spark데몬 기동시 "JAVA_HOME is not set"오류 발생시 조치사항	2016.08.01	2314
139	hadoop클러스터를 구성하던 서버중 HA를 담당하는 서버의 hostname등이 변경되어 문제가 발생했을때 조치사항	2016.07.29	1505
»	Journal Storage Directory /data/hadoop/journal/data/mycluster not formatted 오류시 조치사항	2016.07.29	2705
137	Apache Spark와 Drools를 이용한 CEP구현 테스트	2016.07.15	2485
136	org.apache.hadoop.hbase.ClockOutOfSyncException: org.apache.hadoop.hbase.ClockOutOfSyncException 오류시 조치사항	2016.07.14	1241
135	kafka로 부터 메세지를 stream으로 받아 처리하는 spark샘플소스(spark의 producer와 consumer를 sbt로 컴파일 하고 서버에서 spark-submit하는 방법)	2016.07.13	1922
134	avro 사용하기(avsc 스키마 파일 컴파일 방법, consumer, producer샘플소스)	2016.07.08	2738
133	spark-sql실행시 ERROR log: Got exception: java.lang.NumberFormatException For input string: "2000ms" 오류발생시 조치사항	2016.06.09	1489
132	spark-sql실행시 Caused by: java.lang.NumberFormatException: For input string: "0s" 오류발생시 조치사항	2016.06.09	5825
131	spark-sql실행시 The specified datastore driver ("com.mysql.jdbc.Driver") was not found in the CLASSPATH오류 발생시 조치사항	2016.06.09	4357
130	./spark-sql 실행시 "java.lang.NumberFormatException: For input string: "1s"오류발생시 조치사항	2016.06.09	1685
129	beeline실행시 User: root is not allowed to impersonate오류 발생시 조치사항	2016.06.03	3050
128	Caused by: java.net.URISyntaxException: Relative path in absolute URI: ${system:java.io.tmpdir%7D/$%7Bsystem:user.name%7D오류발생시 조치사항	2016.06.03	2108

쓰기 태그

첫 페이지 11 12 13 14 15 16 17 18 19 20 끝 페이지

Cloudera, BigData, Semantic IoT, Hadoop, NoSQL

Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.

Hadoop Journal Storage Directory /data/hadoop/journal/data/mycluster not formatted 오류시 조치사항

댓글 0

Cloudera, BigData, Semantic IoT, Hadoop, NoSQL

Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.

Hadoop Journal Storage Directory /data/hadoop/journal/data/mycluster not formatted 오류시 조치사항

댓글 0

LOGIN