메뉴 건너뛰기

Bigdata, Semantic IoT, Hadoop, NoSQL

Bigdata, Hadoop ecosystem, Semantic IoT등의 프로젝트를 진행중에 습득한 내용을 정리하는 곳입니다.
필요한 분을 위해서 공개하고 있습니다. 문의사항은 gooper@gooper.com로 메일을 보내주세요.


아래와 같은 내용의 오류가 발생하면서 zookeeper 데몬이 실행되지 않는 경우가 있는데 이는 마지막 transaction log파일에 문제가 발생하여 읽지 못해서 발생하는 오류임.

먼저 dataDir(예, /var/lib/zookeeper)로 지정된 위치의 version-2폴더로 이동한다.

마지막의 log파일과 snapshot파일을 지우고 파일 크기가 0인 log파일도 삭제하고 zookeeper를 재기동하면 정상적으로 데몬이 기동되며 현재의 log및 snapshot를 새롭게 생성한것을 확인할 수 있다.


----- 수행 명령문 예시

gooper@gsda1:/var/lib/zookeeper/version-2$ sudo rm log.19000a12e6 snapshot.19000a12e5

gooper@gsda1:/var/lib/zookeeper/version-2$ sudo rm log.19000a2c4e


-----------------오류발생시의 파일------------------

-rw-r--r-- 1 zookeeper zookeeper 67108880 Jul 13 17:27 log.1900040c76

-rw-r--r-- 1 zookeeper zookeeper 67108880 Jul 16 05:25 log.1900054051

-rw-r--r-- 1 zookeeper zookeeper 67108880 Jul 19 21:23 log.1900061d04

-rw-r--r-- 1 zookeeper zookeeper 67108880 Jul 24 06:49 log.1900076140

-rw-r--r-- 1 zookeeper zookeeper 67108880 Jul 27 17:00 log.190008e4b7

-rw-r--r-- 1 zookeeper zookeeper 67108880 Aug  1 13:07 log.19000a12e6

-rw-r--r-- 1 zookeeper zookeeper        0 Aug  1 21:08 log.19000a2c4e

-rw-r--r-- 1 zookeeper zookeeper 11662886 Jul 13 17:27 snapshot.190005404f

-rw-r--r-- 1 zookeeper zookeeper 11662889 Jul 16 05:25 snapshot.1900061d03

-rw-r--r-- 1 zookeeper zookeeper 11662893 Jul 19 21:23 snapshot.190007613f

-rw-r--r-- 1 zookeeper zookeeper 11662834 Jul 24 06:49 snapshot.190008e4b7

-rw-r--r-- 1 zookeeper zookeeper 11662882 Jul 27 17:00 snapshot.19000a12e5


---------------조치후의 파일-----------
drwxr-xr-x 2 zookeeper zookeeper     4096 Aug  3 10:49 .
drwxr-xr-x 4 zookeeper zookeeper     4096 Jun  8 15:36 ..
-rw-r--r-- 1 zookeeper zookeeper        2 Aug  3 10:49 acceptedEpoch
-rw-r--r-- 1 zookeeper zookeeper        2 Aug  3 10:49 currentEpoch
-rw-r--r-- 1 zookeeper zookeeper 67108880 Jul 13 17:27 log.1900040c76
-rw-r--r-- 1 zookeeper zookeeper 67108880 Jul 16 05:25 log.1900054051
-rw-r--r-- 1 zookeeper zookeeper 67108880 Jul 19 21:23 log.1900061d04
-rw-r--r-- 1 zookeeper zookeeper 67108880 Jul 24 06:49 log.1900076140
-rw-r--r-- 1 zookeeper zookeeper 67108880 Jul 27 17:00 log.190008e4b7
-rw-r--r-- 1 zookeeper zookeeper 67108880 Aug  3 10:55 log.1f00003cfc
-rw-r--r-- 1 zookeeper zookeeper 11662886 Jul 13 17:27 snapshot.190005404f
-rw-r--r-- 1 zookeeper zookeeper 11662889 Jul 16 05:25 snapshot.1900061d03
-rw-r--r-- 1 zookeeper zookeeper 11662893 Jul 19 21:23 snapshot.190007613f
-rw-r--r-- 1 zookeeper zookeeper 11662834 Jul 24 06:49 snapshot.190008e4b7
-rw-r--r-- 1 zookeeper zookeeper 11663132 Aug  3 10:49 snapshot.1f00003cfb


-------------------------------------오류내용------------------------------------------

10:20:40.395 AMINFOFileSnap

Reading snapshot /var/lib/zookeeper/version-2/snapshot.19000a12e5
10:20:40.920 AMERRORUtil
Last transaction was partial.
10:20:40.932 AMERRORQuorumPeer
Unable to load database on disk
java.io.EOFException
	at java.io.DataInputStream.readInt(DataInputStream.java:392)
	at org.apache.jute.BinaryInputArchive.readInt(BinaryInputArchive.java:63)
	at org.apache.zookeeper.server.persistence.FileHeader.deserialize(FileHeader.java:64)
	at org.apache.zookeeper.server.persistence.FileTxnLog$FileTxnIterator.inStreamCreated(FileTxnLog.java:595)
	at org.apache.zookeeper.server.persistence.FileTxnLog$FileTxnIterator.createInputArchive(FileTxnLog.java:614)
	at org.apache.zookeeper.server.persistence.FileTxnLog$FileTxnIterator.goToNextLog(FileTxnLog.java:580)
	at org.apache.zookeeper.server.persistence.FileTxnLog$FileTxnIterator.next(FileTxnLog.java:662)
	at org.apache.zookeeper.server.persistence.FileTxnSnapLog.restore(FileTxnSnapLog.java:204)
	at org.apache.zookeeper.server.ZKDatabase.loadDataBase(ZKDatabase.java:223)
	at org.apache.zookeeper.server.quorum.QuorumPeer.loadDataBase(QuorumPeer.java:530)
	at org.apache.zookeeper.server.quorum.QuorumPeer.start(QuorumPeer.java:520)
	at org.apache.zookeeper.server.quorum.QuorumPeerMain.runFromConfig(QuorumPeerMain.java:167)
	at org.apache.zookeeper.server.quorum.QuorumPeerMain.initializeAndRun(QuorumPeerMain.java:116)
	at org.apache.zookeeper.server.quorum.QuorumPeerMain.main(QuorumPeerMain.java:79)
10:20:40.945 AMERRORQuorumPeerMain
Unexpected exception, exiting abnormally
java.lang.RuntimeException: Unable to run quorum server 
	at org.apache.zookeeper.server.quorum.QuorumPeer.loadDataBase(QuorumPeer.java:578)
	at org.apache.zookeeper.server.quorum.QuorumPeer.start(QuorumPeer.java:520)
	at org.apache.zookeeper.server.quorum.QuorumPeerMain.runFromConfig(QuorumPeerMain.java:167)
	at org.apache.zookeeper.server.quorum.QuorumPeerMain.initializeAndRun(QuorumPeerMain.java:116)
	at org.apache.zookeeper.server.quorum.QuorumPeerMain.main(QuorumPeerMain.java:79)
Caused by: java.io.EOFException
	at java.io.DataInputStream.readInt(DataInputStream.java:392)
	at org.apache.jute.BinaryInputArchive.readInt(BinaryInputArchive.java:63)
	at org.apache.zookeeper.server.persistence.FileHeader.deserialize(FileHeader.java:64)
	at org.apache.zookeeper.server.persistence.FileTxnLog$FileTxnIterator.inStreamCreated(FileTxnLog.java:595)
	at org.apache.zookeeper.server.persistence.FileTxnLog$FileTxnIterator.createInputArchive(FileTxnLog.java:614)
	at org.apache.zookeeper.server.persistence.FileTxnLog$FileTxnIterator.goToNextLog(FileTxnLog.java:580)
	at org.apache.zookeeper.server.persistence.FileTxnLog$FileTxnIterator.next(FileTxnLog.java:662)
	at org.apache.zookeeper.server.persistence.FileTxnSnapLog.restore(FileTxnSnapLog.java:204)
	at org.apache.zookeeper.server.ZKDatabase.loadDataBase(ZKDatabase.java:223)
	at org.apache.zookeeper.server.quorum.QuorumPeer.loadDataBase(QuorumPeer.java:530)
	... 4 more
번호 제목 글쓴이 날짜 조회 수
741 bananapi 5대(ubuntu계열 리눅스)에 yarn(hadoop 2.6.0)설치하기-ResourceManager HA/HDFS HA포함, JobHistory포함 총관리자 2015.04.24 19149
740 mapreduce appliction을 실행시 "is running beyond virtual memory limits" 오류 발생시 조치사항 총관리자 2017.05.04 16908
739 org.apache.hadoop.hdfs.server.common.InconsistentFSStateException: Directory /tmp/hadoop-root/dfs/name is in an inconsistent state: storage directory does not exist or is not accessible. 구퍼 2013.03.11 14781
738 drop table로 삭제했으나 tablet server에는 여전히 존재하는 테이블 삭제방법 총관리자 2021.07.09 7599
737 insert hbase by hive ... error occured after 5 hours..HMaster가 뜨지 않는 장애에 대한 복구 방법 총관리자 2014.04.29 7131
736 Resource temporarily unavailable(자원이 일시적으로 사용 불가능함) 오류조치 총관리자 2015.11.19 7072
735 HBase shell로 작업하기 구퍼 2013.03.15 5834
734 [DataNode]org.apache.hadoop.security.KerberosAuthException: failure to login: for principal: hdfs/datanode03@GOOPER.COM from keytab hdfs.keytab오류 gooper 2023.04.18 5775
733 dr.who로 공격들어오는 경우 조치방법 file 총관리자 2018.06.09 5604
732 하둡 분산 파일 시스템을 기반으로 색인하고 검색하기 구퍼 2013.03.15 5574
731 [Decommission]시 시간이 많이 걸리면서(수일) Decommission이 완료되지 않는 경우 조치 총관리자 2018.01.03 5564
730 Ubuntu 16.04LTS 설치후 초기에 주어야 하는 작업(php, apache, mariadb설치및 OS보안설정등) file 총관리자 2017.05.23 5277
729 hive 2.0.1 설치및 mariadb로 metastore 설정 총관리자 2016.06.03 5192
728 Hive Query Examples from test code (2 of 2) 총관리자 2014.03.26 5032
727 Spark에서 Serializable관련 오류및 조치사항 총관리자 2017.04.21 4907
726 [gson]mongodb의 api를 이용하여 데이타를 가져올때 "com.google.gson.stream.MalformedJsonException: Unterminated object at line..." 오류발생시 조치사항 총관리자 2017.12.11 4526
725 import 혹은 export할때 hive파일의 default 구분자는 --input-fields-terminated-by "x01"와 같이 지정해야함 총관리자 2014.05.20 4247
724 checking for termcap functions library... configure: error: No curses/termcap library found 구퍼 2013.03.08 4122
723 .git폴더를 삭제하고 다시 git에 추가하고 서버에 반영하는 방법 총관리자 2017.06.19 4098
722 sqoop작업시 hdfs의 개수보다 더많은 값이 중복되어 oracle에 입력되는 경우가 있음 총관리자 2014.09.02 4095

A personal place to organize information learned during the development of such Hadoop, Hive, Hbase, Semantic IoT, etc.
We are open to the required minutes. Please send inquiries to gooper@gooper.com.

위로