메뉴 건너뛰기

Cloudera, BigData, Semantic IoT, Hadoop, NoSQL

Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.


아래와 같은 내용의 오류가 발생하면서 zookeeper 데몬이 실행되지 않는 경우가 있는데 이는 마지막 transaction log파일에 문제가 발생하여 읽지 못해서 발생하는 오류임.

먼저 dataDir(예, /var/lib/zookeeper)로 지정된 위치의 version-2폴더로 이동한다.

마지막의 log파일과 snapshot파일을 지우고 파일 크기가 0인 log파일도 삭제하고 zookeeper를 재기동하면 정상적으로 데몬이 기동되며 현재의 log및 snapshot를 새롭게 생성한것을 확인할 수 있다.


----- 수행 명령문 예시

gooper@gsda1:/var/lib/zookeeper/version-2$ sudo rm log.19000a12e6 snapshot.19000a12e5

gooper@gsda1:/var/lib/zookeeper/version-2$ sudo rm log.19000a2c4e


-----------------오류발생시의 파일------------------

-rw-r--r-- 1 zookeeper zookeeper 67108880 Jul 13 17:27 log.1900040c76

-rw-r--r-- 1 zookeeper zookeeper 67108880 Jul 16 05:25 log.1900054051

-rw-r--r-- 1 zookeeper zookeeper 67108880 Jul 19 21:23 log.1900061d04

-rw-r--r-- 1 zookeeper zookeeper 67108880 Jul 24 06:49 log.1900076140

-rw-r--r-- 1 zookeeper zookeeper 67108880 Jul 27 17:00 log.190008e4b7

-rw-r--r-- 1 zookeeper zookeeper 67108880 Aug  1 13:07 log.19000a12e6

-rw-r--r-- 1 zookeeper zookeeper        0 Aug  1 21:08 log.19000a2c4e

-rw-r--r-- 1 zookeeper zookeeper 11662886 Jul 13 17:27 snapshot.190005404f

-rw-r--r-- 1 zookeeper zookeeper 11662889 Jul 16 05:25 snapshot.1900061d03

-rw-r--r-- 1 zookeeper zookeeper 11662893 Jul 19 21:23 snapshot.190007613f

-rw-r--r-- 1 zookeeper zookeeper 11662834 Jul 24 06:49 snapshot.190008e4b7

-rw-r--r-- 1 zookeeper zookeeper 11662882 Jul 27 17:00 snapshot.19000a12e5


---------------조치후의 파일-----------
drwxr-xr-x 2 zookeeper zookeeper     4096 Aug  3 10:49 .
drwxr-xr-x 4 zookeeper zookeeper     4096 Jun  8 15:36 ..
-rw-r--r-- 1 zookeeper zookeeper        2 Aug  3 10:49 acceptedEpoch
-rw-r--r-- 1 zookeeper zookeeper        2 Aug  3 10:49 currentEpoch
-rw-r--r-- 1 zookeeper zookeeper 67108880 Jul 13 17:27 log.1900040c76
-rw-r--r-- 1 zookeeper zookeeper 67108880 Jul 16 05:25 log.1900054051
-rw-r--r-- 1 zookeeper zookeeper 67108880 Jul 19 21:23 log.1900061d04
-rw-r--r-- 1 zookeeper zookeeper 67108880 Jul 24 06:49 log.1900076140
-rw-r--r-- 1 zookeeper zookeeper 67108880 Jul 27 17:00 log.190008e4b7
-rw-r--r-- 1 zookeeper zookeeper 67108880 Aug  3 10:55 log.1f00003cfc
-rw-r--r-- 1 zookeeper zookeeper 11662886 Jul 13 17:27 snapshot.190005404f
-rw-r--r-- 1 zookeeper zookeeper 11662889 Jul 16 05:25 snapshot.1900061d03
-rw-r--r-- 1 zookeeper zookeeper 11662893 Jul 19 21:23 snapshot.190007613f
-rw-r--r-- 1 zookeeper zookeeper 11662834 Jul 24 06:49 snapshot.190008e4b7
-rw-r--r-- 1 zookeeper zookeeper 11663132 Aug  3 10:49 snapshot.1f00003cfb


-------------------------------------오류내용------------------------------------------

10:20:40.395 AMINFOFileSnap

Reading snapshot /var/lib/zookeeper/version-2/snapshot.19000a12e5
10:20:40.920 AMERRORUtil
Last transaction was partial.
10:20:40.932 AMERRORQuorumPeer
Unable to load database on disk
java.io.EOFException
	at java.io.DataInputStream.readInt(DataInputStream.java:392)
	at org.apache.jute.BinaryInputArchive.readInt(BinaryInputArchive.java:63)
	at org.apache.zookeeper.server.persistence.FileHeader.deserialize(FileHeader.java:64)
	at org.apache.zookeeper.server.persistence.FileTxnLog$FileTxnIterator.inStreamCreated(FileTxnLog.java:595)
	at org.apache.zookeeper.server.persistence.FileTxnLog$FileTxnIterator.createInputArchive(FileTxnLog.java:614)
	at org.apache.zookeeper.server.persistence.FileTxnLog$FileTxnIterator.goToNextLog(FileTxnLog.java:580)
	at org.apache.zookeeper.server.persistence.FileTxnLog$FileTxnIterator.next(FileTxnLog.java:662)
	at org.apache.zookeeper.server.persistence.FileTxnSnapLog.restore(FileTxnSnapLog.java:204)
	at org.apache.zookeeper.server.ZKDatabase.loadDataBase(ZKDatabase.java:223)
	at org.apache.zookeeper.server.quorum.QuorumPeer.loadDataBase(QuorumPeer.java:530)
	at org.apache.zookeeper.server.quorum.QuorumPeer.start(QuorumPeer.java:520)
	at org.apache.zookeeper.server.quorum.QuorumPeerMain.runFromConfig(QuorumPeerMain.java:167)
	at org.apache.zookeeper.server.quorum.QuorumPeerMain.initializeAndRun(QuorumPeerMain.java:116)
	at org.apache.zookeeper.server.quorum.QuorumPeerMain.main(QuorumPeerMain.java:79)
10:20:40.945 AMERRORQuorumPeerMain
Unexpected exception, exiting abnormally
java.lang.RuntimeException: Unable to run quorum server 
	at org.apache.zookeeper.server.quorum.QuorumPeer.loadDataBase(QuorumPeer.java:578)
	at org.apache.zookeeper.server.quorum.QuorumPeer.start(QuorumPeer.java:520)
	at org.apache.zookeeper.server.quorum.QuorumPeerMain.runFromConfig(QuorumPeerMain.java:167)
	at org.apache.zookeeper.server.quorum.QuorumPeerMain.initializeAndRun(QuorumPeerMain.java:116)
	at org.apache.zookeeper.server.quorum.QuorumPeerMain.main(QuorumPeerMain.java:79)
Caused by: java.io.EOFException
	at java.io.DataInputStream.readInt(DataInputStream.java:392)
	at org.apache.jute.BinaryInputArchive.readInt(BinaryInputArchive.java:63)
	at org.apache.zookeeper.server.persistence.FileHeader.deserialize(FileHeader.java:64)
	at org.apache.zookeeper.server.persistence.FileTxnLog$FileTxnIterator.inStreamCreated(FileTxnLog.java:595)
	at org.apache.zookeeper.server.persistence.FileTxnLog$FileTxnIterator.createInputArchive(FileTxnLog.java:614)
	at org.apache.zookeeper.server.persistence.FileTxnLog$FileTxnIterator.goToNextLog(FileTxnLog.java:580)
	at org.apache.zookeeper.server.persistence.FileTxnLog$FileTxnIterator.next(FileTxnLog.java:662)
	at org.apache.zookeeper.server.persistence.FileTxnSnapLog.restore(FileTxnSnapLog.java:204)
	at org.apache.zookeeper.server.ZKDatabase.loadDataBase(ZKDatabase.java:223)
	at org.apache.zookeeper.server.quorum.QuorumPeer.loadDataBase(QuorumPeer.java:530)
	... 4 more
번호 제목 날짜 조회 수
300 json으로 존재하는 데이터 parsing하기 2019.03.25 1256
299 TransmitData() to failed: Network error: Recv() got EOF from remote (error 108) 오류 현상 2019.02.15 551
298 [Oozie]Disk I/O error: Failed to open HDFS file dhfs://..../tb_aaa/....OPYING 2019.02.15 400
297 kafka에서 메세지 중복 consume이 발생할 수 있는 상황 2018.10.23 464
296 [sentry]role부여후 테이블명이 변경되어 오류가 발생할때 조치방법 2018.10.16 427
295 hive metastore ERD file 2018.09.20 875
294 Error: java.lang.RuntimeException: java.lang.OutOfMemoryError 오류가 발생하는 경우 2018.09.20 649
293 physical memory used되면서 mapper가 kill되는 경우 오류 발생시 조치 2018.09.20 1758
292 impala,hive및 hdfs만 접근가능하고 파일을 이용한 테이블생성가능하도록 hue 권한설정설정 2018.09.17 573
291 cloudera(python 2.7.5)에서 anaconda3로 설치한 외부 python(3.6.6)을 이용하여 pyspark를 사용하는 설정 2018.09.14 1126
290 oracle to hive data type정리표 2018.08.22 937
289 postgresql-9.4에서 FATAL: remaining connection slots are reserved for non-replication superuser connections가 나올때 조치 2018.08.16 1085
288 sentry설정 방법및 활성화시 설정이 필요한 파일및 설정값, 계정생성 방법 2018.08.16 891
287 컬럼및 라인의 구분자를 지정하여 sqoop으로 데이타를 가져오고 hive테이블을 생성하는 명령문 2018.08.03 691
286 sqoop으로 mariadb에 접근해서 hive 테이블로 자동으로 생성하기 2018.08.03 818
» Last transaction was partial에 따른 Unable to load database on disk오류 발생시 조치사항 2018.08.03 4099
284 RHEL 7.4에 zeppelin 0.7.4 설치 2018.07.31 479
283 conda를 이용한 jupyterhub(v0.9)및 jupyter설치 (v4.4.0) 2018.07.30 711
282 HiveServer2인증을 PAM을 이용하도록 설정하는 방법 2018.07.21 472
281 [postgresql 9.x] PostgreSQL Replication 구축하기 2018.07.17 324
위로