메뉴 건너뛰기

Cloudera, BigData, Semantic IoT, Hadoop, NoSQL

Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.


아래와 같은 내용의 오류가 발생하면서 zookeeper 데몬이 실행되지 않는 경우가 있는데 이는 마지막 transaction log파일에 문제가 발생하여 읽지 못해서 발생하는 오류임.

먼저 dataDir(예, /var/lib/zookeeper)로 지정된 위치의 version-2폴더로 이동한다.

마지막의 log파일과 snapshot파일을 지우고 파일 크기가 0인 log파일도 삭제하고 zookeeper를 재기동하면 정상적으로 데몬이 기동되며 현재의 log및 snapshot를 새롭게 생성한것을 확인할 수 있다.


----- 수행 명령문 예시

gooper@gsda1:/var/lib/zookeeper/version-2$ sudo rm log.19000a12e6 snapshot.19000a12e5

gooper@gsda1:/var/lib/zookeeper/version-2$ sudo rm log.19000a2c4e


-----------------오류발생시의 파일------------------

-rw-r--r-- 1 zookeeper zookeeper 67108880 Jul 13 17:27 log.1900040c76

-rw-r--r-- 1 zookeeper zookeeper 67108880 Jul 16 05:25 log.1900054051

-rw-r--r-- 1 zookeeper zookeeper 67108880 Jul 19 21:23 log.1900061d04

-rw-r--r-- 1 zookeeper zookeeper 67108880 Jul 24 06:49 log.1900076140

-rw-r--r-- 1 zookeeper zookeeper 67108880 Jul 27 17:00 log.190008e4b7

-rw-r--r-- 1 zookeeper zookeeper 67108880 Aug  1 13:07 log.19000a12e6

-rw-r--r-- 1 zookeeper zookeeper        0 Aug  1 21:08 log.19000a2c4e

-rw-r--r-- 1 zookeeper zookeeper 11662886 Jul 13 17:27 snapshot.190005404f

-rw-r--r-- 1 zookeeper zookeeper 11662889 Jul 16 05:25 snapshot.1900061d03

-rw-r--r-- 1 zookeeper zookeeper 11662893 Jul 19 21:23 snapshot.190007613f

-rw-r--r-- 1 zookeeper zookeeper 11662834 Jul 24 06:49 snapshot.190008e4b7

-rw-r--r-- 1 zookeeper zookeeper 11662882 Jul 27 17:00 snapshot.19000a12e5


---------------조치후의 파일-----------
drwxr-xr-x 2 zookeeper zookeeper     4096 Aug  3 10:49 .
drwxr-xr-x 4 zookeeper zookeeper     4096 Jun  8 15:36 ..
-rw-r--r-- 1 zookeeper zookeeper        2 Aug  3 10:49 acceptedEpoch
-rw-r--r-- 1 zookeeper zookeeper        2 Aug  3 10:49 currentEpoch
-rw-r--r-- 1 zookeeper zookeeper 67108880 Jul 13 17:27 log.1900040c76
-rw-r--r-- 1 zookeeper zookeeper 67108880 Jul 16 05:25 log.1900054051
-rw-r--r-- 1 zookeeper zookeeper 67108880 Jul 19 21:23 log.1900061d04
-rw-r--r-- 1 zookeeper zookeeper 67108880 Jul 24 06:49 log.1900076140
-rw-r--r-- 1 zookeeper zookeeper 67108880 Jul 27 17:00 log.190008e4b7
-rw-r--r-- 1 zookeeper zookeeper 67108880 Aug  3 10:55 log.1f00003cfc
-rw-r--r-- 1 zookeeper zookeeper 11662886 Jul 13 17:27 snapshot.190005404f
-rw-r--r-- 1 zookeeper zookeeper 11662889 Jul 16 05:25 snapshot.1900061d03
-rw-r--r-- 1 zookeeper zookeeper 11662893 Jul 19 21:23 snapshot.190007613f
-rw-r--r-- 1 zookeeper zookeeper 11662834 Jul 24 06:49 snapshot.190008e4b7
-rw-r--r-- 1 zookeeper zookeeper 11663132 Aug  3 10:49 snapshot.1f00003cfb


-------------------------------------오류내용------------------------------------------

10:20:40.395 AMINFOFileSnap

Reading snapshot /var/lib/zookeeper/version-2/snapshot.19000a12e5
10:20:40.920 AMERRORUtil
Last transaction was partial.
10:20:40.932 AMERRORQuorumPeer
Unable to load database on disk
java.io.EOFException
	at java.io.DataInputStream.readInt(DataInputStream.java:392)
	at org.apache.jute.BinaryInputArchive.readInt(BinaryInputArchive.java:63)
	at org.apache.zookeeper.server.persistence.FileHeader.deserialize(FileHeader.java:64)
	at org.apache.zookeeper.server.persistence.FileTxnLog$FileTxnIterator.inStreamCreated(FileTxnLog.java:595)
	at org.apache.zookeeper.server.persistence.FileTxnLog$FileTxnIterator.createInputArchive(FileTxnLog.java:614)
	at org.apache.zookeeper.server.persistence.FileTxnLog$FileTxnIterator.goToNextLog(FileTxnLog.java:580)
	at org.apache.zookeeper.server.persistence.FileTxnLog$FileTxnIterator.next(FileTxnLog.java:662)
	at org.apache.zookeeper.server.persistence.FileTxnSnapLog.restore(FileTxnSnapLog.java:204)
	at org.apache.zookeeper.server.ZKDatabase.loadDataBase(ZKDatabase.java:223)
	at org.apache.zookeeper.server.quorum.QuorumPeer.loadDataBase(QuorumPeer.java:530)
	at org.apache.zookeeper.server.quorum.QuorumPeer.start(QuorumPeer.java:520)
	at org.apache.zookeeper.server.quorum.QuorumPeerMain.runFromConfig(QuorumPeerMain.java:167)
	at org.apache.zookeeper.server.quorum.QuorumPeerMain.initializeAndRun(QuorumPeerMain.java:116)
	at org.apache.zookeeper.server.quorum.QuorumPeerMain.main(QuorumPeerMain.java:79)
10:20:40.945 AMERRORQuorumPeerMain
Unexpected exception, exiting abnormally
java.lang.RuntimeException: Unable to run quorum server 
	at org.apache.zookeeper.server.quorum.QuorumPeer.loadDataBase(QuorumPeer.java:578)
	at org.apache.zookeeper.server.quorum.QuorumPeer.start(QuorumPeer.java:520)
	at org.apache.zookeeper.server.quorum.QuorumPeerMain.runFromConfig(QuorumPeerMain.java:167)
	at org.apache.zookeeper.server.quorum.QuorumPeerMain.initializeAndRun(QuorumPeerMain.java:116)
	at org.apache.zookeeper.server.quorum.QuorumPeerMain.main(QuorumPeerMain.java:79)
Caused by: java.io.EOFException
	at java.io.DataInputStream.readInt(DataInputStream.java:392)
	at org.apache.jute.BinaryInputArchive.readInt(BinaryInputArchive.java:63)
	at org.apache.zookeeper.server.persistence.FileHeader.deserialize(FileHeader.java:64)
	at org.apache.zookeeper.server.persistence.FileTxnLog$FileTxnIterator.inStreamCreated(FileTxnLog.java:595)
	at org.apache.zookeeper.server.persistence.FileTxnLog$FileTxnIterator.createInputArchive(FileTxnLog.java:614)
	at org.apache.zookeeper.server.persistence.FileTxnLog$FileTxnIterator.goToNextLog(FileTxnLog.java:580)
	at org.apache.zookeeper.server.persistence.FileTxnLog$FileTxnIterator.next(FileTxnLog.java:662)
	at org.apache.zookeeper.server.persistence.FileTxnSnapLog.restore(FileTxnSnapLog.java:204)
	at org.apache.zookeeper.server.ZKDatabase.loadDataBase(ZKDatabase.java:223)
	at org.apache.zookeeper.server.quorum.QuorumPeer.loadDataBase(QuorumPeer.java:530)
	... 4 more
번호 제목 날짜 조회 수
302 하둡 클러스터 전체 노드를 다시 기동하면 invalidate metadata를 수행해야 데이터가 틀어지지 않는다. 2019.05.20 1177
301 Could not configure server becase SASL configuration did not allow the Zookeeper server to authenticate itself properly: javax.security.auth.login.LoginException: Checksum failed 2019.05.18 611
300 json으로 존재하는 데이터 parsing하기 2019.03.25 1719
299 TransmitData() to failed: Network error: Recv() got EOF from remote (error 108) 오류 현상 2019.02.15 1097
298 [Oozie]Disk I/O error: Failed to open HDFS file dhfs://..../tb_aaa/....OPYING 2019.02.15 1128
297 kafka에서 메세지 중복 consume이 발생할 수 있는 상황 2018.10.23 974
296 [sentry]role부여후 테이블명이 변경되어 오류가 발생할때 조치방법 2018.10.16 1024
295 hive metastore ERD file 2018.09.20 992
294 Error: java.lang.RuntimeException: java.lang.OutOfMemoryError 오류가 발생하는 경우 2018.09.20 1091
293 physical memory used되면서 mapper가 kill되는 경우 오류 발생시 조치 2018.09.20 2085
292 impala,hive및 hdfs만 접근가능하고 파일을 이용한 테이블생성가능하도록 hue 권한설정설정 2018.09.17 802
291 cloudera(python 2.7.5)에서 anaconda3로 설치한 외부 python(3.6.6)을 이용하여 pyspark를 사용하는 설정 2018.09.14 1421
290 oracle to hive data type정리표 2018.08.22 5151
289 postgresql-9.4에서 FATAL: remaining connection slots are reserved for non-replication superuser connections가 나올때 조치 2018.08.16 1531
288 sentry설정 방법및 활성화시 설정이 필요한 파일및 설정값, 계정생성 방법 2018.08.16 1271
287 컬럼및 라인의 구분자를 지정하여 sqoop으로 데이타를 가져오고 hive테이블을 생성하는 명령문 2018.08.03 1146
286 sqoop으로 mariadb에 접근해서 hive 테이블로 자동으로 생성하기 2018.08.03 1340
» Last transaction was partial에 따른 Unable to load database on disk오류 발생시 조치사항 2018.08.03 4276
284 RHEL 7.4에 zeppelin 0.7.4 설치 2018.07.31 1501
283 conda를 이용한 jupyterhub(v0.9)및 jupyter설치 (v4.4.0) 2018.07.30 1178
위로