Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.
Kudu tablet server 혹은 kudu master가 어떤 원인에 의해서 replica가 failed상태인 경우는 다음과 같이 wal디렉토리 및 data디렉토리의 데이터를 지워서 내부적으로 다시 생성되도록 하여 복구 해야 한다.
(단, Kudu의 replication factor가 3이상 이어야 하며 1인 경우 데이터가 영구 손실 될 수 있으니 주의해야 한다.)
0. wal및 data영역 데이터 백업(필요시)
1. tablet service or kudu master stop
2. wal disk directory의 모든 데이터및 폴더 삭제 : sudo rm -rf /data21/kudu/wal
3. kudu data disk directory의 모든 데이터 삭제(space로 구분) : sudo rm -r /data01/kudu/data01/*...../data19/kudu/data19/*
4. tablet service or kudu master start
5. 전체 클러스터 대상 kudu rebalance수행