메뉴 건너뛰기

Cloudera, BigData, Semantic IoT, Hadoop, NoSQL

Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.


consensus데이터가 잘못되거나 data파일이 지워지거나 wal정보가 잘못되는등의 다양한 원인에 의해서 kudu tablet server의 서비스가 되지 않는 경우가 있는데

이런경우 다음과 같이 해당 tablet server서비스의 data데이터및 wal디렉토리의 데이터를 모두 삭제하여 kudu로 하여금 재구성 하면서 복구하도록 해야 한다. 

(TS03가 문제이며 경로는 wal : /kudu/tablet/wal, data : /data01/kudu/data, /data02/kudu/data, /data03/kudu/data인 경우임)

* 주의할점은 kudu cluster ksck를 통하여 각 테이블의 RF(replication factor가 3이상인지 반드시 확인해야 하며 1인 경우 해당 테이블의 데이터가 소실될 수 있으니 반드시 확인할것)

1. TS03의 kudu tablet service stop

2. backup 수행(필요시)

  - sudo mv /kudu/tablet/wal /kudu/tablet/wal_backup

  - sudo mv /data01/kudu/data /data01/kudu/data_backup

  - sudo mv /data02/kudu/data /data02/kudu/data_backup

  - sudo mv /data03/kudu/data /data03/kudu/data_backup

3. TS03서버의 Kudu tablet server 서비스 restart해준다. (관련 폴더가 자동으로 생성되면서 복구된다)

4. 상태 확인(테이블및 TS등의 상태을 확인할 수 있음) 

  - sudo -u kudu kinit -kt /run/cloudera-scm-agent/process/....-kudu-KUDU_MASTER/kudu.keytab kudu/master01.gooper.com@GOOPER.COM

  - sudo -u kudu kudu cluster ksck master01.gooper.com:7051,master02.gooper.com:7051,master03.gooper.com:7051



*참고 : 데이터 복구

1. TS03의 kudu tablet service stop

2. 기존데이터 삭제

  - sudo rm -r /kudu/tablet/wal

  - sudo rm -r /data01/kudu/data

  - sudo rm -r /data02/kudu/data

  - sudo rm -r /data03/kudu/data

3. 백업데이터를 이용하여 데이터 복구

  - sudo mv /kudu/tablet/wal_backup /kudu/tablet/wal

  - sudo mv /data01/kudu/data_backup /data01/kudu/data

  - sudo mv /data02/kudu/data_backup /data02/kudu/data

  - sudo mv /data03/kudu/data_backup /data03/kudu/data

4. TS03서버의 Kudu tablet server 서비스 restart해준다. (관련 폴더가 자동으로 생성되면서 복구된다) 

5. 상태 확인(테이블및 TS등의 상태을 확인할 수 있음)

  - sudo -u kudu kinit -kt /run/cloudera-scm-agent/process/....-kudu-KUDU_MASTER/kudu.keytab kudu/master01.gooper.com@GOOPER.COM

  - sudo -u kudu kudu cluster ksck master01.gooper.com:7051,master02.gooper.com:7051,master03.gooper.com:7051


   

  

번호 제목 날짜 조회 수
721 checking for termcap functions library... configure: error: No curses/termcap library found 2013.03.08 4185
720 다수의 로그 에이전트로 부터 로그를 받아 각각의 파일로 저장하는 방법(interceptor및 multiplexing) 2014.04.04 4158
719 Last transaction was partial에 따른 Unable to load database on disk오류 발생시 조치사항 2018.08.03 4097
718 Hadoop Cluster 설치 (Hadoop+Zookeeper+Hbase) file 2013.03.07 4063
717 Caused by: java.sql.SQLNonTransientConnectionException: Could not read resultset: unexpected end of stream, read 0 bytes from 4 오류시 확인/조치할 내용 2016.10.31 4061
716 원보드pc인 bananapi를 이용하여 hadoop 클러스터 구성하기(준비물) file 2014.05.29 3930
715 hadoop 2.6.0 기동(에코시스템 포함)및 wordcount 어플리케이션을 이용한 테스트 2015.05.05 3845
714 HBase 설치하기 – Fully-distributed 2013.03.12 3789
713 HBASE Client API : 기본 기능 정리 file 2013.04.01 3696
712 hadoop및 ecosystem에서 사용되는 명령문 정리 2014.05.28 3653
711 banana pi(lubuntu)에서 한글 설정및 한글깨짐 문제 해결 2014.07.06 3375
710 빅데이터 분석을 위한 샘플 빅데이터 파일 다운로드 사이트 2014.04.28 3332
709 Hbase Shell 명령 정리 2013.04.01 3296
708 "java.net.NoRouteToHostException: 호스트로 갈 루트가 없음" 오류시 확인및 조치할 사항 2016.04.01 3221
707 의사분산모드에 hadoop설치및 ecosystem 환경 정리 2014.05.29 3215
706 sqoop 1.4.4 설치및 테스트 2014.04.21 3207
705 의사분산모드에서 presto설치하기 2014.03.31 3124
704 Hive 사용법 및 쿼리 샘플코드 2013.03.07 3079
703 ping 안될때.. networking restart 날려주면 잘됨.. 2014.05.09 3071
702 hue.axes_accessattempt테이블의 username컬럼에 NULL 혹은 space가 들어갈수도 있음. 2021.11.03 3048
위로