메뉴 건너뛰기

Cloudera, BigData, Semantic IoT, Hadoop, NoSQL

Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.


consensus데이터가 잘못되거나 data파일이 지워지거나 wal정보가 잘못되는등의 다양한 원인에 의해서 kudu tablet server의 서비스가 되지 않는 경우가 있는데

이런경우 다음과 같이 해당 tablet server서비스의 data데이터및 wal디렉토리의 데이터를 모두 삭제하여 kudu로 하여금 재구성 하면서 복구하도록 해야 한다. 

(TS03가 문제이며 경로는 wal : /kudu/tablet/wal, data : /data01/kudu/data, /data02/kudu/data, /data03/kudu/data인 경우임)

* 주의할점은 kudu cluster ksck를 통하여 각 테이블의 RF(replication factor가 3이상인지 반드시 확인해야 하며 1인 경우 해당 테이블의 데이터가 소실될 수 있으니 반드시 확인할것)

1. TS03의 kudu tablet service stop

2. backup 수행(필요시)

  - sudo mv /kudu/tablet/wal /kudu/tablet/wal_backup

  - sudo mv /data01/kudu/data /data01/kudu/data_backup

  - sudo mv /data02/kudu/data /data02/kudu/data_backup

  - sudo mv /data03/kudu/data /data03/kudu/data_backup

3. TS03서버의 Kudu tablet server 서비스 restart해준다. (관련 폴더가 자동으로 생성되면서 복구된다)

4. 상태 확인(테이블및 TS등의 상태을 확인할 수 있음) 

  - sudo -u kudu kinit -kt /run/cloudera-scm-agent/process/....-kudu-KUDU_MASTER/kudu.keytab kudu/master01.gooper.com@GOOPER.COM

  - sudo -u kudu kudu cluster ksck master01.gooper.com:7051,master02.gooper.com:7051,master03.gooper.com:7051



*참고 : 데이터 복구

1. TS03의 kudu tablet service stop

2. 기존데이터 삭제

  - sudo rm -r /kudu/tablet/wal

  - sudo rm -r /data01/kudu/data

  - sudo rm -r /data02/kudu/data

  - sudo rm -r /data03/kudu/data

3. 백업데이터를 이용하여 데이터 복구

  - sudo mv /kudu/tablet/wal_backup /kudu/tablet/wal

  - sudo mv /data01/kudu/data_backup /data01/kudu/data

  - sudo mv /data02/kudu/data_backup /data02/kudu/data

  - sudo mv /data03/kudu/data_backup /data03/kudu/data

4. TS03서버의 Kudu tablet server 서비스 restart해준다. (관련 폴더가 자동으로 생성되면서 복구된다) 

5. 상태 확인(테이블및 TS등의 상태을 확인할 수 있음)

  - sudo -u kudu kinit -kt /run/cloudera-scm-agent/process/....-kudu-KUDU_MASTER/kudu.keytab kudu/master01.gooper.com@GOOPER.COM

  - sudo -u kudu kudu cluster ksck master01.gooper.com:7051,master02.gooper.com:7051,master03.gooper.com:7051


   

  

번호 제목 날짜 조회 수
» [KUDU] kudu tablet server여러가지 원인에 의해서 corrupted상태가 된 경우 복구방법 2023.03.28 1127
701 Hadoop Clsuter에 이미 포함된 host의 hostname변경시 처리 절차 2023.03.24 593
700 [Kudu]ERROR: Unable to advance iterator for node with id '2' for Kudu table 'impala::core.pm0_abdasubjct': Network error: recv error from unknown peer: Transport endpoint is not connected (error 107) 2023.03.16 2519
699 hive의 메타정보 테이블을 MariaDB로 사용하는 경우 table comment나 column comment에 한글 입력시 깨지는 경우 utf8로 바꾸는 방법. 2023.03.10 1357
698 [Hive canary]Hive에 Metastore canary red alert및 hive log파일에 Duplicate entry '123456' for key 'NOTIFICATION_LOG_EVENT_ID'가 발생시 조치사항 2023.03.10 990
697 호출 url현황 2023.02.21 176
696 ./gradlew :composeDown 및 ./gradlew :composeUp 를 성공했을때의 메세지 2023.02.20 146
695 [ftgo_application]Unable to infer base url오류 발생시 조치방법 2023.02.20 2012
694 [Impala TLS/SSL이슈]RangerAdminRESTClient.java:151] Failed to get response, Error is: TrustManager is not specified 2023.02.02 1069
693 [Kerberos]병렬 kinit 호출시 cache파일이 손상되어 Bad format in credentials cache 혹은 No credentials cache found 혹은 Internal credentials cache error 오류 발생시 2023.01.20 220
692 [HA구성 이슈]oozie 2대를 L4로 HA구성했을때 발생하는 이슈 2023.01.17 264
691 [Impala 3.2버젼]compute incremental stats db명.테이블명 수행시 ERROR: AnalysisException: Incremental stats size estimate exceeds 2000.00MB. 오류 발생원인및 조치방안 2022.11.30 1368
690 [oozie]oozie ssh action으로 패스워드 없이 다른 서버에 ssh로그인 하여 shellscript호출하는 설정하는 방법 2022.11.10 1564
689 kudu의 내부 table명 변경하는 방법 2022.11.10 1123
688 kerberos연동된 CDH 6.3.4에서 default realm값이 잘못된 상태에서 서비스 기동시 오류 2022.10.14 874
687 [impala]쿼리 수행중 발생하는 오류(due to memory pressure: the memory usage of this transaction, Failed to write to server) 2022.10.05 1084
686 [Kerberos인증] /var/log/krb5kdc.log파일 기준으로 인증요청(AS), 티켓확인(TGS)이 진행되는 로그 기록 2022.09.21 598
685 Oracle 12c DB의 LOB타입 컬럼이 있는 테이블을 import할 때 주의 할 사항 2022.09.14 1004
684 [kerberos]Kerberos HA구성 참고 페이지 2022.08.31 187
683 [CDP7.1.7]Impala Query의 Memory Spilled 양은 ScratchFileUsedBytes값을 누적해서 구할 수 있다. 2022.07.29 1095
위로