메뉴 건너뛰기

Cloudera, BigData, Semantic IoT, Hadoop, NoSQL

Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.


일반적으로 Replication]Encryption Zone내 HDFS파일을 비Encryption Zone으로 혹은 비Encryption Zone에서 비Encryption Zone으로 HDFS Replication 수행시 User hdfs를 사용하게 된다.

그래야 권한등을 보존하여 Replication을 수행할 수 있다.

(참고적으로 Hive External Table Replication은 User hdfs로 수행해도 정상 수행되며 HDFS Replication만 문제가 발생한다)

하지만 Replication]Encryption Zone내 HDFS파일을 비Encryption Zone으로 HDFS Replication을 수행시 User hdfs가 Ranger KMS with Key Trustee Server의 Hadoop KMS Blacklist Decrypt EEK(hadoop.kms.blacklist.DECRYPT_EEK)항목에 등록되어 있어 Replication과정에서 User:hdfs not allowed to do "DECRYPT_EEK' on 'enc_key'라는 오류가 발생하면서 실패한다. 

Hadoop KMS Blacklist Decrypt EEK(hadoop.kms.blacklist.DECRYPT_EEK)에서 hdfs를 지우면 되겠지만 이는 보안에 취약하게 만들 수 있다. 

그래서 User hdfs대신 hadoop으로 동일한 작업을 수행할 수 있으나 Replication Policy에서 다음과 같이 설정해줘야 한다. 

(다른 설정은 일반적인 설정과 같음)


General -> Run As Username : hadoop

General -> Run on Peer as Username : 빈칸

Advanced -> Error Handling -> Skip Checksum Checks : uncheck

Advanced -> Error Handling -> Skip Listing Checksum Checks : uncheck


와 같이 설정하고 HDFS Replication을 다시 수행하면 정상적으로 수행된다. 

다만, 권한을 유지 하지 못하고 User등이 hadoop으로 변경되어 checksum을 보장할 수 없다는 단정이 있다. 


번호 제목 날짜 조회 수
21 [CDP7.1.7]Oozie job에서 ERROR: Kudu error(s) reported, first error: Timed out: Failed to write batch of 774 ops to tablet 8003f9a064bf4be5890a178439b2ba91가 발생하면서 쿼리가 실패하는 경우 2024.01.05 118
20 Cloudera Manager 5.x설치시 embedded postgresql를 사용하는 경우의 관리정보 2018.04.13 118
19 eclipse 3.1 단축키 정리파일 2017.01.02 117
18 [CDP7.1.7, Hive Replication]Hive Replication진행중 "The following columns have types incompatible with the existing columns in their respective positions " 오류 2023.12.27 113
17 호출 url현황 2023.02.21 112
16 주문 생성 데이터 예시 2022.04.30 112
» [CDP7.1.7, Replication]Encryption Zone내 HDFS파일을 비Encryption Zone으로 HDFS Replication시 User hdfs가 아닌 hadoop으로 수행하는 방법 2024.01.15 110
14 [CDP7.1.6,HDFS]HDFS파일을 삭제하고 Trash비움이 완료된후에도 HDFS 공간을 차지하고 있는 경우 확인/조치 방법 2023.07.17 107
13 oozie의 sqoop action수행시 ooize:launcher의 applicationId를 이용하여 oozie:action의 applicationId및 관련 로그를 찾는 방법 2023.07.26 103
12 [Cloudera Agent] Metadata-Plugin throttling_logger INFO (713 skipped) Unable to send data to nav server. Will try again. 2022.05.16 103
11 [Hue metadata]Oracle에 있는 Hue 메타정보 테이블을 이용하여 coordinator와 workflow관계 목록을 추출하는 방법 2023.08.22 99
10 주문히스토리 조회 2022.04.30 99
9 restaurant-controller,에서 등록 예시 2022.04.30 99
8 [Impala] alter table구문수행시 "WARNINGS: Impala does not have READ_WRITE access to path 'hdfs://nameservice1/DATA/Temp/DB/source/table01_ccd'" 발생시 조치 2024.04.26 98
7 CM의 Impala->Query tab에서 FINISHED query가 보이지 않는 현상 2021.08.31 98
6 [vi] test.nq파일에서 특정문자열(예, <>)을 찾아서 포함되는 라인을 삭제한 동일한 이름의 파일을 만드는 방법 2017.01.25 98
5 [EncryptionZone]User:testuser not allowed to do "DECRYPT_EEK" on 'testkey' 2023.06.29 89
4 ./gradlew :composeDown 및 ./gradlew :composeUp 를 성공했을때의 메세지 2023.02.20 84
3 [Encryption Zone]Encryption Zone에 생성된 table을 select할때 HDFS /tmp/zone1에 대한 권한이 없는 경우 2023.06.29 83
2 [vue storefrontui]외부 API통합하기 참고 문서 2022.02.09 80
위로