메뉴 건너뛰기

Bigdata, Semantic IoT, Hadoop, NoSQL

Bigdata, Hadoop ecosystem, Semantic IoT등의 프로젝트를 진행중에 습득한 내용을 정리하는 곳입니다.
필요한 분을 위해서 공개하고 있습니다. 문의사항은 gooper@gooper.com로 메일을 보내주세요.


HDFS파일을 삭제후 .Trash에 들어가고 1일후 flush out되었으나 여전히 HDFS 공간을 차지하고 있는 경우가 있는데 이는 해당 폴더의 상위 폴더에 snapshot이 정책이 설정되어 있고 snapshot파일이 아직 삭제되지 않았기 때문이다. 

Trash폴더의 데이터를 확인해보면(sudo -u hdfs hdfs dfs -ls /user/gooper/.Trash) 데이터 목록이 보이지 않는데 이는 Trash비움 시간이 지났기 때문에 지원진것이다. 

이때, sudo -u hdfs hdfs dfs -du /user/gooper/.Trash로 확인하면 용량이 그대로 확인되는 경우가 있는데 이는 상위폴더(예, /user)가 snapshot대상으로 설정되어 있으며 .Trash 폴더를 비우기전의 데이터가 snapshot되었고 snapshot파일이 삭제되지 않고 남아 있기 때문이다. (필요시 snapshot파일을 이용하여 이전 상태로 되돌려야 하는 경우를 대비하여 파일을 보관하고 있는것이다)

이때는 CM->Clusters->HDFS->File Browser에서 해당 폴더로 이동하여 우측 중간에 있는 Snapshots목록에서 삭제해주면 바로 HDFS공간이 확보되는것을 확인할 수 있다. 

번호 제목 글쓴이 날짜 조회 수
701 클러스터내의 전체 workflow및 coordinator현황을 사용자별로 추출하는 방법 총관리자 2021.11.25 25
700 kudu table와 impala(hive) table정보가 틀어져서 테이블을 읽지 못하는 경우(Error Loading Metadata) 조치방법 gooper 2023.11.10 25
699 magento2 샘플데이타 설치 총관리자 2017.01.31 26
698 [Solr in Cloudera]Solr Data Directory변경 방법/절차 gooper 2023.04.21 26
697 임시 테이블에서 데이터를 읽어서 partitioned table에 입력하는 impala SQL문 예시 gooper 2023.11.10 26
696 vuestorefrontui.io를 이용한 front end project 생성하기 총관리자 2022.02.06 27
695 [impala]insert into db명.table명 select a, b from db명.table명 쿼리 수행시 "Memory limit exceeded: Failed to allocate memory for Parquet page index"오류 조치 방법 gooper 2023.05.31 27
694 not leader of this config: current role FOLLOWER 오류 발생시 확인방법 총관리자 2022.01.17 29
693 oozie webui접근시 id/pw를 물어보는 Windows보안 팝업창이 뜰때 확인/조치방법 총관리자 2022.05.02 29
692 Error: IO_ERROR : java.io.IOException: Error while connecting Oozie server 총관리자 2022.05.02 29
691 [KTS Cluster의 Key Trustee Server]self-signed 인증서 발급및 설정 방법 gooper 2023.06.27 29
690 oracle 접속 방식에 따른 --connect 지정 방법 총관리자 2022.02.11 30
689 Could not authenticate, GSSException: No valid credentials provided (Mechanism level: Failed to find any kerberos tgt) 총관리자 2022.04.28 30
688 federated query 예제 총관리자 2017.01.19 31
687 [vi]블럭 및 문서내 복사등에 관련된 명령어 총관리자 2017.02.17 31
686 [CDP7.1.7]Impala Query의 Memory Spilled 양은 ScratchFileUsedBytes값을 누적해서 구할 수 있다. gooper 2022.07.29 32
685 [Kerberos]병렬 kinit 호출시 cache파일이 손상되어 Bad format in credentials cache 혹은 No credentials cache found 혹은 Internal credentials cache error 오류 발생시 gooper 2023.01.20 32
684 Oracle RAC 구성된 DB서버에 대한 컴포넌트별 설정 방법 총관리자 2022.02.12 33
683 [Cloudera 6.3.4, Kudu]]Service Monitor에서 사용하는 metric중에 일부를 blacklist로 설정하여 모니터링 정보 수집 제외하는 방법 gooper 2022.07.08 33
682 Cloudera Hadoop and Spark Developer Certification 준비(참고) 총관리자 2018.05.16 34

A personal place to organize information learned during the development of such Hadoop, Hive, Hbase, Semantic IoT, etc.
We are open to the required minutes. Please send inquiries to gooper@gooper.com.

위로