Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.
#!/bin/bash
kinit -k -t /var/lib/keytab/hadoop.keytab hadoop@GOOPER.COM
usage="Usage: del_diff.sh [days] [delete target path]"
if [[ $# != 2 ]]
then
echo $usage
exit 1
fi
path=${2}
echo "delete target path : " $path
now=$(date +%s)
echo "old file date point : " $now
hdfs dfs -ls $path | while read f; do
dir_date=`echo $f | awk '{print $6}'`
#180일
difference=$(( ( $now - $(date -d "$dir_date" +%s) ) / (24 * 60 * 60) ))
if [ $difference -gt $1 ]; then
if [[ `echo $f | awk '[ print $8 }'` == *$path* ]]; then
hdfs dfs -rm `echo $f| awk '{ print $8 }'`;
else
echo 'else - target path is [' `echo $f| awk '{ print $8 }'` '] not contain this path [' $path ']'
fi
fi
done
댓글 0
번호 | 제목 | 날짜 | 조회 수 |
---|---|---|---|
» | 기준일자 이전의 hdfs 데이타를 지우는 shellscript 샘플 | 2019.06.14 | 593 |
9 | A Cluster의 HDFS 디렉토리및 파일을 사용자및 권한 유지 하여 다운 받아서 B Cluster에 넣기 | 2020.05.06 | 604 |
8 | W/F수행후 Logs not available for 1. Aggregation may not to complete. 표시되며 로그내용이 보이지 않은 경우 | 2020.05.08 | 2217 |
7 | missing block및 관련 파일명 찾는 명령어 | 2021.02.20 | 328 |
6 | [Kudu] tablet server 혹은 kudu master가 어떤 원인에 의해서 replica가 failed상태인 경우 복구하는 방법 | 2021.05.24 | 473 |
5 | drop table로 삭제했으나 tablet server에는 여전히 존재하는 테이블 삭제방법 | 2021.07.09 | 7943 |
4 | tablet별 disk사용량 확인하는 방법 | 2021.08.27 | 455 |
3 | hadoop nfs gateway설정 (Cloudera 6.3.4, CentOS 7.4 환경에서) | 2022.01.07 | 404 |
2 | kudu의 내부 table명 변경하는 방법 | 2022.11.10 | 656 |
1 | [Hadoop Encryption] Encryption Zone에 생성된 table에 Hue에서 insert 수행시 User:hdfs not allowed to do 'DECRYPT_EEK' ON 'testkey' 오류 | 2023.11.01 | 121 |