Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.
Hue의 메타정보를 담고 있는 여러 테이블 중에서 desktop_document테이블과 desktop_document2은 다음과 같은 관계를 가지고 있다.
일단 coordinator와 workflow를 기준을 보면 처음에 생성될때 두 테이블에 모두 데이터가 들어가며 desktop_document.object_id에 desktop_document2.id값이 들어가 있다.
변경/수정/삭제들이 발생할때 desktop_document2테이블의 is_history와 is_trashed값이 0 혹은 1로 변경되며 히스토리성 정보가 기록된다.
desktop_document.object_id는 항상 desktop_document2의 마지막 id를 가지고 있어 최근의 정보를 가지고 있게 된다.
1. copy하면 is_history가 1이되며 새로운 id가 생성되어 삽입된다.
2. delete하며 is_trashed가 1이된다.
3. workflow를 export했다가 delete하고 그대로 import하면 is_trashed가 0이되면서 이전 상태로 그대로 복원된다.
(hue에서 export하면 전체 workflow가 모두 export되며 복구가 필요한 workflow만 찾아서 [{}, {}]형태로 따로 json만들어서 복구해야 한다.)
댓글 0
번호 | 제목 | 날짜 | 조회 수 |
---|---|---|---|
681 | dual table만들기 | 2014.05.16 | 1111 |
680 | 특정파일이 생성되어야 action이 실행되는 oozie job만들기(coordinator.xml) | 2014.05.20 | 1081 |
679 | source의 type을 spooldir로 하는 경우 해당 경로에 파일이 들어오면 파일단위로 전송함 | 2014.05.20 | 829 |
678 | hive에서 insert overwrite directory.. 로 하면 default column구분자는 'SOH'혹은 't'가 됨 | 2014.05.20 | 1126 |
677 | import 혹은 export할때 hive파일의 default 구분자는 --input-fields-terminated-by " |