Bigdata, Hadoop ecosystem, Semantic IoT등의 프로젝트를 진행중에 습득한 내용을 정리하는 곳입니다.
필요한 분을 위해서 공개하고 있습니다.
문의사항은 gooper@gooper.com로 메일을
보내주세요.
hive query에서 insert overwrite directory '${OUTPUT}'형태로 저장하면
컬럼 구분자는 default가 ' x01'가 자동으로 삽입된다.
하지만 local로 저장하는 경우는 delimiter를 아래와 같이 지정할 수 있음
-------------------------------------아래-------------------------------------------
insert overwrite local directory '${OUTPUT}'
row format delimited fields terminated by 't'
select * from aaa;
-------------------추가--------------------
위의 경우는 MapR의 경우이며 apache배포본에는 't'로 저장됨
-------------------확인하는 방법-----------
excel에서 해당 파일을 읽어들여 컬럼분리자가 무엇으로 표시되는지 확인하면.. 정확히 알 수 있다..
댓글 0
번호 | 제목 | 글쓴이 | 날짜 | 조회 수 |
---|---|---|---|---|
681 | dual table만들기 | 총관리자 | 2014.05.16 | 853 |
680 | 특정파일이 생성되어야 action이 실행되는 oozie job만들기(coordinator.xml) | 총관리자 | 2014.05.20 | 990 |
679 | source의 type을 spooldir로 하는 경우 해당 경로에 파일이 들어오면 파일단위로 전송함 | 총관리자 | 2014.05.20 | 689 |
» | hive에서 insert overwrite directory.. 로 하면 default column구분자는 'SOH'혹은 't'가 됨 | 총관리자 | 2014.05.20 | 1004 |
677 | import 혹은 export할때 hive파일의 default 구분자는 --input-fields-terminated-by " |