메뉴 건너뛰기

Cloudera, BigData, Semantic IoT, Hadoop, NoSQL

Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.


MariaDB의 study db에 접속하여 product 테이블의 내용을 가져다가 hive의 test db밑에 product라는 hive테이블로 자동생성하는 sqoop 명령문이다.
이때 MariaDB에서 가져온 내용에 저장되는 HDFS 위치는 hive에서 생성한 test db밑에 저장된다.
hive table을 자동으로 생성하는 경우는 --lines-terminated-by를 사용할 수 없는데... sqoop에서는 지정가능하지만 hive에서 '\n'만 지원하기 때문에 오류가 발생한다.
그리고 console등을 이용하여 자동생성하는 경우 hue에서 필요로 하는 정보가 등록되지 않아서 인지 데이타는 볼수 있으나 column명 및 속성은 조회되지 않는다. 
물론 describe를 이용하여 볼수는 있다.
sqoop에서 바로 hive table을 생성하면 컬럼에 newline(\n)이 들어 있어도 문제없이 데이타를 가져올 수 있다.

sqoop import \
--connect=jdbc:mysql://gsda3:포트/study \
--username=사용자id\
--password=패스워드\
--table=product \
--hive-table test.product  \
--create-hive-table  \
--hive-import  \
--hive-home test.db
번호 제목 날짜 조회 수
561 [DBeaver 4.3.0]import/export시 "Client home is not specified for connection" 오류발생시 조치사항 2017.12.21 883
560 [Impala 3.2버젼]compute incremental stats db명.테이블명 수행시 ERROR: AnalysisException: Incremental stats size estimate exceeds 2000.00MB. 오류 발생원인및 조치방안 2022.11.30 879
559 hive metastore ERD file 2018.09.20 875
558 os가 windows7인 host pc에서 ubuntu가 os인 guest pc에 접근하기 위한 네트워크설정 2014.04.20 871
557 python test.py실행시 "ImportError: No module named pyspark" 혹은 "ImportError: No module named py4j.protocol"등의 오류 발생시 조치사항 2017.07.04 869
556 Cloudera Manager web UI의 언어를 한글에서 영문으로 변경하기 2018.04.03 860
555 spark-env.sh에서 사용할 수있는 항목. 2016.05.24 859
554 beeline실행시 User: root is not allowed to impersonate오류 발생시 조치사항 2016.06.03 852
553 "File /user/hadoop/share/lib does not exist" 오류 해결방법 2015.06.07 843
552 [springframework]Caused by: org.mariadb.jdbc.internal.util.dao.QueryException: Could not read resultset: unexpected end of stream, read 0 bytes from 4 오류 발생시 조치사항 2017.01.23 842
551 secureCRT에서 backspace키가 작동하지 않는 경우 해결방법 2015.05.11 840
550 우분투에서 패키지 설치시 E: Sub-process /usr/bin/dpkg returned an error code 발생시 조치 2017.05.02 829
549 source의 type을 spooldir로 하는 경우 해당 경로에 파일이 들어오면 파일단위로 전송함 2014.05.20 829
548 Nodes of the cluster (unhealthy)중 1/1 log-dirs are bad: 오류 해결방법 2015.05.17 828
547 AIX 7.1에 Python 2.7.11설치하기 2016.10.06 825
546 oozie가 말하는 start시간은..서버에서 확인되는 시간이 아닙니다. 2014.05.14 822
» sqoop으로 mariadb에 접근해서 hive 테이블로 자동으로 생성하기 2018.08.03 818
544 Ubuntu 16.04 LTS에 4대에 Hadoop 2.8.0설치 2017.05.01 818
543 update를 많이 하면 heap memory가 많이 소진되고 최종적으로 OOM가 발생하는데 이에 대한 설명 2017.04.10 817
542 mysql 5.5.34-0ubuntu0.13.04용 설치/진행 화면 2014.09.10 817
위로