메뉴 건너뛰기

Cloudera, BigData, Semantic IoT, Hadoop, NoSQL

Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.


sqoop sqoop 1.4.4 설치및 테스트

총관리자 2014.04.21 17:57 조회 수 : 3247

1. Sqoop를 다운받아 압축을 푼다

   *다운로드 받을 라이브러리가 사용하려는 하둡의 메이저 버전과 대응 되는지 확인 필요
   wget http://mirror.apache-kr.org/sqoop/1.4.4/sqoop-1.4.4.bin__hadoop-1.0.0.tar.gz

 

   * hadoop2의 경우는 sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz를 받아서 사용할것..


   tar zxvf sqoop-1.4.4.bin__hadoop-1.0.0.tar.gz

   ln -s sqoop-1.4.4.bin__hadoop-1.0.0. sqoop

 

2. Sqoop환경변수 설정

   vi  ~/.bashrc
   export SQOOP_HOME=/home/hadoop/sqoop
   export SQOOP_CONF_DIR=/home/hadoop/sqoop/conf


   export PATH=$PATH:$SQOOP_HOME/bin
   

   변경사항 반영
   source .bashrc

 

2-1. sqoop lib디렉토리 설정

   hadoop의 share디렉토리 밑에 있는 lib파일및 폴더를 모두 sqoop의 lib디렉토리 밑으로 복사한다.

 

3. Sqoop 환경설정

 

   cd $SQOOP_HOME/conf
   cp sqoop-env-template.sh sqoop-env.sh
   vi sqoop-env.sh

------------------------------------------------------------
# Set Hadoop-specific environment variables here.

#Set path to where bin/hadoop is available
export HADOOP_COMMON_HOME=/home/hadoop/hadoop

#Set path to where hadoop-*-core.jar is available
export HADOOP_MAPRED_HOME=/home/hadoop/hadoop/lib

#set the path to where bin/hbase is available
export HBASE_HOME=/home/hadoop/hbase

#Set the path to where bin/hive is available
export HIVE_HOME=/home/hadoop/hive

#Set the path for where zookeper config dir is
export ZOOCFGDIR=/home/hadoop/zookeeper/conf
----------------------------------------------------------

 

sqoop기동 확인

hadoop@bigdata-host:~/sqoop/conf$ sqoop
Warning: /usr/lib/hcatalog does not exist! HCatalog jobs will fail.
Please set $HCAT_HOME to the root of your HCatalog installation.
/home/hadoop/sqoop/bin/sqoop: line 101: /home/hadoop/hadoop/bin/bin/hadoop: No such file or directory

이 발생하게 되면 sqoop설치 디렉토리에 있는 sqoop-1.4.4.jar를 hadoop/lib에 복사한다.

 

4. 테스트(mysql)
 
   1) mysql jdbc 드라이버 설치
      http://dev.mysql.com/downloads/connector/j/


      tar zxvf mysql-connector-java-5.1.26.tar.gz
      cp mysql-connector-java-5.1.26/mysql-connector-java-5.1.26-bin.jar $SQOOP_HOME/lib
 
      * mysql에 bigdata계정 설정 및 sqoop테스트용 database생성 및 할당
      mysql -u root (암호 걸려있을 경우 -p)
      (암호 있을경우 입력)
      CREATE USER 'bigdata'@'localhost';
      create database sqoop_test;
      GRANT ALL PRIVILEGES ON sqoop_test.* TO 'bigdata'@'localhost';

   2) sqoop테스트용 테이블 생성 및 example데이터 입력
      mysql -u bigdata
      use sqoop_test;
      create table employee(id INT, name VARCHAR(20));       --import 테스트
      INSERT INTO employee(id,name) VALUES(1, "kim");
      INSERT INTO employee(id,name) VALUES(2, "lee");
      INSERT INTO employee(id,name) VALUES(3, "park");
      create table employee_ex(id INT, name VARCHAR(20));  --export 테스트

   3) hadoop 기동
      start-all.sh

   4) import 테스트(mysql에서 hdoop으로 저장)
      sqoop import --connect jdbc:mysql://localhost/sqoop_test --table employee --username bigdata -m 1

 

      =====>hadoop에서 확인<============

hadoop@bigdata-host:~/sqoop$ hadoop fs -lsr employee
-rw-r--r--   1 hadoop supergroup          0 2014-04-21 17:34 /user/hadoop/employee/_SUCCESS
drwxr-xr-x   - hadoop supergroup          0 2014-04-21 17:34 /user/hadoop/employee/_logs
drwxr-xr-x   - hadoop supergroup          0 2014-04-21 17:34 /user/hadoop/employee/_logs/history
-rw-r--r--   1 hadoop supergroup       9165 2014-04-21 17:34 /user/hadoop/employee/_logs/history/job_201404211042_0001_1398069253093_hadoop_employee.jar
-rw-r--r--   1 hadoop supergroup      59274 2014-04-21 17:34 /user/hadoop/employee/_logs/history/job_201404211042_0001_conf.xml
-rw-r--r--   1 hadoop supergroup         19 2014-04-21 17:34 /user/hadoop/employee/part-m-00000
hadoop@bigdata-host:~/sqoop$ hadoop fs -cat employee/part-m-00000
1,kim
2,lee
3,park
------------------------------------------

   5) export 테스트(hadoop에서 mysql의 테이블에 저장)
      sqoop export -connect jdbc:mysql://localhost/sqoop_test -table employee_ex -export-dir employee --username bigdata -m 1

 

5. postgresql

가. cp postgresql-9.3-1103.jdbc4.jar $SQOOP_HOME/lib

나.[hadoop@master]$ sqoop list-databases --connect jdbc:postgresql://node1:5432/hive_db --username hive_user --password hive_pass

Warning: /hadoop/sqoop/../hcatalog does not exist! HCatalog jobs will fail.

Please set $HCAT_HOME to the root of your HCatalog installation.

Warning: /hadoop/sqoop/../accumulo does not exist! Accumulo imports will fail.

Please set $ACCUMULO_HOME to the root of your Accumulo installation.

15/05/21 13:42:36 INFO sqoop.Sqoop: Running Sqoop version: 1.4.6

15/05/21 13:42:36 WARN tool.BaseSqoopTool: Setting your password on the command-line is insecure. Consider using -P instead.

15/05/21 13:42:36 INFO manager.SqlManager: Using default fetchSize of 1000

template1

template0

postgres

psmgdb

hive_db

 

oozie_db

 

번호 제목 날짜 조회 수
19 down된 broker로 메세지를 전송하려는 경우의 오류 내용및 조치사항 2016.08.12 411
18 kafkaWordCount.scala의 producer와 consumer 클래스를 이용하여 kafka를 이용한 word count 테스트 하기 2016.08.02 588
17 avro 사용하기(avsc 스키마 파일 컴파일 방법, consumer, producer샘플소스) 2016.07.08 1755
16 kafka broker기동시 brokerId가 달라서 기동에 실패하는 경우 조치방법 2016.05.02 2490
15 kafka 0.9.0.1 for scala 2.1.1 설치및 테스트 2016.05.02 1097
14 Exception in thread "main" java.lang.NoSuchMethodError: org.apache.hadoop.http.HttpConfig.getSchemePrefix()Ljava/lang/String; 해결->실패 2015.06.14 524
13 hadoop 2.6.0에 sqoop2 (1.99.5) server및 client설치 == fail 2015.06.11 2043
12 flume 1.5.2 설치및 테스트(source : file, sink : hdfs) in HA 2015.05.21 1863
11 kafka의 re-balance를 이용하여 consumer를 multi thread로 돌려서 topic의 partitions을 활용 2015.03.31 1508
10 sqoop작업시 hdfs의 개수보다 더많은 값이 중복되어 oracle에 입력되는 경우가 있음 2014.09.02 4295
9 java.util.NoSuchElementException발생시 조치 2014.08.27 1473
8 oozie 에서 sqoop action실행 에러 - 컬럼개수 차이 2014.07.17 1168
7 import 혹은 export할때 hive파일의 default 구분자는 --input-fields-terminated-by "x01"와 같이 지정해야함 2014.05.20 4595
6 source의 type을 spooldir로 하는 경우 해당 경로에 파일이 들어오면 파일단위로 전송함 2014.05.20 1272
5 sqoop에서 oracle관련 작업할때 테이블명, 사용자명, DB명은 모두 대문자로 사용할것 2014.05.15 1668
4 sqoop export/import등을 할때 driver를 못찾는 오류가 발생하면... 2014.05.15 1269
» sqoop 1.4.4 설치및 테스트 2014.04.21 3247
2 다수의 로그 에이전트로 부터 로그를 받아 각각의 파일로 저장하는 방법(interceptor및 multiplexing) 2014.04.04 4225
1 동일서버에서 LA와 LC동시에 기동하여 테스트 2014.04.01 1299
위로