Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.

hive Hive 사용법 및 쿼리 샘플코드

구퍼 2013.03.07 17:23 조회 수 : 5441

Hive 사용법 및 쿼리 샘플코드

hive 에서 사용하는 query 정리

지금까지 주로사용하는 것 위주로 정리했으며 지속적으로 업데이트 될 수 있음.

hive 환경구축 안되있는 경우는~

Hive (하이브) 설치 및 환경구축하기

Hive 실행

$ $HIVE_HOME/bin/hive

Hive 종료

hive> exit;

테이블 확인

show tables;

bigmark.csv 파일의 데이터를 저장하는 테이블 "bigmark"을 정의하기

테이블 생성

hive> CREATE TABLE bigmark (id int, mark STRING)

> ROW FORMAT DELIMITED FIELDS TERMINATED BY ','

> LINES TERMINATED BY 'n';

테이블에 파일삽입

hive> LOAD DATA LOCAL INPATH '/home/bigmark/localfiles/bigmark.csv'

> OVERWRITE INTO TABLE bigmark;

파티션 사용하기

테이블 생성

hive> CREATE TABLE big (id INT, bb STRING, ii STRING, gg STRING)

> PARTITIONED BY (ver timestamp)

> ROW FORMAT DELIMITED FIELDS TERMINATED BY ','

> LINES TERMINATED BY ' n';

테이블에 파일삽입

hive> LOAD DATA LOCAL INPATH '/home/bigmark/localfiles/bigmark.csv'

> OVERWRITE INTO TABLE big PARTITION (ver = '2013-01-28 ');

테이블 검색

테이블 구조 확인

hive> DESCRIBE bigmark;

테이블 내용 확인

hive> SELECT * FROM bigmark;

LIKE 식에 의한 검색

hive> SELECT id, mark FROM bigmark

> WHERE mark LIKE '빅마크';

LIKE 식에 의한 검색(파티션이 있을 경우)

hive> SELECT bb, ii, gg FROM big

> WHERE ver='2013-01-28' and gg LIKE '빅%';

LIKE 대신 REGEXP도 가능

이 게시물을

이 글의 추천인 목록 수정 삭제 목록

번호	제목	날짜	조회 수
730	jupyter, zeppelin, rstudio를 이용하여 spark cluster에 job를 실행시키기 위한 정보	2018.04.13	7701
729	하둡 분산 파일 시스템을 기반으로 색인하고 검색하기	2013.03.15	7635
728	[gson]mongodb의 api를 이용하여 데이타를 가져올때 "com.google.gson.stream.MalformedJsonException: Unterminated object at line..." 오류발생시 조치사항	2017.12.11	7580
727	LUBM 데이타 생성구문	2017.07.24	7513
726	oracle to hive data type정리표	2018.08.22	7375
725	spark-sql실행시 Caused by: java.lang.NumberFormatException: For input string: "0s" 오류발생시 조치사항	2016.06.09	7108
724	[Kerberos]Kerberos상태의 클러스터에 JDBC로 접근할때 케이스별 오류내용	2020.02.14	7062
723	Caused by: java.sql.SQLNonTransientConnectionException: Could not read resultset: unexpected end of stream, read 0 bytes from 4 오류시 확인/조치할 내용	2016.10.31	6936
722	sqoop작업시 hdfs의 개수보다 더많은 값이 중복되어 oracle에 입력되는 경우가 있음	2014.09.02	6935
721	import 혹은 export할때 hive파일의 default 구분자는 --input-fields-terminated-by "x01"와 같이 지정해야함	2014.05.20	6701
720	Last transaction was partial에 따른 Unable to load database on disk오류 발생시 조치사항	2018.08.03	6652
719	hadoop 2.6.0 기동(에코시스템 포함)및 wordcount 어플리케이션을 이용한 테스트	2015.05.05	6533
718	다수의 로그 에이전트로 부터 로그를 받아 각각의 파일로 저장하는 방법(interceptor및 multiplexing)	2014.04.04	6439
717	hadoop및 ecosystem에서 사용되는 명령문 정리	2014.05.28	6435
716	원보드pc인 bananapi를 이용하여 hadoop 클러스터 구성하기(준비물)	2014.05.29	6431
715	[impala]insert into db명.table명 select a, b from db명.table명 쿼리 수행시 "Memory limit exceeded: Failed to allocate memory for Parquet page index"오류 조치 방법	2023.05.31	6326
714	특정파일이 생성되어야 action이 실행되는 oozie job만들기(coordinator.xml)	2014.05.20	6260
713	protege 설명및 사용법	2017.04.04	6122
712	checking for termcap functions library... configure: error: No curses/termcap library found	2013.03.08	6097
711	Hadoop Cluster 설치 (Hadoop+Zookeeper+Hbase)	2013.03.07	6097

쓰기 태그

첫 페이지 1 2 3 4 5 6 7 8 9 10 끝 페이지

Cloudera, BigData, Semantic IoT, Hadoop, NoSQL

Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.

hive Hive 사용법 및 쿼리 샘플코드

댓글 0

Cloudera, BigData, Semantic IoT, Hadoop, NoSQL

Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.

hive Hive 사용법 및 쿼리 샘플코드

댓글 0

LOGIN