메뉴 건너뛰기

Cloudera, BigData, Semantic IoT, Hadoop, NoSQL

Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.


hive테이블의 물리적인 위치인 HDFS에 여러개의 데이터 파일이 존재할때 한개의 파일로 만들어서 다시 동일한 테이블에 입력하는 hive쿼리는 다음과 같다.

(1번, 2번 모두 가능함)


1. 

set mapreduce.job.running.map.limit=1;

set mapreduce.job.running.reduce.limit=1;

insert overwrite table temp.tb_test select * from temp.tb_test;


2. 

insert overwrite table temp.tb_test select * from temp.tb_test;


를 실행하면 hive에서 실행하면 목적지 테이블에 데이터를 입력할 때 select된 데이터에 한해서 자동으로 merge해서 입력한다.


1번 쿼리를 impala에서 실행하면 set구문이 인식이 안되어 오류가 발생하며 set구문없이  2번 쿼리를 실행하면 파일 개수에는 변함이 잆이 동일한 개수의 파일로  데이터가 overwrite된다.


번호 제목 날짜 조회 수
581 HBase 설정 최적화하기(VCNC) file 2017.07.18 248
580 딥러닝 수학/알고리즘 '한국어' 강의 2016.04.10 250
579 문자열을 숫자(integer)로 casting하기 2016.01.13 252
578 Error: IO_ERROR : java.io.IOException: Error while connecting Oozie server 2022.05.02 256
577 [jsoup]Jsoup Tutorial 2017.04.11 257
576 [메모리 덤프파일 분석] 2017.03.31 262
575 Spark Streaming으로 유실 없는 스트림 처리 인프라 구축하기 2016.03.11 263
574 format된 namenode를 다른 서버에서 다시 format했을때 오류내용 2016.09.22 263
573 hive의 메타정보 테이블을 MariaDB로 사용하는 경우 table comment나 column comment에 한글 입력시 깨지는 경우 utf8로 바꾸는 방법. 2023.03.10 263
572 DBCP Datasource(org.apache.commons.dbcp.BasicDataSource) 설정 및 속성 설명 2016.09.26 264
571 elasticsearch 1.3.0에서 rdf및 hadoop plugin설치 2016.04.06 266
570 shard3가 있는 서버에 문제가 있는 상태에서 solr query를 요청하는 경우 "no servers hosting shard: shard3" 오류가 발생하는 경우 조치사항 2018.01.04 272
569 S2RDF를 이용한 다른 버젼의 github링크 2016.12.02 274
568 RDF4J의 rdf4j-server.war가 제공하는 RESTFul API를 이용한 CRUD테스트(트랜잭션처리) 2017.08.30 274
567 kafkaWordCount.scala의 producer와 consumer 클래스를 이용하여 kafka를 이용한 word count 테스트 하기 2016.08.02 275
566 spark 2.0.0의 api를 이용하는 예제 프로그램 2017.03.15 275
565 RDF storage조합에대한 test결과(4store, Jena+HBase, Hive+HBase, CumulusRDF, Couchbase) 페이지 링크 2016.05.26 276
564 oozie WF에서 참고할만한 내용 2019.07.18 276
563 HDFS Balancer설정및 수행 2018.03.21 277
562 [impala]쿼리 수행중 발생하는 오류(due to memory pressure: the memory usage of this transaction, Failed to write to server) 2022.10.05 277
위로