메뉴 건너뛰기

Cloudera, BigData, Semantic IoT, Hadoop, NoSQL

Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.


1. 데이터 준비(vi json.dat)

{"country":"US","page":227,"data":{"impressions":{"s":10,"o":10}}}}

{"country":"US2","page":228,"data":{"impressions":{"s":11,"o":13}}}}


2. HDFS에 로딩

hdfs dfs -put ./json.dat /tmp/json.dat 


3. table 생성

create table hive_parsing_json_table(json string);


4. data를 테이블에 입력

load data inpath '/tmp/json.dat' into table hive_parsing_json_table;


5. select v1.Country, v2.Page, v4.impressions_s, v4.impressions_o

from hive_parsing_json_table hpjp

lateral view json_tuple(hpjp.json, 'country', 'page', 'data') v1 as Country, Page, data

lateral view json_tuple(v1.data, 'ad') v2 ad Ad

lateral view json_tuple(v2.Ad, 'impressions') v3 as Impressions

lateral view json_tuple(v3.Impressions, 's', 'o') v4 as impressions_s, impressions_o;


6. 결과

v1.country v1.page v4.impressions_s v4.impressions_o

US           227      10                   10

US2          228      11                  13

번호 제목 날짜 조회 수
47 [CDP7.1.7, Hive Replication]Hive Replication진행중 "The following columns have types incompatible with the existing columns in their respective positions " 오류 2023.12.27 186
46 hive의 메타정보 테이블을 MariaDB로 사용하는 경우 table comment나 column comment에 한글 입력시 깨지는 경우 utf8로 바꾸는 방법. 2023.03.10 1359
45 [hive] hive.tbls테이블의 owner컬럼값은 hadoop.security.auth_to_local에 의해서 filtering된다. 2022.04.14 640
44 hive metastore db중 TBLS, TABLE_PARAMS테이블 설명 2021.10.22 1020
43 impala session type별 표시되는 정보로 구분하는 방법 2021.05.25 899
42 Hive JDBC Connection과 유형별 에러및 필요한 jar파일 2021.05.24 1016
41 hive metadata(hive, impala, kudu 정보가 있음) 테이블에서 db, table, owner, location를 조회하는 쿼리 2020.02.07 1068
40 hive테이블의 물리적인 위치인 HDFS에 여러개의 데이터 파일이 존재할때 한개의 파일로 merge하여 동일한 테이블에 입력하는 방법 2019.05.23 1300
» json으로 존재하는 데이터 parsing하기 2019.03.25 1657
38 [sentry]role부여후 테이블명이 변경되어 오류가 발생할때 조치방법 2018.10.16 998
37 hive metastore ERD file 2018.09.20 960
36 oracle to hive data type정리표 2018.08.22 5114
35 upsert구현방법(년-월-일 파티션을 기준으로) 및 테스트 script file 2018.07.03 2091
34 beeline으로 접근시 "User: gooper is not allowed to impersonate anonymous (state=08S01,code=0)"가 발생하면서 "No current connection"이 발생하는 경우 조치 2018.04.15 883
33 Hive MetaStore Server기동시 Could not create "increment"/"table" value-generation container SEQUENCE_TABLE since autoCreate flags do not allow it. 오류발생시 조치사항 2017.05.03 680
32 Ubuntu 16.04 LTS에 Hive 2.1.1설치하면서 "Version information not found in metastore"발생하는 오류원인및 조치사항 2017.05.03 658
31 AIX 7.1에서 hive실행시 "hive: line 86: readlink: command not found" 오류가 발생시 임시 조치사항 2016.09.25 964
30 hive기동시 Caused by: java.net.URISyntaxException: Relative path in absolute URI: ${system:java.io.tmpdir%7D/$%7Bsystem:user.name%7D 오류 발생시 조치사항 2016.09.25 1043
29 schema설정없이 hive를 최초에 실행했을때 발생하는 오류메세지및 처리방법 2016.09.25 1364
28 beeline실행시 User: root is not allowed to impersonate오류 발생시 조치사항 2016.06.03 922
위로