메뉴 건너뛰기

Bigdata, Semantic IoT, Hadoop, NoSQL

Bigdata, Hadoop ecosystem, Semantic IoT등의 프로젝트를 진행중에 습득한 내용을 정리하는 곳입니다.
필요한 분을 위해서 공개하고 있습니다. 문의사항은 gooper@gooper.com로 메일을 보내주세요.


1. YARN application로그는 container가 수행된 노드의 로컬 파일 경로(yarn.nodemanager.log-dirs, /var/log/hadoop-yarn/containers) 저장된다. 

2. CM->YARN->Applications->application list의 우측에 Application Details를 클릭시 "Failed to read the application application_123456789012_123456" 발생시 아래와 같은 방법으로 log파일을 직접 조회해서 볼 수 있다. 

(yarn.resourcemanager.max-completed-applications(default 10k)와 yarn.resourcemanager.state-store.max-completed-applications값을 동시에 설정하여 조절 가능하나 너무 큰 값을 설정하면 RM recovery performance 부하가 발생함, 권장값은 30k이내임)

3. 또한 yarn.log-aggregation-enable(Enalbe Log Aggregation)이 enable상태라면 로컬 파일들(stderr, stdout등)을 1개의 파일로 묶어서 HDFS(yarn.nodemanager.remote-app-log-dir/계정명/yarn.nodemanager.remote-app-log-dir-suffix,  /tmp/logs/계정/logs)에 저장(yarn.log-aggregation_retain-seconds, default : 7 days(s))하고 로컬 파일을 지우므로 HDFS의 /tmp/logs/계정/logs/application_id에 가서 직접 application수행 로그 파일을 조회할 수 도 있다.


번호 제목 글쓴이 날짜 조회 수
121 [HDFS]Encryption Zone에 생성된 테이블 조회시 Failed to open HDFS file hdfs://nameservice1/tmp/zone1/sec_test_file.txt Error(255): Unknown error 255 Root cause: AuthorizationException: User:impala not allowd to do 'DECRYPT_EEK' on 'testkey' gooper 2023.06.29 53
120 RDF4J의 rdf4j-server.war가 제공하는 RESTFul API를 이용하여 repository에 CRUD테스트 총관리자 2017.08.30 52
119 hadoop에서 yarn jar ..를 이용하여 appliction을 실행하여 정상적으로 수행되었으나 yarn UI의 어플리케이션 목록에 나타나지 않는 문제 총관리자 2017.05.02 52
118 jar파일의 dependency찾는 프로그램 총관리자 2016.08.11 52
117 spark 온라인 책자링크 (제목 : mastering-apache-spark) 총관리자 2016.05.25 52
116 파일명 혹은 확장자 일괄 변경하는 방법 총관리자 2017.01.26 51
115 S2RDF를 이용한 다른 버젼의 github링크 총관리자 2016.12.02 51
114 로컬의 라이브러리파일들을 dependency에 포함시키는 방법 총관리자 2016.08.09 51
113 "bad handshake: Error([('SSL routines', 'ssl3_get_server_certificate', 'certificate verify failed')])" 오류는 CA인증을 하지 못해서 발생함 총관리자 2022.05.13 50
112 [oracle]10자리 timestamp값을 날짜로 변환하는 방법 총관리자 2022.04.14 50
111 hue메타 정보를 저장(oracle DB)하는 내부 테이블을 이용하여 전체 테이블목록, 전체 코디네이터 목록, 코디네이터기준 workflow구조를 추출하는 쿼리문 총관리자 2022.04.01 50
110 lombok설치방법 총관리자 2020.06.20 49
109 Cloudera Manager 5.x설치시 embedded postgresql를 사용하는 경우의 관리정보 총관리자 2018.04.13 49
108 [oneM2M]Ontologies used for oneM2M 총관리자 2017.08.02 49
107 halyard의 console스크립트에서 생성한 repository는 RDF4J Web Applications에서 공유가 되지 않는다. 총관리자 2017.07.05 49
106 워킹 메모리에 대한 정보를 처리하는 클래스 파일 총관리자 2016.07.21 49
105 hadoop cluster구성된 노드를 확인시 Capacity를 보면 색이 붉은색으로 표시되어 있는 경우나 Unhealthy인 경우 처리방법 총관리자 2017.08.30 48
104 "암은 평범한 병, 심호흡만 잘해도 암세포 분열 저지” 총관리자 2016.06.02 48
103 [Hue]Hue의 메타정보를 담고 있는 desktop_document테이블과 desktop_document2의 관계 총관리자 2022.05.09 47
102 Collections.sort를 이용한 List<Map<String, String>>형태의 데이타 정렬 소스 총관리자 2016.12.15 47

A personal place to organize information learned during the development of such Hadoop, Hive, Hbase, Semantic IoT, etc.
We are open to the required minutes. Please send inquiries to gooper@gooper.com.

위로