메뉴 건너뛰기

Cloudera, BigData, Semantic IoT, Hadoop, NoSQL

Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.


Environment Variable

spark-env.sh에서 사용할 수있는 항목.


SPARK_WORKER_MEMORY은 중요하기 때문에 여기에서 보충.SPARK_WORKER_MEMORY의 범위 내에서 spark.executor.memory을 별도 정의하게되는데, executor가 차지하는 비중 다른 관리를 위해 수백 MB 정도 남겨두면 좋을 듯. 하지만 거기의 균형은 물론 환경에 의한 다.

SPARK_MASTER_OPTS

SPARK_MASTER_OPTS가 지원하는 속성.


SPARK_WORKER_OPTS

SPARK_WORKER_OPTS가 지원하는 속성.


High Availability

ZooKeeper를 물지시켜 HA 구성 할 수 있습니다. 본문에 따르면, 퍼스트 리더가 다운에서 걸리는 총 복구 프로세스는 약 1-2 분 정도 걸리는 것. 이 지연은 새로운 애플리케이션의 스케줄링에만 영향을 이미 실행중인 응용 프로그램은 마스터 장애 조치 영향을주지 않는다. 

호스트 이름을 쉼표로 구분 OK.

1
export STANDALONE_SPARK_MASTER_HOST = master1, master2


Spark properties for YARN

번호 제목 날짜 조회 수
201 update를 많이 하면 heap memory가 많이 소진되고 최종적으로 OOM가 발생하는데 이에 대한 설명 2017.04.10 817
200 Ubuntu 16.04 LTS에 4대에 Hadoop 2.8.0설치 2017.05.01 818
199 sqoop으로 mariadb에 접근해서 hive 테이블로 자동으로 생성하기 2018.08.03 819
198 [dovecot]dovecot restart할때 root@gsda4:/usr/lib/dovecot# service dovecot restart 오류 발생시 조치사항 2017.06.12 822
197 oozie가 말하는 start시간은..서버에서 확인되는 시간이 아닙니다. 2014.05.14 823
196 mysql 5.5.34-0ubuntu0.13.04용 설치/진행 화면 2014.09.10 823
195 AIX 7.1에 Python 2.7.11설치하기 2016.10.06 825
194 source의 type을 spooldir로 하는 경우 해당 경로에 파일이 들어오면 파일단위로 전송함 2014.05.20 829
193 Nodes of the cluster (unhealthy)중 1/1 log-dirs are bad: 오류 해결방법 2015.05.17 829
192 우분투에서 패키지 설치시 E: Sub-process /usr/bin/dpkg returned an error code 발생시 조치 2017.05.02 839
191 secureCRT에서 backspace키가 작동하지 않는 경우 해결방법 2015.05.11 840
190 [springframework]Caused by: org.mariadb.jdbc.internal.util.dao.QueryException: Could not read resultset: unexpected end of stream, read 0 bytes from 4 오류 발생시 조치사항 2017.01.23 842
189 "File /user/hadoop/share/lib does not exist" 오류 해결방법 2015.06.07 849
188 beeline실행시 User: root is not allowed to impersonate오류 발생시 조치사항 2016.06.03 852
» spark-env.sh에서 사용할 수있는 항목. 2016.05.24 860
186 Cloudera Manager web UI의 언어를 한글에서 영문으로 변경하기 2018.04.03 860
185 python test.py실행시 "ImportError: No module named pyspark" 혹은 "ImportError: No module named py4j.protocol"등의 오류 발생시 조치사항 2017.07.04 869
184 os가 windows7인 host pc에서 ubuntu가 os인 guest pc에 접근하기 위한 네트워크설정 2014.04.20 872
183 hive metastore ERD file 2018.09.20 877
182 [Impala 3.2버젼]compute incremental stats db명.테이블명 수행시 ERROR: AnalysisException: Incremental stats size estimate exceeds 2000.00MB. 오류 발생원인및 조치방안 2022.11.30 879
위로