Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.

spark Spark 1.6.1 설치후 HA구성

총관리자 2016.05.24 11:00 조회 수 : 731

1. 다운로드/설치/설정

https://www.gooper.com/ss/bigdata/3115

2. zookeeper를 이용한 HA로 실행(방법1, 별도의 파일에 HA정보를 설정하는 방법)

가. ./conf/ha.conf파일을 생성하고 다음의 내용을 추가한다.(master로 사용되는 서버에 모두 있어야함)

spark.deploy.recoveryMode=ZOOKEEPER
spark.deploy.zookeeper.url=gsda1:2181,gsda2:2181,gsda3:2181
spark.deploy.zookeeper.dir=/spark

나. master실행(master로 사용되는 각 서버에서 실행, 2개서버) :

./sbin/start-master.sh -h gsda1 -p 7077 --webui-port 8123 --properties-file ./conf/ha.conf

./sbin/start-master.sh -h gsda2 -p 7077 --webui-port 8123 --properties-file ./conf/ha.conf

다. slave실행(slave로 사용되는 각 서버에서 실행)

./sbin/start-slave.sh spark://gsda1:7077,gsda2:7077

라. spark-shell실행

./bin/spark-shell --master spark://gsda1:7077,gsda2:7077

* zookeeper의 zlCli.sh를 실행해서 "ls /"을 명령을 주면 znode중에 "spark"를 확인할 수 있다.

3. zookeeper를 이용한 HA로 실행(방법2, spark-env.sh에 HA정보를 설정하는 방법)

가. ./conf/spark-env.sh에 다음의 내용을 추가함

export SPARK_MASTER_WEBUI_PORT=8123

export SPARK_LOG_DIR=/logs/spark

export SPARK_SSH_OPTS=" -p 22 "

export STANDALONE_SPARK_MASTER_HOST=gsda1,gsda2

export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=gsda1:2181,gsda2:2181,gsda3:2181"

나. ./sbin/start-all.sh을 실행한다.(master와 slave들이 실행된다)

다. 2번째 master서버에서 다음을 실행한다.(standby모드로 기동함)

./sbin/start-master.sh을 실행하면 conf정보를 참조하여 기동한다.

* 확인방법 : http://gsda1:8123/ 하면 status가 alive, http://gsda2:8123/ 하면 status가 standby로 표시된다.

4. HA 작동여부 확인방법

가. master2서버에서 http://gsda2:8123로 status가 standby상태인지 확인한다

나. master1서버에서 ./sbin/stop-master.sh로 master를 중지한다.

다. master2서버에서 http://gsda2:8123를 실행하여 Workers목록이 모두 표시되고 status가 standby->Alive로 변경되는지 확인한다.

5. spark master가 다운되었을때 다시 기동하도록 하는 방법

- spark-env.sh에 다음과 같은 라인을 추가한다.

export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=FILESYSTEM -Dspark.deploy.recoveryDirectory=/spark/recovery"

* recoveryMode를 FILESYSTEM으로 하면 recoveryDirectory에 recovery정보를 저장하고 있다가 master가 다운되면 master만 다시 기동해주는 형태로 복구를 수행한다.

이 게시물을

이 글의 추천인 목록 목록

번호	제목	날짜	조회 수
41	Spark Streaming으로 유실 없는 스트림 처리 인프라 구축하기	2016.03.11	262
40	Spark 2.1.1 clustering(5대) 설치(YARN기반)	2016.04.22	2054
39	spark-shell실행시 "A read-only user or a user in a read-only database is not permitted to disable read-only mode on a connection."오류가 발생하는 경우 해결방법	2016.05.20	627
»	Spark 1.6.1 설치후 HA구성	2016.05.24	731
37	spark-env.sh에서 사용할 수있는 항목.	2016.05.24	859
36	"Initial job has not accepted any resources; check your cluster UI to ensure that workers are registered and have sufficient resources"오류 발생시 조치사항	2016.05.25	1133
35	spark 온라인 책자링크 (제목 : mastering-apache-spark)	2016.05.25	165
34	spark-submit으로 spark application실행하는 다양한 방법	2016.05.25	387
33	spark client프로그램 기동시 "Error initializing SparkContext"오류 발생할때 조치사항	2016.05.27	615
32	Scala버젼 변경 혹은 상황에 맞게 Spark소스 컴파일하기	2016.05.31	504
31	./spark-sql 실행시 "java.lang.NumberFormatException: For input string: "1s"오류발생시 조치사항	2016.06.09	226
30	spark-sql실행시 The specified datastore driver ("com.mysql.jdbc.Driver") was not found in the CLASSPATH오류 발생시 조치사항	2016.06.09	580
29	spark-sql실행시 Caused by: java.lang.NumberFormatException: For input string: "0s" 오류발생시 조치사항	2016.06.09	2867
28	spark-sql실행시 ERROR log: Got exception: java.lang.NumberFormatException For input string: "2000ms" 오류발생시 조치사항	2016.06.09	299
27	kafka로 부터 메세지를 stream으로 받아 처리하는 spark샘플소스(spark의 producer와 consumer를 sbt로 컴파일 하고 서버에서 spark-submit하는 방법)	2016.07.13	698
26	Apache Spark와 Drools를 이용한 CEP구현 테스트	2016.07.15	709
25	start-all.sh로 spark데몬 기동시 "JAVA_HOME is not set"오류 발생시 조치사항	2016.08.01	317
24	파일끝에 붙는 ^M 일괄 지우기(linux, unix(AIX)) 혹은 파일내에 있는 ^M지우기	2016.09.24	168
23	java.lang.OutOfMemoryError: unable to create new native thread오류 발생지 조치사항	2016.10.17	755
22	VisualVM 1.3.9을 이용한 spark-submit JVM 모니터링을 위한 설정및 spark-submit실행 옵션	2016.10.28	2122

쓰기 태그

첫 페이지 1 2 3 끝 페이지

Cloudera, BigData, Semantic IoT, Hadoop, NoSQL

Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.

spark Spark 1.6.1 설치후 HA구성

1. 다운로드/설치/설정

댓글 0

Cloudera, BigData, Semantic IoT, Hadoop, NoSQL

Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.

spark Spark 1.6.1 설치후 HA구성

1. 다운로드/설치/설정

댓글 0

LOGIN