메뉴 건너뛰기

Bigdata, Semantic IoT, Hadoop, NoSQL

Bigdata, Hadoop ecosystem, Semantic IoT등의 프로젝트를 진행중에 습득한 내용을 정리하는 곳입니다.
필요한 분을 위해서 공개하고 있습니다. 문의사항은 gooper@gooper.com로 메일을 보내주세요.


0. Spark, Scala, Pip, Python, Hadoop, Jupyter등은 이미 설치되어 있다고 가정한다.


1. 환경변수 설정

sudo vi /etc/profile

export $SPARK_HOME=$HOME/spark


2. 수정된 환경변수값 반영

sudo source /etc/profile


3. toree설치

sudo pip install toree

sudo jupyter toree install --spark_home=$SPARK_HOME --interpreters=Scala,PySpark,SparkR,SQL


4. browser에서 확인

https://gsda4:8888/


5. jupyter kernal목록 확인(jupyter kernelspec list)

/usr/local/lib/python2.7/dist-packages/jupyter_client/session.py:48: VisibleDeprecationWarning: zmq.eventloop.minitornado is deprecated in pyzmq 14.0 and will be removed.

    Install tornado itself to use zmq with the tornado IOLoop.


  from zmq.eventloop.ioloop import IOLoop

[ListKernelSpecs] WARNING | Native kernel (python2) is not available

[ListKernelSpecs] WARNING | Native kernel (python2) is not available

Available kernels:

  apache_toree_pyspark    /usr/local/share/jupyter/kernels/apache_toree_pyspark

  apache_toree_scala      /usr/local/share/jupyter/kernels/apache_toree_scala

  apache_toree_sparkr     /usr/local/share/jupyter/kernels/apache_toree_sparkr

  apache_toree_sql        /usr/local/share/jupyter/kernels/apache_toree_sql

  python3                 /usr/local/share/jupyter/kernels/python3


번호 제목 글쓴이 날짜 조회 수
301 Cloudera가 사용하는 서비스별 디렉토리 총관리자 2018.03.29 160
300 [CentOS] 네트워크 설정 총관리자 2018.03.26 160
299 schema.xml vs managed-schema 지정 사용하기 - 두개를 동시에 사용할 수는 없음 총관리자 2017.07.09 160
298 spark notebook 0.7.0설치및 설정 총관리자 2016.11.14 160
297 windows7에서 lagom의 hello world를 빌드하여 실행하는 경우의 로그(mvn lagom:runAll -Dscala.binary.version=2.11) 총관리자 2017.12.22 159
296 [HIVESERVER2]프로세스의 thread및 stack trace를 덤프하는 방법(pstack, jstack) 총관리자 2022.05.11 158
295 No broker partitions consumed by consumer thread오류 발생시 확인/조치할 사항 총관리자 2016.09.02 157
294 Cloudera의 API를 이용하여 impala의 실행되었던 쿼리 확인하는 예시 총관리자 2018.05.03 156
293 [PHP7.0]로그파일 위치 총관리자 2017.05.07 156
292 test2 총관리자 2017.05.01 154
291 magento2 2.1.3을 수동으로 설치하는 방법 총관리자 2017.02.01 154
290 spark 시동중 applicationHistory 로그 디렉토리가 없다고 하면서 기동되지 않는 경우 총관리자 2018.06.01 153
289 이미지 관리 오픈소스 목록 총관리자 2018.03.11 152
288 [jsoup]Jsoup Tutorial 총관리자 2017.04.11 151
287 천문학적, 기후학적, 기상학적, 생물학적, 농사계절 구분 총관리자 2015.12.16 151
» Apache Toree설치(Jupyter에서 Scala, PySpark, SparkR, SQL을 사용할 수 있도록 하는 Kernel) 총관리자 2018.04.17 150
285 update(update와 delete->insert)사용시 주의/참고사항 총관리자 2016.01.06 148
284 hadoop nfs gateway설정 (Cloudera 6.3.4, CentOS 7.4 환경에서) 총관리자 2022.01.07 146
283 LUBM 개수별 hadoop HDFS data사이즈 정리 총관리자 2017.04.06 146
282 failed to read local state, exiting...오류발생시 조치사항 총관리자 2016.04.06 146

A personal place to organize information learned during the development of such Hadoop, Hive, Hbase, Semantic IoT, etc.
We are open to the required minutes. Please send inquiries to gooper@gooper.com.

위로