메뉴 건너뛰기

Cloudera, BigData, Semantic IoT, Hadoop, NoSQL

Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.


*출처 : http://cdecl.tistory.com/307


1. 다운로드

https://github.com/karthikj1/Hadoop-2.7.1-Windows-64-binaries/releases


2. 성치

가. 다운로드 받은 파일(hadoop-2.7.1.tar.gz)을 적절한 위치(예, C:devhadoop)에 복사하고 압축을 푼다.


3. 환경변수를 설정한다.

가. HADOOP_HOME=C:devhadoophadoop-2.7.1

나. JAVA_HOME=(필요시)

다. PATH=%PATH%;C:devhadoophadoop-2.7.1bin


4. Hadoop 설정

가. %HADOOP_HOME%etchadoopcore-site.xml
- Hadoop 인터페이스 서비스 URI 설정
- 외부로 서비스 노출 하고  싶다면 hdfs://0.0.0.0:9000 으로 세팅


<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>


나. %HADOOP_HOME%etchadoophdfs-site.xml
- dfs.replication 블록 복제, 파일 복제 개수를 지정
- namenode 와 datanode 의 경로를 지정 (옵션), 지정하지 않으면 /tmp 밑에 생성함
- file:/ 이 경로는 현재 드라이브 루트를 의미 (c: or d:)


<configuration>
 <property>
  <name>dfs.replication</name>
  <value>1</value>
 </property>
 <property>
  <name>dfs.namenode.name.dir</name>
  <value>file:/hadoop/data/dfs/namenode</value>
 </property>
 <property>
  <name>dfs.datanode.data.dir</name>
  <value>file:/hadoop/data/dfs/datanode</value>
 </property>
</configuration>


다. %HADOOP_HOME%etchadoopyarn-site.xml

- yarn 설정 및 hadoop 어플리케이션 classpath 설정


<configuration>
    <property>
       <name>yarn.nodemanager.aux-services</name>
       <value>mapreduce_shuffle</value>
    </property>
    <property>
       <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
       <value>org.apache.hadoop.mapred.ShuffleHandler</value>
    </property>
    <property>
       <name>yarn.application.classpath</name>
       <value>
            %HADOOP_HOME%etchadoop,
            %HADOOP_HOME%sharehadoopcommon*,
            %HADOOP_HOME%sharehadoopcommonlib*,
            %HADOOP_HOME%sharehadoopmapreduce*,
            %HADOOP_HOME%sharehadoopmapreducelib*,
            %HADOOP_HOME%sharehadoophdfs*,
            %HADOOP_HOME%sharehadoophdfslib*,        
            %HADOOP_HOME%sharehadoopyarn*,
            %HADOOP_HOME%sharehadoopyarnlib*
       </value>
    </property>
</configuration>


라. %HADOOP_HOME%etchadoopmapred-site.xml
- 맵리듀스 런타임 프레임웍 설정


<configuration>
    <property>
       <name>mapreduce.framework.name</name>
       <value>yarn</value>
    </property>
</configuration>


5. Namenode를 format한다.

%HADOOP_HOME%binhdfs namenode -format


6. HDFS, YARN 데몬 실행

%HADOOP_HOME%sbinstart-dfs
%HADOOP_HOME%sbinstart-yarn

--> console창이 각각 2개씩 총 4개가 실행되면서 각각의 서비스 시작됨


7. 서비스 확인

- http://localhost:8042 - Resource Manager and Node Manager :
- http://localhost:50070 - Namenode

* http://localhost:9000 - Service URI


8. test

가. hdfs dfs -mkdir -p /user/gooper/data

나. hdfs dfs -ls /

다. hdfs dfs -put c:tmpdata* /user/gooper/data

라. hdfs dfs -ls /user/gooper/data

번호 제목 날짜 조회 수
441 Caused by: java.sql.SQLNonTransientConnectionException: Could not read resultset: unexpected end of stream, read 0 bytes from 4 오류시 확인/조치할 내용 2016.10.31 4064
440 mybatis와 spring을 org.apache.commons.dbcp2.BasicDataSource의 DataSource로 연동할때 DB설정(참고) 2016.10.31 1074
439 How-to: Tune Your Apache Spark Jobs (Part 2) file 2016.10.31 221
438 How-to: Build a Complex Event Processing App on Apache Spark and Drools file 2016.10.31 360
437 Flume을 이용한 데이타 수집시 HBase write 성능 튜닝 file 2016.10.31 724
436 Flume과 Kafka를 사용한 초당 100만개 로그 수집 테스트 file 2016.10.31 1127
435 Spark Streaming 코드레벨단에서의 성능개선 2016.10.31 293
434 centos 6에서 mariadb 5.1 to 10.0 으로 upgrade 2016.11.01 202
433 java스레드 덤프 분석하기 file 2016.11.03 185
432 데이타 분석및 머신러닝에 도움이 도움이 되는 사이트 2016.11.04 455
431 [SparkR]SparkR 설치 사용기 1 - Installation Guide On Yarn Cluster & Mesos Cluster & Stand Alone Cluster file 2016.11.04 341
430 Eclipse실행시 Java was started but returned exit code=1이라는 오류가 발생할때 조치방법 2016.11.07 581
429 Kafka Offset Monitor로 kafka 상태 모니터링 하기 file 2016.11.08 663
428 참고할만한 spark예제를 설명하는 사이트 2016.11.11 186
427 spark notebook 0.7.0설치및 설정 2016.11.14 464
426 git 초기화(Windows에서 Git Bash사용) 2016.11.17 246
425 특정 단계의 commit상태로 만들기(이렇게 하면 중간에 반영된 모든 commit를 history가 삭제된다) 2016.11.17 377
424 Github를 이용하는 전체 흐름 이해하기 2016.11.18 146
423 특정 커밋 시점(commit id를 기준으로)으로 돌리기(reset) 2016.11.21 190
422 .gitignore파일에 지정되지 않은 파일이 ignore되는 경우 확인방법 2016.11.22 465
위로