메뉴 건너뛰기

Cloudera, BigData, Semantic IoT, Hadoop, NoSQL

Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.


1. hdd를 추가하고 mounting한다.

https://www.gooper.com/ss/index.php?mid=bigdata&category=2772&document_srl=2984 를 참조할것..


2. /app/hdd 폴더밑에 hadoop폴더를 job을 수행할 계정(예, hadoop)으로 생성한다

    (혹시 start-all.sh기동후 hadoop폴더 밑에 생성된 폴더가 root계정으로 생성되면.. 

    chown -R hadoop:hadoop hadoop을 실행하여 모두 hadoop계정으로 전환시켜준다.)


3. conf파일들의 경로를 수정함

   가. core-site.xml

<?xml version="1.0"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<!-- Put site-specific property overrides in this file. -->

<configuration>

<property>

   <name>fs.default.name</name>

   <value>hdfs://master:9000</value>

</property>

<property>

   <name>hadoop.tmp.dir</name>

   <!-- value>/tmp/hadoop-${user.name}</value -->

   <!-- value>/home/${user.name}/work/tmp</value -->

   <value>/app/hdd/hadoop/tmp</value>

</property>

</configuration>


   나. hdfs-site.xml
<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<!-- Put site-specific property overrides in this file. -->
<configuration>
<property>
   <name>ds.replication</name>
   <value>2</value>
</property>
<property>
   <name>dfs.name.dir</name>
   <!-- value>/home/hadoop/work/name</value -->
   <!-- value>/home/${user.name}/work/name</value -->
   <value>/app/hdd/hadoop/name</value>
</property>
<property>
   <name>dfs.data.dir</name>
   <!-- value>/home/hadoop/work/data</value -->
   <!-- value>/home/${user.name}/work/data</value -->
   <value>/app/hdd/hadoop/data</value>
</property>
<property>
   <name>dfs.support.append</name>
   <value>true</value>
</property>
<property>
   <name>dfs.permissions</name>
   <value>true</value>
</property>
</configuration>

   다. mapred-site.xml

<?xml version="1.0"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<!-- Put site-specific property overrides in this file. -->

<configuration>

<property>

   <name>mapred.job.tracker</name>

   <value>hdfs://master:9001</value>

</property>

<property>

   <name>mapred.system.dir</name>

   <!-- value>/home/hadoop/work/mapred/system</value -->

   <!-- value>/home/${user.name}/work/mapred/system</value -->

   <value>/app/hdd/hadoop/mapred/system</value>

</property>

   <property>

      <name>hadoop.proxyuser.hadoop.groups</name>

      <!-- value>*</value -->

      <value>root,hadoop</value>

   </property>

   <property>

      <name>hadoop.proxyuser.hadoop.hosts</name>

      <value>*</value>

      <!-- value>localhost</value -->

   </property>

<property>

  <name>mapreduce.jobtracker.staging.root.dir</name>

  <!-- value>/home/hadoop/work/tmp/mapred/staging</value -->

  <value>/user</value>

</property>

</configuration>


4. namenode를 format

   hadoop namenode -format


5. 데몬을 모두 기동함

   start-all.sh


6. hdfs상에 /user밑으로 hadoop계정을 생성한다.

   hadoop fs -mkdir /user/hadoop을 생성함


7. test

번호 제목 날짜 조회 수
521 [CDP7.1.7]Impala Query의 Memory Spilled 양은 ScratchFileUsedBytes값을 누적해서 구할 수 있다. 2022.07.29 325
520 SQL문장과 Mongo에서 사용하는 명령어를 비교한 것입니다. 2015.09.30 327
519 impala external 테이블 생성시 컬럼과 라인 구분자를 지정하여 테이블 생성하는 예시 2020.02.20 328
518 missing block및 관련 파일명 찾는 명령어 2021.02.20 328
517 Hue Job Browser의 Queries탭에서 조건을 지정하는 방법 2018.05.10 329
516 JAVA_HOME을 명시적으로 지정하는 방법 2018.06.04 329
515 RDF4J의 rdf4j-server.war가 제공하는 RESTFul API를 이용하여 repository에 CRUD테스트 2017.08.30 330
514 Could not authenticate, GSSException: No valid credentials provided (Mechanism level: Failed to find any kerberos tgt) 2022.04.28 333
513 python 2.6.6에서 print 'A=' 형태의 사용이 python 3.5.1에서 오류(SyntaxError: Missing parentheses in call to 'print') 발생함.. 2016.05.27 334
512 Could not compute split, block input-0-1517397051800 not found형태의 오류가 발생시 조치방법 2018.02.01 334
511 solrdf초기 기동시 "Caused by: java.lang.IllegalAccessError: tried to access field org.apache.solr.handler.RequestHandlerBase.log from class org.gazzax.labs.solrdf.handler.update.RdfUpdateRequestHandler" 오류가 발생시 조치사항 2016.04.22 336
510 한번에 여러값 update하기 2016.01.13 337
509 [SparkR]SparkR 설치 사용기 1 - Installation Guide On Yarn Cluster & Mesos Cluster & Stand Alone Cluster file 2016.11.04 339
508 [CentOS 7.4]Hadoop NFS gateway기동시 Cannot connect to port 2049 오류 발생시 확인/조치 2022.03.02 339
507 hue.axes_accessattempt테이블 데이터 샘플 2020.02.10 341
506 tar를 이용한 리눅스 백업 2018.05.13 342
505 [CDP7.1.7]impala-shell을 이용하여 kudu table에 insert/update수행시 발생하는 오류(Transport endpoint is not connected (error 107)) 발생시 확인할 내용 2023.11.30 342
504 SPIN(SPARQL Inference Notation)이란.. file 2016.02.25 343
503 collection생성혹은 collection조회시 Plugin init failure for [schema.xml] fieldType "pdate": Error loading class 'solr.IntField' 오류 조치사항 2022.04.07 344
502 룰에 매칭되면 발생되는 엑티베이션 객체에 대한 작업(이전값 혹은 현재값)을 처리하는 클래스 파일 2016.07.21 346
위로