메뉴 건너뛰기

Cloudera, BigData, Semantic IoT, Hadoop, NoSQL

Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.


1. coordinator.xml에서 아래와 같이 <datasets></datasets>을 추가해주면 <done-flag></done-flag>사이에 지정된 파일이 <uri-template></uri-template>사이의 경로에 생성되어야만 action이 실행되도록 할 수 있다.

 

-----------------------------------------------------------------coordinator.xml-------------------------------------------------------------------------------------

<coordinator-app name="${scenarioNo}-s-C" frequency="${coord:minutes(1)}" start="${startTime}" end="${endTime}"
timezone="UTC" xmlns="uri:oozie:coordinator:0.1">
    <controls>
     <concurrency>1</concurrency>
    </controls>

    <datasets>
         <dataset name="logs" frequency="${coord:minutes(1)}"
                initial-instance="${startTime}" timezone="UTC">
            <uri-template>
                ${nameNode}/data1/cas/output/s1/${YEAR}/${MONTH}/${DAY}
            </uri-template>
         <done-flag>000000_0</done-flag>
     </dataset>
    </datasets>
    <input-events>
      <data-in name="input" dataset="logs">
         <instance>${startTime2}</instance>
      </data-in>
    </input-events>

    <action>
      <workflow>
         <app-path>${nameNode}/data1/cas/scenario/${scenarioNo}/sqoop</app-path>
         <configuration>
            <property>
                <name>jobTracker</name>
                <value>${jobTracker}</value>
            </property>
            <property>
                <name>nameNode</name>
                <value>${nameNode}</value>
            </property>
            <property>
                <name>queueName</name>
                <value>${queueName}</value>
            </property>
            <property>
                <name>wfInput</name>
                <value>${coord:dataIn('input')}</value>
            </property>
            <property>
                <name>iyear</name>
                <!-- <value>${coord:formatTime(coord:nominalTime(),"yyyy")}</value> -->
                <value>${coord:formatTime(coord:actualTime(),"yyyy")}</value>
            </property>
            <property>
                <name>imonth</name>
                <!-- <value>${coord:formatTime(coord:nominalTime(),"MM")}</value> -->
                <value>${coord:formatTime(coord:actualTime(),"MM")}</value>
            </property>
            <property>
                <name>iday</name>
                <!-- <value>${coord:formatTime(coord:nominalTime(),"dd")}</value> -->
                <value>${coord:formatTime(coord:actualTime(),"dd")}</value>
            </property>
          </configuration>
      </workflow>
    </action>
</coordinator-app>

번호 제목 날짜 조회 수
601 spark stream처리할때 두개의 client프로그램이 동일한 checkpoint로 접근할때 발생하는 오류 내용 2018.01.16 1172
600 impala 설치/설정 2016.06.03 1169
599 Current heap configuration for MemStore and BlockCache exceeds the threshold required for successful cluster operation 2017.07.18 1167
598 DataNode를 기동할때 "Block pool ID needed, but service not yet registered with NN" 오류 발생에 따른 조치사항 2018.05.28 1157
597 "Initial job has not accepted any resources; check your cluster UI to ensure that workers are registered and have sufficient resources"오류 발생시 조치사항 2016.05.25 1141
596 unique한 값 생성 2014.04.25 1134
595 hive에서 insert overwrite directory.. 로 하면 default column구분자는 'SOH'혹은 't'가 됨 2014.05.20 1133
594 cloudera(python 2.7.5)에서 anaconda3로 설치한 외부 python(3.6.6)을 이용하여 pyspark를 사용하는 설정 2018.09.14 1132
593 Flume과 Kafka를 사용한 초당 100만개 로그 수집 테스트 file 2016.10.31 1132
592 Building a Cluster docs 2014.04.22 1132
591 [백업] 리눅스 시스템 백업하기 (Linux System Backup) - TAR 사용 시스템 전체 백업 2022.01.19 1127
590 Impala의 Queries탭에서 여러조건으로 쿼리 찾기 2018.05.09 1121
589 dual table만들기 2014.05.16 1120
588 postgresql-9.4에서 FATAL: remaining connection slots are reserved for non-replication superuser connections가 나올때 조치 2018.08.16 1106
587 [Magento]php7에 Composer를 이용하여 Magento 2.1.3 설치 file 2017.01.30 1104
» 특정파일이 생성되어야 action이 실행되는 oozie job만들기(coordinator.xml) 2014.05.20 1087
585 oozie 에서 sqoop action실행 에러 - 컬럼개수 차이 2014.07.17 1085
584 mybatis와 spring을 org.apache.commons.dbcp2.BasicDataSource의 DataSource로 연동할때 DB설정(참고) 2016.10.31 1079
583 Using The ZooKeeper CLI에서 zkCli의 위치 2014.11.02 1061
582 hadoop 기반 문서 검색 2014.09.25 1056
위로