Bigdata, Hadoop ecosystem, Semantic IoT등의 프로젝트를 진행중에 습득한 내용을 정리하는 곳입니다.
필요한 분을 위해서 공개하고 있습니다.
문의사항은 gooper@gooper.com로 메일을
보내주세요.
oozie의 action에 user_retry및 retry_interval을 지정하여 작업이 바로 종료되지 않고 일정 시간 대기하도록 할 수 있는데.. 이때 L4가 round robin형태로 처리하면 retry간격이 일정하지 않게 짧아지는 문제가 있다.
이는 action 수행 순서인 Start action->call for action->Preparing retry가 각각 다른 oozie서버에서 수행되면서 retry간격을 정확히 측정하지 못하는 문제가 있다.
특히 선행 retry에서 Start action과 call for action은 반드시 같은 서버에서 수행되고 다음 retry도 같은 oozie서버에서 수행되어야 문제 없이 정해진 시간만큼 wait시킬 수 있다 .
예를 들어 아래와 같은 ooze log상의 작업이 진행되면..
17회와 18회 사이는 지정된 시간만큼 정확하게 wait이 되지만 18회와 19회 사이는 원하는 만큼의 시간만큼 wait하지 못한다.
userRetryCount[17]
->Start action(oozie#1)
->callback for action(oozie#1)
->Preparing retry(oozie#1, callback for action서버와 같음)
userRetryCount[18]
->Start action(oozie#1)
->callback for action(oozie#2)
->Preparing retry(oozie#2, callback for action서버와 같음)
userRetryCount[19]
->Start action(oozie#1)
->callback for action(oozie#2)
->Preparing retry(oozie#2, callback for action서버와 같음)
댓글 0
번호 | 제목 | 글쓴이 | 날짜 | 조회 수 |
---|---|---|---|---|
3 | [oozie]Oozie WF수행시 단계별 ID넘버링 비교/설명 | 총관리자 | 2022.03.23 | 25 |
» | [HA구성 이슈]oozie 2대를 L4로 HA구성했을때 발생하는 이슈 | gooper | 2023.01.17 | 20 |
1 | oozie의 sqoop action수행시 ooize:launcher의 applicationId를 이용하여 oozie:action의 applicationId및 관련 로그를 찾는 방법 | gooper | 2023.07.26 | 17 |