Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.
Hadoop Container killed by the ApplicationMaster. Container killed on request. Exit code is 143 Container exited with a non-zero exit code 143 TaskAttempt killed because it ran on unusable node 오류시 조치방법
아래의 원인으로 hadoop application실행의 전체 실행시간이 지연되는 경우는 HDD의 용량을 확인해서 불필요한 파일을 정리하여 HDD공간을 확보(최상위 위치(/)에서 du -sh * 명령을 주면 현재 폴더별로 용량을 보여준다.)한 후 재작업하면 정상적으로 처리된다.
1. hadoop application실행시 map, reduce attempt의 일부가 kill된다.
2. attempt의 kill원인이 "TaskAttempt killed because it ran on unusable nodes sda20:41071 Container released on a *lost* node"이거나 "Container killed by the ApplicationMaster. Container killed on request. Exit code is 143 Container exited with a non-zero exit code 143 TaskAttempt killed because it ran on unusable node sda20:41071", "Reducer preempted to make room for pending map attempts"등이 표시된다.
3. jps등으로 프로세스를 확인했을때 nodemanager, datanode등은 이상없이 작동된다.