Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.
kafka의 re-balance를 이용하여 consumer를 multi thread로 돌려서 topic의 partitions을 활용하여 병렬로 수집하는 방법설명
https://cwiki.apache.org/confluence/display/KAFKA/Consumer+Group+Example