Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.

kafka Kafka의 API중 Consumer.createJavaConsumerConnector()를 이용하고 다수의 thread를 생성하여 Kafka broker의 topic에 접근하여 데이타를 가져오고 처리하는 예제 소스

총관리자 2017.04.26 16:37 조회 수 : 9511

* Kafka의 API중 Consumer.createJavaConsumerConnector()를 이용하고 다수의 thread를 생성하여 Kafka broker의 topic에 접근하여 데이타를 가져오고 처리하는 예제 소스이다. Runnable객채를 만들고 ExecutorService를 이용하여 topic에 지정된 partition개수 만큼의 쓰레드를 생성하여 쓰레드로 작업하도록 되어있다.

import java.io.Serializable;

import java.util.Date;

import java.util.HashMap;

import java.util.List;

import java.util.Map;

import java.util.Properties;

import kafka.consumer.Consumer;

import kafka.consumer.ConsumerConfig;

import kafka.consumer.KafkaStream;

import kafka.javaapi.consumer.ConsumerConnector;

import kafka.message.MessageAndMetadata;

import org.apache.avro.io.BinaryDecoder;

import org.apache.avro.io.DecoderFactory;

import org.apache.avro.specific.SpecificDatumReader;

import org.apache.commons.logging.Log;

import org.apache.commons.logging.LogFactory;

import java.util.concurrent.ExecutorService;

import java.util.concurrent.Executors;

public class AvroDataSubscribe implements Serializable  {

	private static final long serialVersionUID = -2895832218133628236L;

	private final String TOPIC = Utils.KafkaTopics.COL_ONEM2M.toString();

	private static final Log log = LogFactory.getLog(AvroDataSubscribe.class);

	private final int NUM_THREADS = 3;		

	private final String user_id =this.getClass().getName();

	private final String group_id = this.getClass().getSimpleName();

	public static void main(String[] args) {

		AvroDataSubscribe avroDataSubscribe = new AvroDataSubscribe();

		try {

			avroDataSubscribe.collect();

		} catch (Exception ex) {

			log.debug("exception in main() :"+ex.getStackTrace());

		}

	}

	public void collect() throws Exception{

		Properties properties = new Properties();

		//class name을 user_id, grup_id로 사용함

		properties.put("zookeeper.connect",Utils.ZOOKEEPER_LIST);

		properties.put("group.id",group_id);

		properties.put("zookeeper.session.timeout.ms", "6000");

		properties.put("zookeeper.sync.time.ms", "2000");

		properties.put("auto.commit.enable", "true");

		properties.put("auto.commit.interval.ms", "5000");

		properties.put("fetch.message.max.bytes", "31457280");		// 30MB		

		properties.put("auto.offset.reset", "smallest");

		final ConsumerConnector consumer = 

				Consumer.createJavaConsumerConnector(new ConsumerConfig(properties));

		Map<String, Integer> topicCountMap = new HashMap<String, Integer>();

		topicCountMap.put(TOPIC, NUM_THREADS);

		Map<String, List<KafkaStream<byte[], byte[]>>> consumerMap = 	consumer.createMessageStreams(topicCountMap);

		List<KafkaStream<byte[], byte[]>> streams = consumerMap.get(TOPIC);

		ExecutorService executor = Executors.newFixedThreadPool(NUM_THREADS);

		for (int m = 0; m < NUM_THREADS; m++) {

			executor.execute(new ConsumerT(streams.get(m)));

		}

	}

	public class ConsumerT implements Runnable {

		private KafkaStream<byte[], byte[]> stream;

		private final SpecificDatumReader<COL_ONEM2M> specificDatumReader = new SpecificDatumReader<COL_ONEM2M>(COL_ONEM2M.class);

		public ConsumerT(KafkaStream<byte[], byte[]> stream) {

			super();

			this.stream = stream;

		}

		@Override

		public void run(){

			for(MessageAndMetadata<byte[], byte[]> messageAndMetadata : stream) {

				StringBuffer sb = new StringBuffer();

				byte[] message = (byte[]) messageAndMetadata.message();

				BinaryDecoder binaryDecoder = DecoderFactory.get().binaryDecoder(message, null);

				COL_ONEM2M read = null;

				String task_group_id = "";

				String task_id =  "";

				String start_time =  "";

				String colFrom =  "";

				String calcuate_latest_yn =  "";

				try {

					 read = specificDatumReader.read(null, binaryDecoder);

					 List<java.lang.CharSequence> data= read.getData();

					 task_group_id = read.getTaskGroupId().toString();

					 task_id = read.getTaskId().toString();

				// 처리에 필요한 로직

				// .....

				} catch (Exception e) {

					e.printStackTrace();

				}

			}

		}

	}

}

이 게시물을

이 글의 추천인 목록 목록

번호	제목	날짜	조회 수
213	Windows7 64bit 환경에서 Apache Hadoop 2.7.1설치하기	2017.07.26	11898
212	갑자기 DataNode가 java.io.IOException: Premature EOF from inputStream를 반복적으로 발생시키다가 java.lang.OutOfMemoryError: Java heap space를 내면서 죽는 경우 조치방법	2017.07.19	12801
211	Current heap configuration for MemStore and BlockCache exceeds the threshold required for successful cluster operation	2017.07.18	8338
210	HBase 설정 최적화하기(VCNC)	2017.07.18	7699
209	HBase write 성능 튜닝	2017.07.18	7622
208	mysql에서 외부 디비를 커넥션할 경우 접속 속도가 느려질때	2017.06.30	10452
207	Not enough replica available for query at consistency QUORUM가 발생하는 경우	2017.06.21	9135
206	cassandra cluster 문제가 있는 node제거 하기(DN상태의 노드가 있으면 cassandra cluster 전체에 문제가 발생하므로 반드시 제거할것)	2017.06.21	9685
205	lagom을 이용한 샘플 경매 프로그램 실행방법	2017.06.20	9167
204	mysql-server 기동시 Do you already have another mysqld server running on port 오류 발생할때 확인및 조치방법	2017.05.14	10292
203	mapreduce appliction을 실행시 "is running beyond virtual memory limits" 오류 발생시 조치사항	2017.05.04	26099
202	Mysql DB 생성 및 권한. 특정아이피, 대역에 대한 접근 허용	2017.05.04	11074
201	Hive MetaStore Server기동시 Could not create "increment"/"table" value-generation container SEQUENCE_TABLE since autoCreate flags do not allow it. 오류발생시 조치사항	2017.05.03	7669
200	Ubuntu 16.04 LTS에 Hive 2.1.1설치하면서 "Version information not found in metastore"발생하는 오류원인및 조치사항	2017.05.03	7912
199	hadoop에서 yarn jar ..를 이용하여 appliction을 실행하여 정상적(?)으로 수행되었으나 yarn UI의 어플리케이션 목록에 나타나지 않는 문제	2017.05.02	9432
198	hadoop에서 yarn jar ..를 이용하여 appliction을 실행하여 정상적으로 수행되었으나 yarn UI의 어플리케이션 목록에 나타나지 않는 문제	2017.05.02	9712
197	hadoop에서 yarn jar ..를 이용하여 appliction을 실행하여 정상적으로 수행되었으나 yarn UI의 어플리케이션 목록에 나타나지 않는 문제	2017.05.02	9290
196	hadoop에서 yarn jar ..를 이용하여 appliction을 실행하여 정상적으로 수행되었으나 yarn UI의 어플리케이션 목록에 나타나지 않는 문제	2017.05.02	8172
195	Cleaning up the staging area file시 'cannot access' 혹은 'Directory is not writable' 발생시 조치사항	2017.05.02	9468
194	Ubuntu 16.04 LTS에 MariaDB 10.1설치 및 포트변경 및 원격접속 허용	2017.05.01	9607

쓰기 태그

첫 페이지 8 9 10 11 12 13 14 15 16 17 끝 페이지

Cloudera, BigData, Semantic IoT, Hadoop, NoSQL

Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.

kafka Kafka의 API중 Consumer.createJavaConsumerConnector()를 이용하고 다수의 thread를 생성하여 Kafka broker의 topic에 접근하여 데이타를 가져오고 처리하는 예제 소스

댓글 0

Cloudera, BigData, Semantic IoT, Hadoop, NoSQL

Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.

kafka Kafka의 API중 Consumer.createJavaConsumerConnector()를 이용하고 다수의 thread를 생성하여 Kafka broker의 topic에 접근하여 데이타를 가져오고 처리하는 예제 소스

댓글 0

로그인

LOGIN