Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.

spark spark 2.0.0를 windows에서 실행시 로컬 파일을 읽을때 발생하는 오류 해결 방법

총관리자 2017.01.12 10:40 조회 수 : 1794

아래의 소스로 테스트할때 textFile() 부분에서 java.net.URISyntaxException가 발생하는데 이때는

아래 주석부분에 있는것처럼 sparkConf.set("spark.sql.warehouse.dir", "file:///tmp/spark-warehouse"); 를 추가하여 준다.

---------테스트 소스중 일부 --------

SparkConf sparkConf=new SparkConf().setAppName("SparkJavaTest");
sparkConf.setMaster("local[*]");
//sparkConf.set("spark.sql.warehouse.dir", "file:///tmp/spark-warehouse");

JavaSparkContext ctx=new JavaSparkContext(sparkConf);
SQLContext sqlContext = new SQLContext(ctx);

JavaRDD<String> dataCollection=ctx.textFile("file:///C:/tmp/sparktest/a.txt");

--------------------오류내용-----------------------

Exception in thread "main" java.lang.IllegalArgumentException: java.net.URISyntaxException: Relative path in absolute URI: file:C:/dev/workspace/sdaf/sda-client/spark-warehouse
at org.apache.hadoop.fs.Path.initialize(Path.java:205)
at org.apache.hadoop.fs.Path.<init>(Path.java:171)
at org.apache.spark.sql.catalyst.catalog.SessionCatalog.makeQualifiedPath(SessionCatalog.scala:114)
at org.apache.spark.sql.catalyst.catalog.SessionCatalog.createDatabase(SessionCatalog.scala:145)
at org.apache.spark.sql.catalyst.catalog.SessionCatalog.<init>(SessionCatalog.scala:89)
at org.apache.spark.sql.internal.SessionState.catalog$lzycompute(SessionState.scala:95)
at org.apache.spark.sql.internal.SessionState.catalog(SessionState.scala:95)
at org.apache.spark.sql.internal.SessionState$$anon$1.<init>(SessionState.scala:112)
at org.apache.spark.sql.internal.SessionState.analyzer$lzycompute(SessionState.scala:112)
at org.apache.spark.sql.internal.SessionState.analyzer(SessionState.scala:111)
at org.apache.spark.sql.execution.QueryExecution.assertAnalyzed(QueryExecution.scala:49)
at org.apache.spark.sql.Dataset$.ofRows(Dataset.scala:64)
at org.apache.spark.sql.SparkSession.createDataFrame(SparkSession.scala:542)
at org.apache.spark.sql.SparkSession.createDataFrame(SparkSession.scala:302)
at org.apache.spark.sql.SparkSession.createDataFrame(SparkSession.scala:315)
at org.apache.spark.sql.SQLContext.createDataFrame(SQLContext.scala:440)
at com.gooper.icbms.sda.kafka.onem2m.SparkJavaTest.main(SparkJavaTest.java:106)
Caused by: java.net.URISyntaxException: Relative path in absolute URI: file:C:/dev/workspace/sdaf/sda-client/spark-warehouse
at java.net.URI.checkPath(URI.java:1823)
at java.net.URI.<init>(URI.java:745)
at org.apache.hadoop.fs.Path.initialize(Path.java:202)
... 16 more

이 게시물을

이 글의 추천인 목록 목록

번호	제목	날짜	조회 수
187	Container killed by the ApplicationMaster. Container killed on request. Exit code is 143 Container exited with a non-zero exit code 143 TaskAttempt killed because it ran on unusable node 오류시 조치방법	2017.04.06	2184
186	streaming작업시 입력된 값에 대한 사본을 만들게 되는데 이것이 실패했을때 발생하는 경고메세지	2017.04.03	1784
185	JavaStreamingContext를 이용하여 스트림으로 들어오는 문자열 카운트 소스	2017.03.30	1032
184	kafka-manager 1.3.3.4 설정및 실행하기	2017.03.20	3260
183	spark 2.0.0의 api를 이용하는 예제 프로그램	2017.03.15	1379
182	It is indirectly referenced from required .class files 오류 발생시 조치방법	2017.03.09	2256
181	spark2.0.0에서 hive 2.0.1 table을 읽어 출력하는 예제 소스(HiveContext, SparkSession, SQLContext)	2017.03.09	1369
180	spark에서 hive table을 읽어 출력하는 예제 소스	2017.03.09	2551
179	spark에서 hive table을 읽어 출력하는 예제 소스	2017.03.09	1944
178	서버중 slave,worker,regionserver만 재기동해야 할때 필요한 기동스크립트및 사용방법	2017.02.03	2025
177	테이블의 row수를 빠르게 카운트 하는 방법	2017.01.26	1057
176	HDFS상의 /tmp폴더에 Permission denied오류가 발생시 조치사항	2017.01.25	1303
175	[JSON 파싱]mongodb의 document를 GSON을 이용하여 parsing할때 ObjectId값에서 오류 발생시 조치방법	2017.01.18	2512
»	spark 2.0.0를 windows에서 실행시 로컬 파일을 읽을때 발생하는 오류 해결 방법	2017.01.12	1794
173	new Gson().toJson(new ObjectId())을 사용하면 값이 다르게 나오는 경우가 있음	2016.12.23	1955
172	like검색한 결과를 기준으로 집계를 수행하는 java 소스	2016.12.19	2323
171	MongoDB에 있는 특정컬럼의 값을 casting(string->integer)하여 update하기 java 소스	2016.12.19	2289
170	mongodb aggregation query를 Java code로 변환한 샘플	2016.12.15	2543
169	ResultSet에서 데이타를 List<Map<String,String>>형태로 만들어서 리턴하는 소스(Collections.sort를 이용한 정렬 가능)	2016.12.15	2544
168	hbase startrow와 endrow를 지정하여 검색하기 샘플	2016.12.07	1019

쓰기 태그

첫 페이지 9 10 11 12 13 14 15 16 17 18 끝 페이지

Cloudera, BigData, Semantic IoT, Hadoop, NoSQL

Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.

spark spark 2.0.0를 windows에서 실행시 로컬 파일을 읽을때 발생하는 오류 해결 방법

댓글 0

Cloudera, BigData, Semantic IoT, Hadoop, NoSQL

Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.

spark spark 2.0.0를 windows에서 실행시 로컬 파일을 읽을때 발생하는 오류 해결 방법

댓글 0

LOGIN