메뉴 건너뛰기

Cloudera, BigData, Semantic IoT, Hadoop, NoSQL

Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.

Spark+S2RDF DataSetCreator.py 실행시 파일을 찾을 수 없는 오류

총관리자 2016.05.27 15:01 조회 수 : 141

실행 : python3 DataSetCreator.py -i /home/hadoop/QueryTranslator/S2RDF_QueryTranslator/data/sparql.in -s 0.25

문제 : 아래와 같은 오류가 발생하는데.. 파일의 위치는 HDFS상의 위치를 지정해줘야함...

------------------오류내용 ----------------------

Caused by: org.apache.hadoop.mapred.InvalidInputException: Input path does not exist: hdfs://mycluster/home/hadoop/QueryTranslator/S2RDF_QueryTranslator/data/sparql.in

at org.apache.hadoop.mapred.FileInputFormat.singleThreadedListStatus(FileInputFormat.java:285)

at org.apache.hadoop.mapred.FileInputFormat.listStatus(FileInputFormat.java:228)

at org.apache.hadoop.mapred.FileInputFormat.getSplits(FileInputFormat.java:313)

at org.apache.spark.rdd.HadoopRDD.getPartitions(HadoopRDD.scala:199)

at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:239)

at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:237)

at scala.Option.getOrElse(Option.scala:120)

at org.apache.spark.rdd.RDD.partitions(RDD.scala:237)

at org.apache.spark.rdd.MapPartitionsRDD.getPartitions(MapPartitionsRDD.scala:35)

at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:239)

at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:237)

at scala.Option.getOrElse(Option.scala:120)

at org.apache.spark.rdd.RDD.partitions(RDD.scala:237)

at org.apache.spark.rdd.MapPartitionsRDD.getPartitions(MapPartitionsRDD.scala:35)

at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:239)

at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:237)

at scala.Option.getOrElse(Option.scala:120)

at org.apache.spark.rdd.RDD.partitions(RDD.scala:237)

at org.apache.spark.rdd.MapPartitionsRDD.getPartitions(MapPartitionsRDD.scala:35)

at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:239)

at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:237)

at scala.Option.getOrElse(Option.scala:120)

at org.apache.spark.rdd.RDD.partitions(RDD.scala:237)

at org.apache.spark.rdd.MapPartitionsRDD.getPartitions(MapPartitionsRDD.scala:35)

at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:239)

at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:237)

at scala.Option.getOrElse(Option.scala:120)

at org.apache.spark.rdd.RDD.partitions(RDD.scala:237)

at org.apache.spark.rdd.MapPartitionsRDD.getPartitions(MapPartitionsRDD.scala:35)

at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:239)

at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:237)

at scala.Option.getOrElse(Option.scala:120)

at org.apache.spark.rdd.RDD.partitions(RDD.scala:237)

at org.apache.spark.rdd.MapPartitionsRDD.getPartitions(MapPartitionsRDD.scala:35)

at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:239)

at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:237)

at scala.Option.getOrElse(Option.scala:120)

at org.apache.spark.rdd.RDD.partitions(RDD.scala:237)

at org.apache.spark.rdd.MapPartitionsRDD.getPartitions(MapPartitionsRDD.scala:35)

at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:239)

at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:237)

at scala.Option.getOrElse(Option.scala:120)

at org.apache.spark.rdd.RDD.partitions(RDD.scala:237)

at org.apache.spark.ShuffleDependency.<init>(Dependency.scala:91)

at org.apache.spark.sql.execution.Exchange.prepareShuffleDependency(Exchange.scala:220)

at org.apache.spark.sql.execution.Exchange$$anonfun$doExecute$1.apply(Exchange.scala:254)

at org.apache.spark.sql.execution.Exchange$$anonfun$doExecute$1.apply(Exchange.scala:248)

at org.apache.spark.sql.catalyst.errors.package$.attachTree(package.scala:48)

... 38 more

이 게시물을

이 글의 추천인 목록 목록

댓글 0

번호	제목	날짜	조회 수
221	[postgresql 9.x] PostgreSQL Replication 구축하기	2018.07.17	324
220	mongodb 2.6.6 설치(64bit)	2015.09.30	323
219	VPS에서는 root로 실행해도 swap파일을 만들지 못하게 만들어 두었지만 swap파일을 생성하는 방법	2017.06.20	321
218	down된 broker로 메세지를 전송하려는 경우의 오류 내용및 조치사항	2016.08.12	321
217	[CDP7.1.7]Impala Query의 Memory Spilled 양은 ScratchFileUsedBytes값을 누적해서 구할 수 있다.	2022.07.29	320
216	[vi]블럭 및 문서내 복사등에 관련된 명령어	2017.02.17	320
215	Jena는 기본적으로 multi thread환경을 지원하지 않는다.	2016.08.16	320
214	로컬의 라이브러리파일들을 dependency에 포함시키는 방법	2016.08.09	320
213	[Active Directory] AD Kerberos보안 설정 변경 방법 (Maximum lifetime for user ticket, Maximum lifetime for user ticket renewal)	2024.03.12	319
212	숭실대 교수님등 강의영상(바이오데이터마이닝, 빅데이터분산컴퓨팅, 컴퓨터 그래픽스, 데이터베이스응용및 프로그램밍, 데이터베이스, 의생명영상처리, 웹그로그래밍, 데이터마이닝, 컴퓨터구조)	2017.06.13	317
211	start-all.sh로 spark데몬 기동시 "JAVA_HOME is not set"오류 발생시 조치사항	2016.08.01	317
210	spark 2.3.0을 설치하가 위해서 parcel에 다음 url을 입력한다.	2018.07.15	315
209	프로그래밍 언어별 딥러닝 라이브러리 정리	2016.10.05	314
208	elasticsearch에서 모든 인덱스(색인)을 삭제하는 방법	2019.06.09	313
207	각 서버에 설치되는 cloudera서비스 프로그램 목록(CDH 5.14.0의 경우)	2018.03.29	313
206	federated query 예제	2017.01.19	313
205	RDF4J의 RESTFul API처리 클래스 소스 파악(web module위주)	2017.08.30	312
204	/etc/logrotate.d 을 이용한 catalina.out 나누기	2017.01.19	311
203	spark 2.0.0를 windows에서 실행시 로컬 파일을 읽을때 발생하는 오류 해결 방법	2017.01.12	311
202	pom.xml에서 build.gradle로 변환	2015.09.14	310

첫 페이지 22 23 24 25 26 27 28 29 30 31 끝 페이지

위로