메뉴 건너뛰기

Cloudera, BigData, Semantic IoT, Hadoop, NoSQL

Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.


import org.apache.spark.sql.SparkSession

object AccountsByState {
  def main(args: Array[String]) {
    if (args.length < 1) {
      System.err.println("Usage: stubs.AccountByState <state-code>")
      System.exit(1)
    }

    val stateCode = args(0)
    val spark = SparkSession.builder.getOrCreate()

    val accountsDF = spark.read.table("accounts")
    val stateAccountsDF = accountsDF.where(accountsDF("state") === stateCode)
    stateAccountsDF.write.mode("overwrite").save("/loudacre/accounts_by_state/"+stateCode)

    spark.stop

  }
}

번호 제목 날짜 조회 수
277 https용 인증서 발급 명령문 예시및 오류 메세지 2018.01.24 6857
276 Hadoop의 Datanode를 Decommission하고 나서 HBase의 regionservers파일에 해당 노드명을 지웠는데 여전히 "Dead regionser"로 표시되는 경우 처리 2018.01.25 4918
275 Could not compute split, block input-0-1517397051800 not found형태의 오류가 발생시 조치방법 2018.02.01 5535
274 spark-submit 실행시 "java.lang.OutOfMemoryError: Java heap space"발생시 조치사항 2018.02.01 5523
273 프로세스를 확인해서 프로세스를 삭제하는 shell script예제(cryptonight) 2018.02.02 4437
272 fuseki의 endpoint를 이용한 insert, delete하는 sparql예시 2018.02.14 3188
» scala application 샘플소스(SparkSession이용) 2018.03.07 6249
270 Scala를 이용한 Streaming예제 2018.03.08 4926
269 Scala에서 countByWindow를 이용하기(예제) 2018.03.08 5694
268 이미지 관리 오픈소스 목록 2018.03.11 4346
267 update 샘플 2018.03.12 5372
266 에러 추적(Error Tracking) 및 로그 취합(logging aggregation) 시스템인 Sentry 설치 2018.03.14 3537
265 자주쓰는 유용한 프로그램 2018.03.16 6049
264 HA(Namenode, ResourceManager, Kerberos) 및 보안(Zookeeper, Hadoop) 2018.03.16 3533
263 hadoop 클러스터 실행 스크립트 정리 2018.03.20 5847
262 HDFS Balancer설정및 수행 2018.03.21 3877
261 Components of the Impala Server 2018.03.21 3958
260 [CentOS] 네트워크 설정 2018.03.26 4086
259 cloudera-scm-agent 설정파일 위치및 재시작 명령문 2018.03.29 4808
258 Cloudera가 사용하는 서비스별 디렉토리 2018.03.29 4255
위로