Course Outline

spark.mllib: 데이터 유형, 알고리즘 및 유틸리티

  • 데이터 유형
  • 기본 통계
    • 요약 통계
    • 상관관계
    • 층화 샘플링
    • 가설 검정
    • 스트리밍 중요성 테스트
    • 랜덤 데이터 생성
  • 분류 및 회귀
    • 선형 모델(SVM, 로지스틱 회귀, 선형 회귀)
    • 나이브 베이즈
    • 결정 트리
    • 나무의 앙상블(Random Forest 및 Gradient-Boosted Trees)
    • 등장성 회귀
  • 협력 필터링
    • 교대 최소 제곱법(ALS)
  • 클러스터링
    • k-평균
    • 가우스 혼합
    • 파워 반복 클러스터링(PIC)
    • 잠재 디리클레 할당(LDA)
    • k-means를 이등분하다
    • 스트리밍 k-means
  • 차원 축소
    • 특이값 분해(SVD)
    • 주성분 분석(PCA)
  • 특징 추출 및 변환
  • 빈번한 패턴 마이닝
    • FP 성장
    • 협회 규칙
    • 접두사스팬
  • 평가 지표
  • PMML 모델 내보내기
  • 최적화(개발자)
    • 확률적 경사 하강법
    • 제한된 메모리 BFGS(L-BFGS)

spark.ml: ML 파이프라인을 위한 고급 API

  • 개요: 추정기, 변압기 및 파이프라인
  • 특징 추출, 변환 및 선택
  • 분류 및 회귀
  • 클러스터링
  • 고급 주제

Requirements

다음 중 하나에 대한 지식:

  • 자바
  • Scala
  • 파이썬
  • 스파크R.
 35 Hours

Number of participants


Price per participant

회원 평가 (1)

Upcoming Courses

Related Categories