Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Course Outline
spark.mllib: 데이터 유형, 알고리즘 및 유틸리티
- 데이터 유형
- 기본 통계
- 요약 통계
- 상관관계
- 층화 샘플링
- 가설 검정
- 스트리밍 중요성 테스트
- 랜덤 데이터 생성
- 분류 및 회귀
- 선형 모델(SVM, 로지스틱 회귀, 선형 회귀)
- 나이브 베이즈
- 결정 트리
- 나무의 앙상블(Random Forest 및 Gradient-Boosted Trees)
- 등장성 회귀
- 협력 필터링
- 교대 최소 제곱법(ALS)
- 클러스터링
- k-평균
- 가우스 혼합
- 파워 반복 클러스터링(PIC)
- 잠재 디리클레 할당(LDA)
- k-means를 이등분하다
- 스트리밍 k-means
- 차원 축소
- 특이값 분해(SVD)
- 주성분 분석(PCA)
- 특징 추출 및 변환
- 빈번한 패턴 마이닝
- FP 성장
- 협회 규칙
- 접두사스팬
- 평가 지표
- PMML 모델 내보내기
- 최적화(개발자)
- 확률적 경사 하강법
- 제한된 메모리 BFGS(L-BFGS)
spark.ml: ML 파이프라인을 위한 고급 API
- 개요: 추정기, 변압기 및 파이프라인
- 특징 추출, 변환 및 선택
- 분류 및 회귀
- 클러스터링
- 고급 주제
Requirements
다음 중 하나에 대한 지식:
- 자바
- Scala
- 파이썬
- 스파크R.
35 Hours
회원 평가 (1)
많은 실제 사례, 동일한 문제에 접근하는 다양한 방법, 때로는 현재 솔루션을 개선하는 방법이 명확하지 않은 경우도 있습니다.
Rafal - Nordea
Course - Apache Spark MLlib
Machine Translated