Course Outline
- Machine Learning 소개
- 기계 학습 유형 - 지도 학습과 비지도 학습
- 통계학습에서 머신러닝까지
- Data Mining 작업 흐름:
- Business 이해
- 데이터 이해
- 데이터 준비
- 모델링
- 평가
- 전개
- 기계 학습 알고리즘
- 문제에 적합한 알고리즘 선택
- ML의 과적합 및 편향-분산 절충
- ML 라이브러리 및 프로그래밍 언어
- 프로그래밍 언어를 사용하는 이유
- R과 Python 중에서 선택
- Python 집중 코스
- Python 리소스
- Python 머신러닝을 위한 라이브러리
- Jupyter Notebook 및 대화형 코딩
- ML 알고리즘 테스트
- 일반화 및 과적합
- 과적합 방지
- 홀드아웃 방법
- 교차 검증
- Bootstrap핑
- 수치 예측 평가
- 정확도 측정: ME, MSE, RMSE, MAPE
- 매개변수 및 예측 안정성
- 분류 알고리즘 평가
- 정확성과 그 문제점
- 혼동 행렬
- 불균형 클래스 문제
- 모델 성능 시각화
- 이익곡선
- ROC 곡선
- 리프트 곡선
- 모델 선택
- 모델 튜닝 - 그리드 검색 전략
- Python의 예
- 데이터 준비
- 데이터 가져오기 및 저장
- 데이터 이해 - 기본 탐색
- Pandas 라이브러리를 사용한 데이터 조작
- 데이터 변환 – 데이터 랭글링
- 탐색적 분석
- 누락된 관찰 – 탐지 및 솔루션
- 이상치 – 탐지 및 전략
- 표준화, 정규화, 이진화
- 정성적 데이터 기록
- Python의 예
- 분류
- 이진 분류와 다중 클래스 분류
- 수학 함수를 통한 분류
- 선형 판별 함수
- 이차 판별 함수
- 로지스틱 회귀 및 확률 접근법
- k-최근접 이웃
- 나이브 베이즈
- 의사결정 트리
- 카트
- 배깅
- Random Forest
- 부스팅
- Xgboost
- 벡터 머신 및 커널 지원
- 최대 마진 분류기
- 지원 벡터 머신
- 앙상블 학습
- Python의 예
- 회귀 및 수치 예측
- 최소제곱 추정
- 변수 선택 기술
- 정규화 및 안정성 - L1, L2
- 비선형성 및 일반화된 최소 제곱
- 다항식 회귀
- 회귀 스플라인
- 회귀 트리
- Python의 예
- 비지도 학습
- 클러스터링
- 중심 기반 클러스터링 – k-평균, k-medoids, PAM, CLARA
- 계층적 클러스터링 – Diana, Agnes
- 모델 기반 클러스터링 - EM
- 자체 구성 지도
- 클러스터 평가 및 평가
- 차원성 감소
- 주성분 분석 및 요인 분석
- 특이값 분해
- 다차원척도법
- Python의 예
- 클러스터링
- 텍스트 마이닝
- 데이터 전처리
- 단어주머니 모델
- 형태소 분석 및 레미화
- 단어 빈도 분석
- 감성분석
- 단어 구름 만들기
- Python의 예
- 추천 엔진 및 협업 필터링
- 추천 데이터
- 사용자 기반 협업 필터링
- 항목 기반 협업 필터링
- Python의 예
- 연관 패턴 마이닝
- 빈번한 항목 집합 알고리즘
- 시장 바구니 분석
- Python의 예
- 이상치 분석
- 극단값 분석
- 거리 기반 이상치 감지
- 밀도 기반 방법
- 고차원 이상치 탐지
- Python의 예
- Machine Learning 사례 연구
- Business 문제 이해
- 데이터 전처리
- 알고리즘 선택 및 튜닝
- 결과 평가
- 전개
Requirements
Machine Learning 기본 사항에 대한 지식 및 인식
회원 평가 (3)
Even with having to miss a day due to customer meetings, I feel I have a much clearer understanding of the processes and techniques used in Machine Learning and when I would use one approach over another. Our challenge now is to practice what we have learned and start to apply it to our problem domain
Richard Blewett - Rock Solid Knowledge Ltd
Course - Machine Learning – Data science
I like that training was focused on examples and coding. I thought that it is impossible to pack so much content into three days of training, but I was wrong. Training covered many topics and everything was done in a very detailed manner (especially tuning of model's parameters - I didn't expected that there will be a time for this and I was gratly surprised).
Bartosz Rosiek - GE Medical Systems Polska Sp. Zoo
Course - Machine Learning – Data science
It is showing many methods with pre prepared scripts- very nicely prepared materials & easy to traceback