Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Course Outline
소개
- 분석 및 기계 학습에서 데이터 준비의 중요성 이해
- 데이터 준비 파이프라인과 데이터 수명주기에서의 역할
- 원시 데이터의 일반적인 과제와 분석에 미치는 영향 탐색
데이터 수집 및 획득
- 데이터 소스: 데이터베이스, API, 스프레드시트, 텍스트 파일 등
- 데이터를 수집하고 수집 중 데이터 품질을 보장하는 기술
- 다양한 소스에서 데이터 수집
Data Cleaning 기술
- 누락된 값, 이상값, 불일치 식별 및 처리
- 데이터 세트의 중복 및 오류 처리
- 실제 데이터 세트 정리
데이터 변환 및 표준화
- 데이터 정규화 및 표준화 기술
- 범주형 데이터 처리: 인코딩, 비닝 및 기능 엔지니어링
- 원시 데이터를 사용 가능한 형식으로 변환
Data Integration 및 집계
- 다양한 소스의 데이터 세트 병합 및 결합
- 데이터 충돌 해결 및 데이터 유형 정렬
- 데이터 집계 및 통합 기술
Data Quality 보증
- 프로세스 전반에 걸쳐 데이터 품질과 무결성을 보장하는 방법
- 품질 검사 및 검증 절차 구현
- 데이터 품질 보증의 사례 연구 및 실제 적용
차원 축소 및 특징 선택
- 차원 축소의 필요성 이해
- PCA, 기능 선택, 축소 전략과 같은 기술
- 차원 축소 기술 구현
요약 및 다음 단계
Requirements
- 데이터 개념에 대한 기본 이해
청중
- 데이터 분석가 Database 관리자 IT 전문가
14 Hours
회원 평가 (3)
1:1 기반으로 참여하고 논의된 개념에 대한 명확성과 이해를 보장하는 능력.
Dave - Sea
Course - Data Architecture Fundamentals
Machine Translated
It's a hands-on session.
Vorraluck Sarechuer - Total Access Communication Public Company Limited (dtac)
Course - Talend Open Studio for ESB
I generally enjoyed the knowledge of the trainer.