Course Outline

소개

  • Data Science 프로세스
  • 데이터 과학자의 역할과 책임

개발 환경 준비

  • 라이브러리, 프레임워크, 언어 및 도구
  • 지역 개발
  • 협력적인 웹 기반 개발

데이터 수집

  • 다양한 유형의 데이터
    • 구조화된
      • 로컬 데이터베이스
      • Database 커넥터
      • 일반적인 형식: xlxs, XML, Json, csv, ...
    • 비구조화된
      • 클릭, 검열, 스마트폰
      • 아피스
      • Internet of Things (IoT)
      • 문서, 사진, 영상, 사운드
  • 사례 연구: 대량의 비정형 데이터를 지속적으로 수집

데이터 저장

  • 관계형 데이터베이스
  • 비관계형 데이터베이스
  • Hadoop: 분산 파일 시스템(HDFS)
  • Spark: 탄력적인 분산 데이터 세트(RDD)
  • 클라우드 스토리지

데이터 준비

  • 섭취, 선택, 정화 및 변환
  • 데이터 품질 보장 - 정확성, 의미성 및 보안
  • 예외 보고서

Languages 제조, 처리 및 분석에 사용됨

  • R 언어
    • R 소개
    • 데이터 조작, 계산 및 그래픽 표시
  • Python
    • Python 소개
    • 데이터 조작, 처리, 정리 및 분석

데이터 분석

  • 탐색 분석
    • 기본 통계
    • 초안 시각화
    • 데이터를 이해하다
  • 인과관계
  • 특징 및 변형
  • Machine Learning
    • 감독받는 vs 감독받지 않는
    • 어떤 모델을 언제 사용해야 하나요?
  • Natural Language Processing (NLP)

Data Visualization

  • 모범 사례
  • 적절한 데이터에 적합한 차트 선택
  • 색상 팔레트
  • 다음 단계로 넘어가기
    • 대시보드
    • 대화형 시각화
  • 데이터를 활용한 스토리텔링

요약 및 결론

Requirements

  • 데이터베이스 개념에 대한 일반적인 이해
  • 통계에 대한 기본 이해
 35 Hours

Number of participants


Price per participant

회원 평가 (4)

Upcoming Courses

Related Categories