Course Outline

Data Analysis 및 Big Data 소개

  • Big Data "큰" 것은 무엇입니까?
    • 속도, 볼륨, 다양성, 진실성(VVVV)
  • 기존 데이터 처리의 한계
  • 분산 처리
  • 통계 분석
  • Machine Learning 분석 유형
  • Data Visualization

Big Data 역할 및 책임

  • 관리자
  • 개발자
  • 데이터 분석가

Languages 에 사용됨 Data Analysis

  • R Language
    • Data Analysis의 경우 왜 R인가요?
    • 데이터 조작, 계산 및 그래픽 표시
  • Python
    • 왜 Data Analysis에 대해 Python인가요?
    • 데이터 조작, 처리, 정리 및 분석

Data Analysis에 대한 접근 방식

  • 통계 분석
    • 시계열 분석
    • Forecasting 상관관계 및 회귀 모델을 사용하여
    • 추론Statistics (추정)
    • Big Data 세트의 설명적 Statistics (예: 평균 계산)
  • Machine Learning
    • 지도 학습과 비지도 학습
    • 분류 및 클러스터링
    • 특정 방법의 비용 추정
    • 필터링
  • 자연어 처리
    • 텍스트 처리
    • 텍스트의 의미 이해
    • 자동 텍스트 생성
    • 감정 분석 / 주제 분석
  • Computer Vision
    • 이미지 획득, 처리, 분석 및 이해
    • 3D 장면 재구성, 해석 및 이해
    • 이미지 데이터를 사용하여 의사 결정하기

Big Data 인프라

  • 데이터 저장
    • 관계형 데이터베이스(SQL)
      • MySQL
      • 포스트그레스
      • Oracle
    • 비관계형 데이터베이스(NoSQL)
      • Cassandra
      • MongoDB
      • Neo4j초
    • 뉘앙스를 이해하다
      • 계층형 데이터베이스
      • 객체 지향 데이터베이스
      • 문서 지향 데이터베이스
      • 그래프 지향 데이터베이스
      • 다른
  • 분산 처리
    • Hadoop
      • 분산 파일 시스템으로서의 HDFS
      • 분산 처리를 위한 MapReduce
    • 불꽃
      • 대규모 데이터 처리를 위한 올인원 인메모리 클러스터 컴퓨팅 프레임워크
      • 구조화된 스트리밍
      • 스파크SQL
      • Machine Learning 라이브러리: MLlib
      • GraphX를 사용한 그래프 처리
  • Scala능력
    • 퍼블릭 클라우드
      • AWS, Google, Aliyun 등
    • 프라이빗 클라우드
      • OpenStack, Cloud Foundry 등.
    • 자동 확장성

문제에 대한 올바른 솔루션 선택

Big Data의 미래

요약 및 다음 단계

Requirements

  • 수학에 대한 일반적인 이해
  • 프로그래밍에 대한 일반적인 이해
  • 데이터베이스에 대한 일반적인 이해

청중

  • 개발자/프로그래머
  • IT 컨설턴트
 35 Hours

Number of participants


Price per participant

회원 평가 (7)

Upcoming Courses

Related Categories