Course Outline

Big Data 개요:

  • Big Data 이란 무엇입니까?
  • Big Data이 인기를 얻고 있는 이유는 무엇입니까?
  • Big Data 사례 연구
  • Big Data 특징
  • Big Data에 대한 작업 솔루션.

Hadoop & 그 구성 요소:

  • Hadoop는 무엇이고 그 구성 요소는 무엇입니까?
  • Hadoop Data를 처리/프로세스할 수 있는 구조와 그 특징.
  • Hadoop 역사, 이를 사용하는 회사 및 이를 사용하기 시작한 이유에 대한 간략한 설명.
  • Hadoop 프레임워크 및 구성 요소 - 자세히 설명합니다.
  • HDFS 및 Hadoop 분산 파일 시스템에 대한 읽기-쓰기란 무엇입니까?
  • Hadoop 클러스터를 다양한 모드로 설정하는 방법 - 독립형/가상/다중 노드 클러스터.

(여기에는 VirtualBox/KVM/VMware에 Hadoop 클러스터 설정, 주의 깊게 살펴봐야 할 네트워크 구성, Hadoop 데몬 실행 및 클러스터 테스트가 포함됩니다.)

  • Map Reduce 프레임워크는 무엇이고 어떻게 작동하는지 알아보세요.
  • Hadoop 클러스터에서 Map Reduce 작업을 실행합니다.
  • Hadoop 클러스터 컨텍스트에서 복제, 미러링 및 랙 인식 이해.

Hadoop 클러스터 계획:

  • Hadoop 클러스터를 계획하는 방법.
  • Hadoop 클러스터를 계획하기 위해 하드웨어와 소프트웨어를 이해합니다.
  • 작업 부하를 이해하고 클러스터를 계획하여 실패를 방지하고 최적의 성과를 달성합니다.

MapR이란 무엇이고 왜 MapR인가?

  • MapR과 아키텍처에 대한 개요입니다.
  • MapR 제어 시스템, MapR 볼륨, 스냅샷 및 미러에 대한 이해와 작동.
  • MapR 컨텍스트에서 클러스터 계획.
  • MapR과 다른 배포판 및 Apache의 비교Hadoop.
  • MapR 설치 및 클러스터 배포.

클러스터 설정 및 관리:

  • 서비스, 노드, 스냅샷, 미러 볼륨 및 원격 클러스터를 관리합니다.
  • 노드를 이해하고 관리합니다.
  • Hadoop 구성 요소 이해, MapR 서비스와 함께 Hadoop 구성 요소 설치.
  • Access NFS를 통한 클러스터의 데이터 관리 서비스 및 노드 관리.
  • 볼륨을 사용한 데이터 관리, 사용자 및 그룹 관리, 노드에 대한 역할 관리 및 할당, 노드 시운전 및 해체, 클러스터 관리 및 성능 모니터링, 성능 모니터링을 위한 메트릭 구성/분석 및 모니터링, MapR 보안 구성 및 관리.
  • M7을 이해하고 사용하기 - MapR 테이블을 위한 네이티브 스토리지.
  • 최적의 성능을 위한 클러스터 구성 및 튜닝.

클러스터 업그레이드 및 다른 설정과의 통합:

  • MapR 소프트웨어 버전 업그레이드 및 업그레이드 유형.
  • HDFS 클러스터에 액세스하기 위해 Mapr 클러스터를 구성합니다.
  • Amazon Elastic Mapreduce에 MapR 클러스터 설정.

위의 모든 주제에는 학습자가 기술을 직접 경험할 수 있는 시연 및 연습 세션이 포함되어 있습니다.

Requirements

  • LinuxFS의 기본 지식
  • 기본Java
  • Apache에 대한 지식 Hadoop (권장)
 28 Hours

Number of participants


Price per participant

회원 평가 (1)

Upcoming Courses

Related Categories