Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Course Outline
소개
- Spark 개요 및 Hadoop 기능 및 아키텍처
- 빅데이터 이해
- Python 프로그래밍 기초
시작하기
- Python, Spark 및 Hadoop 설정
- Python의 데이터 구조 이해
- PySpark API 이해
- HDFS 및 MapReduce 이해
Spark와 Hadoop을 Python와 통합
- Python에서 Spark RDD 구현
- MapReduce를 사용하여 데이터 처리
- HDFS에서 분산 데이터세트 생성
Machine Learning Spark MLlib 사용
Spark Streaming로 Big Data 처리 중
추천 시스템 작업
Kafka, Sqoop, Kafka 및 Flume을 사용한 작업
Spark 및 Hadoop을 사용하는 Apache Mahout
문제 해결
요약 및 다음 단계
Requirements
- Spark 및 경험 Hadoop
- Python 프로그래밍 경험
청중
- 데이터 과학자
- 개발자
21 Hours
회원 평가 (3)
The fact that we were able to take with us most of the information/course/presentation/exercises done, so that we can look over them and perhaps redo what we didint understand first time or improve what we already did.
Raul Mihail Rat - Accenture Industrial SS
Course - Python, Spark, and Hadoop for Big Data
I liked that it managed to lay the foundations of the topic and go to some quite advanced exercises. Also provided easy ways to write/test the code.
Ionut Goga - Accenture Industrial SS
Course - Python, Spark, and Hadoop for Big Data
The live examples