Jupyter for Data Science Teams 교육 과정
Jupyter는 오픈 소스, 웹 기반 대화형 IDE 및 컴퓨팅 환경입니다.
이 강사가 진행하는 실시간 교육(온라인 또는 현장)에서는 데이터 과학의 공동 개발 아이디어를 소개하고 Jupyter를 사용하여 "컴퓨팅 아이디어의 수명 주기"에서 팀으로 추적하고 참여하는 방법을 보여줍니다. Jupyter 생태계를 기반으로 샘플 데이터 과학 프로젝트를 생성하는 과정을 참가자에게 안내합니다.
이 교육이 끝나면 참가자는 다음을 수행할 수 있습니다.
- Git에서 팀 저장소 생성 및 통합을 포함하여 Jupyter를 설치하고 구성합니다.
- 확장 프로그램, 대화형 위젯, 다중 사용자 모드 등과 같은 Jupyter 기능을 사용하여 프로젝트 협업을 활성화하세요.
- 팀 구성원과 함께 Jupyter Notebook을 생성, 공유 및 구성합니다.
- Scala, Python, R 중에서 선택하여 Jupyter 인터페이스를 통해 Apache Spark과 같은 빅 데이터 시스템에 대한 코드를 작성하고 실행합니다.
코스의 형식
- 대화형 강의 및 토론.
- 많은 연습과 연습.
- 라이브 랩 환경에서 직접 구현합니다.
코스 맞춤화 옵션
- Jupyter Notebook은 R, Python, Scala, Julia 등을 포함하여 40개 이상의 언어를 지원합니다. 선택한 언어에 맞게 이 과정을 사용자 정의하려면 당사에 문의하여 예약하세요.
Course Outline
Jupyter 소개
- Jupyter와 그 생태계 개요
- 설치 및 설정
- 팀 협업을 위한 Jupyter 구성
협업 기능
- 버전 제어를 위해 Git 사용
- 확장 및 대화형 위젯
- 멀티유저 모드
노트북 만들기 및 관리
- 노트북 구조 및 기능
- 노트북 공유 및 구성
- 협업을 위한 모범 사례
Programming Jupyter를 사용하여
- 프로그래밍 언어 선택 및 사용 (Python, R, Scala)
- 코드 작성 및 실행
- 빅데이터 시스템과의 통합 (Apache Spark)
고급 Jupyter 기능
- Jupyter 환경 사용자 지정
- Jupyter를 사용하여 워크플로 자동화
- 고급 사용 사례 탐색
실습 세션
- 핸즈온 랩
- 실제 데이터 과학 프로젝트
- 그룹 연습 및 동료 평가
요약 및 다음 단계
Requirements
- Python, R, Scala 등과 같은 언어에 대한 Programming 경험.
- 데이터 과학 배경
청중
- 데이터 과학 팀
Open Training Courses require 5+ participants.
Jupyter for Data Science Teams 교육 과정 - Booking
Jupyter for Data Science Teams 교육 과정 - Enquiry
Jupyter for Data Science Teams - Consultancy Enquiry
Consultancy Enquiry
회원 평가 (1)
It is great to have the course custom made to the key areas that I have highlighted in the pre-course questionnaire. This really helps to address the questions that I have with the subject matter and to align with my learning goals.
Winnie Chan - Statistics Canada
Course - Jupyter for Data Science Teams
Upcoming Courses
Related Courses
Introduction to Data Science and AI using Python
35 Hours이것은 5 일 동안 Data Science 및 AI를 소개합니다.
이 과정은 Python 을 사용한 예제 및 연습과 함께 제공됩니다.
Apache Airflow for Data Science: Automating Machine Learning Pipelines
21 Hours대한민국에서 강사가 진행하는 이 실시간 교육(온라인 또는 현장)은 Apache Airflow를 사용하여 모델 교육, 검증 및 배포를 포함한 머신 러닝 워크플로를 자동화하고 관리하려는 중급 수준 참가자를 대상으로 합니다.
이 교육을 마치면 참가자는 다음을 수행할 수 있습니다.
- 머신 러닝 워크플로 오케스트레이션을 위해 Apache Airflow를 설정합니다.
- 데이터 전처리, 모델 학습, 검증 작업을 자동화합니다.
- Airflow를 머신 러닝 프레임워크 및 도구와 통합합니다.
- 자동화된 파이프라인을 사용하여 머신 러닝 모델을 배포합니다.
- 프로덕션 환경에서 머신 러닝 워크플로를 모니터링하고 최적화합니다.
Anaconda Ecosystem for Data Scientists
14 Hours대한민국에서 강사가 진행하는 이 라이브 교육(온라인 또는 현장)은 단일 플랫폼에서 패키지 및 데이터 분석 워크플로를 캡처, 관리, 배포하기 위해 Anaconda 에코시스템을 사용하려는 데이터 과학자를 대상으로 합니다.
이 교육을 마치면 참가자는 다음을 수행할 수 있습니다.
- Anaconda개의 구성 요소와 라이브러리를 설치하고 구성합니다.
- Anaconda의 핵심 개념, 기능 및 이점을 이해하세요.
- Anaconda Navigator를 사용하여 패키지, 환경 및 채널을 관리하세요.
- 데이터 과학 및 머신 러닝에는 Conda, R 및 Python 패키지를 사용합니다.
- 여러 데이터 환경을 관리하기 위한 몇 가지 실제 사용 사례와 기술을 알아보세요.
AWS Cloud9 for Data Science
28 Hours대한민국에서 강사가 진행하는 이 실시간 교육(온라인 또는 현장)은 AWS Cloud9를 사용하여 간소화된 데이터 과학 워크플로를 구축하려는 중급 수준의 데이터 과학자와 분석가를 대상으로 합니다.
이 교육을 마치면 참가자는 다음을 수행할 수 있습니다.
- AWS Cloud9에서 데이터 과학 환경을 설정합니다.
- Cloud9에서 Python, R, Jupyter Notebook을 이용하여 데이터 분석을 수행합니다.
- AWS Cloud9를 S3, RDS, Redshift와 같은 AWS 데이터 서비스와 통합합니다.
- AWS Cloud9를 활용하여 머신 러닝 모델을 개발하고 배포하세요.
- 데이터 분석 및 처리를 위해 클라우드 기반 워크플로를 최적화합니다.
Big Data Business Intelligence for Telecom and Communication Service Providers
35 Hours리뷰 보기
Communication의 서비스 제공 업체 (CSP)는 비용을 줄이고 사용자당 평균 수입 (ARPU)을 최대화하는 데 압박을 받고 있으며, 동시에 훌륭한 고객 경험을 보장하지만 데이터 볼륨은 계속 증가합니다. 글로벌 모바일 데이터 트래픽은 2016 년에 합성 연간 성장률 (CAGR)으로 성장하여 매월 10.8 exabytes에 도달 할 것입니다.
한편, CSP는 전화 세부 사항 기록 (CDR), 네트워크 데이터 및 고객 데이터를 포함하여 큰 양의 데이터를 생성하고 있습니다. 이 데이터를 완전히 활용하는 회사는 경쟁력있는 경계를 얻습니다. The Economist Intelligence Unit의 최근 설문 조사에 따르면 데이터 지향적 인 의사 결정을 사용하는 회사는 생산성 증가 5-6 %를 누리고 있습니다. 그럼에도 불구하고 회사의 53 %는 귀중한 데이터의 절반만 사용하고 있으며 응답자의 4 분의 1은 유용한 데이터의 엄청난 양이 실패한다고 지적했습니다. 데이터 볼륨은 너무 높아서 수동 분석은 불가능하며 대부분의 유산 소프트웨어 시스템은 유지할 수 없으며 귀중한 데이터가 무시되거나 무시됩니다.
Big Data & Analytics’ 고속, 확장 가능한 대형 데이터 소프트웨어로, CSP는 더 적은 시간 내에 더 나은 의사 결정을 위해 모든 데이터를 광산 할 수 있습니다. 다른 Big Data 제품 및 기술은 대형 데이터에 대한 인식을 수집, 준비, 분석 및 제시하기위한 최종 소프트웨어 플랫폼을 제공합니다. 응용 분야에는 네트워크 성과 모니터링, 사기 탐지, 고객 탐지 및 신용 위험 분석이 포함됩니다. Big Data & 분석 제품 스케일 데이터 테라비트를 처리하지만 이러한 도구의 구현은 클라우드 기반 데이터베이스 시스템의 새로운 유형을 필요로 Hadoop 또는 대규모 스케일 병렬 컴퓨팅 프로세서 (KPU 등)
이 과정은 Telco를위한 Big Data BI에서 작동하며 CSP가 생산성을 향상시키고 새로운 비즈니스 수입 흐름을 열기 위해 투자하는 모든 새로 나타나는 영역을 다루고 있습니다. 이 과정은 Telco에서 Big Data BI의 전체 360 학점을 제공하여 의사 결정자와 관리자가 생산성과 수익을 위해 Telco에서 Big Data BI의 가능성에 대한 매우 광범위하고 포괄적 인 통찰력을 가질 수 있도록합니다.
코스 목표
이 과정의 주요 목적은 Telecom Business의 4 분야에서 새로운 Big Data 비즈니스 인텔리전스 기술을 소개하는 것입니다 (Marketing/판매, 네트워크 운영, 금융 운영 및 고객 관계 Management). 학생들은 다음과 같이 소개됩니다 :
- 소개 Big Data-어떻게 4Vs (량, 속도, 다양성 및 진실성)에서 Big Data- 텔코 관점에서 생성, 추출 및 관리
- 어떻게 Big Data 분석은 유산 데이터 분석과 다릅니다
- 내부 정당화 Big Data -Telco 관점
- Hadoop 생태계에 대한 소개 - Hive, 돼지, SPARC와 같은 모든 Hadoop 도구에 대한 인식, 언제 그리고 어떻게 그들이 문제를 해결하는 데 사용되는지 Big Data
- 어떻게 Big Data 분석을 위해 추출되는 분석 도구-어떻게 Business Analysis’s 통증 포인트 수집 및 데이터 분석을 통합 Hadoop 다이어트 접근 방식을 통해 줄일 수 있는지
- Telco에 대한 Insight 분석, 시각화 분석 및 예측 분석의 기본 소개
- 고객 Churn 분석 및 Big Data-how Big Data 분석은 Telco 사례 연구에서 고객 Churn 및 고객 불만을 줄일 수 있습니다.
- 네트워크 실패 및 서비스 실패 분석 네트워크 메타 데이터 및 IPDR
- 금융 분석 - 사기, 납치 및 판매 및 운영 데이터에서 ROI 추정
- 고객 인수 문제-목표 마케팅, 고객 분류 및 판매 데이터의 크로스 판매
- 소개 및 모든 Big Data 분석 제품의 요약 및 그들이 Telco 분석 공간에 적합한 곳
- 결론 - 조직에 소개하기 위해 단계별 접근 방식을 취하는 방법 Big Data Business Intelligence
목표 관객
- 네트워크 운영, 금융 관리자, CRM 관리자 및 Telco CIO 사무실의 최고 IT 관리자.
- Business 텔코의 분석가
- CFO 사무실 관리자 / 분석가
- 운영 관리자
- QA 관리자
Introduction to Google Colab for Data Science
14 Hours대한민국에서 진행되는 이 실시간 교육(온라인 또는 현장)은 Google Colab을 사용하여 데이터 과학의 기초를 배우고자 하는 초급 데이터 과학자 및 IT 전문가를 대상으로 합니다.
이 교육이 끝나면 참가자는 다음을 수행할 수 있습니다.
- Google Colab을 설정하고 탐색하세요.
- 기본 Python 코드를 작성하고 실행합니다.
- 데이터 세트를 가져오고 처리합니다.
- Python 라이브러리를 사용하여 시각화를 만듭니다.
A Practical Introduction to Data Science
35 Hours이 교육을 완료한 참가자는 Data Science 및 관련 기술, 방법론, 도구에 대한 실제적이고 현실적인 이해를 얻게 됩니다.
참가자들은 실습을 통해 이 지식을 실천할 기회를 갖게 됩니다. 그룹 상호작용과 강사 피드백은 수업의 중요한 구성 요소를 구성합니다.
이 과정은 Data Science의 기본 개념 소개로 시작하여 Data Science에서 사용되는 도구와 방법론으로 진행됩니다.
청중
- 개발자
- 기술 분석가
- IT 컨설턴트
과정 형식
- 일부 강의, 일부 토론, 연습 및 집중적인 실습
메모
- 이 과정에 대한 맞춤형 교육을 요청하려면 당사에 연락하여 준비하세요.
Data Science Programme
245 Hours오늘날 세계에서 정보와 데이터의 폭발적인 증가는 비교할 수 없을 만큼 증가하고 있으며, 혁신하고 가능성의 경계를 넓히는 우리의 능력은 그 어느 때보다 빠르게 성장하고 있습니다. 데이터 과학자의 역할은 오늘날 업계 전반에 걸쳐 가장 수요가 많은 기술 중 하나입니다.
우리는 이론을 통한 학습 이상의 것을 제공합니다. 우리는 학계와 산업계의 요구 사이의 격차를 해소하는 실용적이고 시장성이 있는 기술을 제공합니다.
이 7주 커리큘럼은 귀하의 특정 산업 요구 사항에 맞게 맞춤화될 수 있습니다. 자세한 내용은 당사에 문의하거나 Nobleprog Institute 웹사이트를 방문하십시오.
청중:
이 프로그램은 졸업 후 졸업생뿐만 아니라 평가와 인터뷰를 통해 결정되는 필수 사전 필수 기술을 갖춘 모든 사람을 대상으로 합니다.
배달:
이 과정은 강사가 진행하는 강의실과 강사가 진행하는 온라인이 혼합되어 제공됩니다. 일반적으로 첫 번째 주는 '교실 주도', 2~6주차는 '가상 교실', 7주차는 다시 '교실 주도'입니다.
Data Science for Big Data Analytics
35 Hours빅 데이터는 너무 방대하고 복잡한 데이터 세트로 전통적인 데이터 처리 응용 프로그램 소프트웨어가 처리하기에 부적합합니다. 큰 데이터 문제로는 데이터 캡처, 데이터 저장, 데이터 분석, 검색, 공유, 전송, 시각화, 쿼리, 업데이트 및 정보 프라이버시가 있습니다.
Data Science essential for Marketing/Sales professionals
21 Hours이 과정은 Marketing/영업 분야의 데이터 과학 적용에 대해 더 깊이 알고 싶은 Marketing 영업 전문가를 대상으로 합니다. 이 과정에서는 "상향 판매", "교차 판매", 시장 세분화, 브랜딩 및 CLV에 사용되는 다양한 데이터 과학 기술을 자세히 다룹니다.
Marketing과 매출의 차이 - 영업과 마케팅은 어떻게 다른가요?
아주 간단하게 말하면 판매는 개인이나 소규모 그룹에 초점을 맞추거나 대상을 지정하는 프로세스라고 할 수 있습니다. 반면에 Marketing은 대규모 그룹이나 일반 대중을 대상으로 합니다. Marketing에는 연구(고객의 요구 사항 파악), 제품 개발(혁신적인 제품 생산), 제품 홍보(광고를 통한) 및 소비자 사이에서 제품에 대한 인지도 창출이 포함됩니다. 따라서 마케팅은 리드 또는 잠재 고객을 생성하는 것을 의미합니다. 제품이 시장에 출시되면 고객이 제품을 구매하도록 설득하는 것이 판매원의 임무입니다. 판매는 리드 또는 잠재 고객을 구매 및 주문으로 전환하는 것을 의미하는 반면 마케팅은 장기 목표를 목표로 하고 판매는 더 짧은 목표와 관련됩니다.
Introduction to Data Science
35 Hours이 강사 주도의 라이브 교육 (현장 또는 원격)은 Data Science 에서 경력을 시작하려는 전문가를 대상으로합니다.
이 교육이 끝나면 참가자는 다음을 수행 할 수 있습니다.
- Python 및 MySql을 설치하고 구성하십시오.
- Data Science 가 무엇이며, 거의 모든 비즈니스에 가치를 추가 할 수있는 방법을 이해하십시오.
- Python 코딩의 기초를 배우십시오
- 감독 및 감독되지 않은 Machine Learning 기술과이를 구현하고 결과를 해석하는 방법을 배웁니다.
코스의 형식
- 대화식 강의 및 토론.
- 많은 연습과 연습.
- 라이브 랩 환경에서 실습 구현.
코스 사용자 정의 옵션
- 이 과정에 대한 맞춤형 교육을 요청하려면 저희에게 연락하여 준비하십시오.
Kaggle
14 Hours대한민국에서 강사가 진행하는 이 실시간 교육(온라인 또는 현장)은 Kaggle을 사용하여 Data Science에서 학습하고 경력을 쌓고자 하는 데이터 과학자와 개발자를 대상으로 합니다.
이 교육을 마치면 참가자는 다음을 수행할 수 있습니다.
- 데이터 과학과 머신러닝에 대해 알아보세요.
- 데이터 분석을 살펴보세요.
- Kaggle에 대해 알아보고 작동 방식을 알아보세요.
Data Science with KNIME Analytics Platform
21 HoursKNIME 애널리즘 플랫폼은 데이터 기반 혁신을위한 선도적 인 오픈 소스 옵션으로, 데이터에 숨겨진 잠재력을 발견하는 데 도움이되며, 신선한 인식을위한 광산 또는 새로운 미래를 예측합니다. 1000 개 이상의 모듈, 수백 개의 준비된 예제, 통합 도구의 포괄적 인 범위, 그리고 사용 가능한 최첨단 알고리즘의 가장 광범위한 선택으로 KNIME 분석 플랫폼은 모든 데이터 과학자 및 비즈니스 분석가를위한 완벽한 도구 상자입니다.
KNIME 분석 플랫폼을위한이 과정은 초보자, 고급 사용자 및 KNIME 전문가를 소개 할 수있는 이상적인 기회입니다 KNIME, 그것을 더 효과적으로 사용하는 방법을 배우고 KNIME 작업 흐름을 기반으로 명확하고 포괄적 인 보고서를 만드는 방법
이 강사가 이끄는 라이브 훈련 (온라인 또는 온라인)은 복잡한 비즈니스 요구를 해결하기 위해 KNIME 사용하고자하는 데이터 전문가를 대상으로합니다.
그것은 프로그래밍을 모르고 분석 시나리오를 구현하기 위해 최첨단 도구를 사용하려는 관객을 대상으로합니다.
이 훈련이 끝나면 참가자는 다음을 할 수 있습니다 :
- 설치 및 설정 KNIME
- 창작 Data Science 시나리오
- 트레인, 테스트 및 검증 모델
- 데이터 과학 모델의 최종 가치 체인에 대한 구현
코스의 형식
- 인터랙티브 강의 및 토론
- 많은 연습과 연습이 있습니다.
- 라이브 실험실 환경에서 핸드-온 구현.
코스 Customization 옵션
- 이 과정에 대한 사용자 지정 훈련을 요청하거나 이 프로그램에 대해 자세히 알아보려면 저희에게 연락하여 배치하십시오.
Accelerating Python Pandas Workflows with Modin
14 Hours대한민국에서 강사가 진행하는 이 실시간 교육(온라인 또는 현장)은 Modin을 사용하여 Pandas를 통해 더 빠른 데이터 분석을 위한 병렬 계산을 구축하고 구현하려는 데이터 과학자와 개발자를 대상으로 합니다.
이 교육을 마치면 참가자는 다음을 수행할 수 있습니다.
- Modin을 사용하여 대규모로 Pandas 워크플로 개발을 시작하는 데 필요한 환경을 설정하세요.
- Modin의 기능, 아키텍처 및 장점을 이해하세요.
- Modin, Dask, Ray의 차이점을 알아보세요.
- Modin을 사용하여 Pandas개의 작업을 더 빠르게 수행하십시오.
- 전체 Pandas API 및 기능을 구현합니다.
GPU Data Science with NVIDIA RAPIDS
14 Hours대한민국에서 진행되는 이 실시간 교육(온라인 또는 현장)은 RAPIDS를 사용하여 GPU 가속화된 데이터 파이프라인, 워크플로 및 시각화를 구축하고 기계 학습 알고리즘을 적용하려는 데이터 과학자 및 개발자를 대상으로 합니다. XGBoost, cuML 등과 같은
이 교육이 끝나면 참가자는 다음을 수행할 수 있습니다.
- NVIDIA를 사용하여 데이터 모델을 구축하는 데 필요한 개발 환경을 설정합니다RAPIDS.
- RAPIDS의 기능, 구성 요소 및 장점을 이해합니다.
- GPU을 활용하여 엔드투엔드 데이터 및 분석 파이프라인을 가속화하세요.
- cuDF 및 Apache Arrow을 사용하여 GPU 가속 데이터 준비 및 ETL을 구현합니다.
- XGBoost 및 cuML 알고리즘을 사용하여 기계 학습 작업을 수행하는 방법을 알아보세요.
- cuXfilter 및 cuGraph를 사용하여 데이터 시각화를 구축하고 그래프 분석을 실행하세요.