Course Outline

I. 서론 및 서론

1. 개요

  • R을 보다 친근하게 만들기, R 및 사용 가능한 GUI
  • 알스튜디오
  • 관련 소프트웨어 및 문서
  • R과 통계
  • R을 대화형으로 사용하기
  • 소개 세션
  • 기능 및 특징에 대한 도움말 받기
  • R 명령어, 대소문자 구분 등
  • 이전 명령의 회수 및 수정
  • 파일에서 명령 실행 또는 출력 전환
  • 데이터 영구성 및 객체 제거
  • Good 프로그래밍 연습: 독립형 스크립트, 좋은 가독성 예: 구조화된 스크립트, 문서, 마크다운
  • 패키지 설치; CRAN 및 Bioconductor

2. 데이터 읽기

  • Txt 파일(read.delim)
  • CSV 파일

3. 간단한 조작; 숫자와 벡터 + 배열

  • 벡터와 할당
  • 벡터 산술
  • 정기적인 시퀀스 생성
  • 논리 벡터
  • 누락된 값
  • 문자 벡터
  • 인덱스 벡터; 데이터 세트의 하위 세트 선택 및 수정
    • 배열
  • 배열 인덱싱. 배열의 하위 섹션
  • 인덱스 매트릭스
  • array() 함수 + 배열에 대한 간단한 연산(예: 곱셈, 전치)
  • 다른 유형의 객체

4. 리스트와 데이터 프레임

  • 기울기
  • 목록 구성 및 수정
    • 목록 연결
  • 데이터 프레임
    • 데이터 프레임 만들기
    • 데이터 프레임 작업
    • 임의의 목록 첨부
    • 검색 경로 관리

5. 데이터 조작

  • 관찰 및 변수 선택, 하위 설정
  • 필터링, 그룹화
  • 재코딩, 변형
  • 집계, 데이터 세트 결합
  • 분할 행렬 형성, cbind() 및 rbind()
  • 배열을 사용한 연결 함수 ()
  • 문자 조작, stringr 패키지
  • grep과 regexpr에 대한 간단한 소개

6. 데이터 읽기에 대한 추가 정보

  • XLS, XLSX 파일
  • readr 및 readxl 패키지
  • SPSS, SAS, Stata,… 및 기타 형식의 데이터
  • 데이터를 txt, csv 및 기타 형식으로 내보내기

6. 그룹화, 루프 및 조건 실행

  • 그룹화된 표현
  • 제어문
  • 조건 실행: if 문
  • 반복 실행: for 루프, repeat 및 while
  • apply, lapply, sapply, tapply 소개

7. 기능

  • 함수 생성
  • 선택 인수 및 기본값
  • 가변 개수의 인수
  • 범위와 그 결과

8. R에서의 간단한 그래픽

  • 그래프 만들기
  • 밀도 플롯
  • 점 플롯
  • 막대 그래프
  • 선형 차트
  • 파이 차트
  • 상자 그림
  • 산점도
  • 플롯 결합

II. R에서의 통계 분석

1. 확률 분포

  • 통계 표의 집합으로서의 R
  • 데이터 집합의 분포를 조사하다

2. 가설 검정

  • 모집단 평균에 대한 테스트
  • 우도비 검정
  • 1개 및 2개 샘플 테스트
  • 카이제곱 Go적합도 검정
  • 콜모고로프-스미르노프 1-샘플 통계
  • 윌콕슨 부호 순위 테스트
  • 2-샘플 테스트
  • 윌콕슨 순위 합 검정
  • 맨-휘트니 테스트
  • 콜모고로프-스미르노프 테스트

3. 가설의 다중 검정

  • 1종 오류와 FDR
  • ROC 곡선 및 AUC
  • 다중 테스트 절차(BH, Bonferroni 등)

4. 선형 회귀 모델

  • 모델 정보 추출을 위한 일반 함수
  • 적합 모델 업데이트
  • 일반화 선형 모델
    • 가족
    • glm() 함수
  • 분류
    • 로지스틱 회귀
    • 선형 판별 분석
  • 비지도 학습
    • 주성분 분석
    • 클러스터링 방법(k-means, hierarchical clustering, k-medoids)

5. 생존 분석(생존 패키지)

  • r의 생존 객체
  • Kaplan-Meier 추정, log-rank 검정, 모수 회귀
  • 자신감 밴드
  • 검열(간격 검열) 데이터 분석
  • Cox PH 모델, 상수 공변량
  • Cox PH 모델, 시간 종속 공변량
  • 시뮬레이션: 모델 비교(회귀 모델 비교)

6. 분산 분석

  • 일원배치 분산분석
  • ANOVA의 이원 분류
  • 마노바

III. 생물정보학에서 해결된 문제

  • limma 패키지에 대한 간략한 소개
  • 마이크로어레이 데이터 분석 워크플로
  • GEO에서 데이터 다운로드: https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1397
  • 데이터 처리(QC, 정규화, 차등 표현)
  • 화산 플롯
  • 고객 사례 + 히트맵
 28 Hours

Number of participants


Price per participant

회원 평가 (5)

Upcoming Courses

Related Categories