
Microsoft R을 활용한 빅데이터 분석
교육과정명 | ![]() |
|
---|---|---|
코스 No | 20773 | |
교육비 | 금액 | 1,340,000원 |
바우처 | 9일 | |
교육기간 | 2021-01-19(화)~2021-01-22(금) | |
교육시간 | 28시간 | |
교육일수 | 4일 |
과정 개요 |
Microsoft R 서버를 통해 기존에 존재하고 있는 데이터들을 쉽고 강력하게 R의 빅데이터 분석 기능과 연결하고 SQL Server, Hadoop,
Spark와 같은 빅데이터 환경에 배포하는 방법을 습득할 수 있는 교육입니다.
교육 대상 |
- 빅데이터 환경에서 데이터 분석을 수행하고 싶은 담당자
- 자신의 솔루션에 R을 활용한 데이터 분석을 도입하고 싶은 담당자
과정 목표 |
- Microsoft R Server와 Microsoft R Client가 어떻게 작동하는 지 이해하게 되며, 상이한 Data Store에 담긴 빅데이터를 탐색하는 데
R Client와 R Server를 사용할 수 있게 됩니다.
- 분석 작업을 병렬로 처리하도록 데이터를 분할할 수 있게 됩니다.
- 빅데이터로 회귀모델을 생성하고 성능을 평가할 수 있으며, 분할 모델을 만들고 배포할 수 있게 됩니다.
- SQL Server와 Hadoop 환경에서 R을 사용할 수 있게 됩니다.
교육일차 |
모듈 |
커리큘럼 |
1일차 |
모듈1 |
Microsoft R Server와 R Client
- Microsoft R Server 란
- Microsoft R Client 활용
- ScaleR 기능들 |
모듈2 |
빅데이터 탐색
- ScaleR 데이터 소스 이해
- XDF object를 이용해 데이터 읽기
- XDF object를 이용해 데이터 요약 | |
2일차 |
모듈3 |
빅데이터 시각화
- 인 메모리 데이터 시각화
- 빅데이터 시각화 |
모듈4 |
빅데이터 처리
- 빅 데이터 변형
- 대량의 데이터셋 관리 | |
3일차
|
모듈5 |
병렬 분석 연산
- rxExec와 함께 RxLocalParallel 계산 컨텍스트 사용
- revoPemaR 패키지 사용 |
모듈6 |
회귀 모델의 생성 및 평가
- 빅 데이터 클러스터링
- 회귀 모델 생성 및 예측 | |
4일차 |
모듈7 |
분할 모델의 생성 및 평가
- 의사결정트리(decision trees)에 기반해 분할 모델 생성
- 예측 생성 및 비교를 통해 분할 모델 테스트 |
모듈8 |
Hadoop SQL Server와 Hadoop SQL 서버를 통한 빅데이터 처리
- SQL Server에서 R 사용
- Hadoop Map/Reduce 사용
- Hadoop Spark 사용
|