한국생산성본부

최근 검색어
인기 검색어
닫기

교육

지수

자격인증

접기/펴기

하둡기반의 빅데이터 처리기술 실무

교육상세 옵션정보
교육일정
 
교육시간 4일, 28시간 / [월~목] 09:30~17:30
교육장소 한국생산성본부 7층 705호
고용보험 고용보험 비환급 ?
교육비
정상가 800,000 원 1사2인 이상시 1인당 760,000 원 KPC 유료법인회원 720,000 원
교육문의 T. 02-724-1228 / F. 02-724-1875 / jekim@kpc.or.kr
 

교육시간

[월~목] 09:30~17:30




교육목적/특징

■ 하둡(HDFS,YARN, MapReduce) 및 하둡 에코시스템(Pig,Hive,Zookeepr 등)의 작동 원리와 아키텍처 이해
■ 하둡기반의 빅데이터 플랫폼의 구조 이해
■ 수집/저장/처리/분석/시각화의 각 단계별 분산 시스템 이해 및 실무 적용
■ 대화형 분석 기술인 Spark, 분산수집 기술 Kafka, 실시간검색 솔루션 ELKStack의 개념 및 구조 이해




교육대상

■ 하둡과 Hive 등의 하둡 에코시스템을 이용해 데이터 수집/저장/처리/분석을 하고 싶은 분
■ 빅데이터 분석 및 처리 도구에 관심 있는 분
■ 하둡, Spark, R 등 빅데이터 플랫폼 기반의 분석 절차와 방법에 관심 있는 분




교육내용

일자별 교육내용을 나타낸 표입니다.

일자

내용

1일차

[Module 01] BigData Platform with Hadoop EcoSystem (이론 100%)

[Phase 01] Meet Hadoop
- 하둡을 중심으로한 빅데이터 플랫폼의 이해
- 하둡 및 하둡 에코시스템 개요

[Phase 02] HDFS와 MapReduce
- HDFS : 분산파일시스템의 이해
- MapReduce : 분산병렬처리의 이해

[Phase 03] 빅데이터 플랫폼 아키텍처
- 빅데이터 플랫폼 설계 방안
- H/W와 N/W 인프라 구성 및 설계

2일차

[Module 02] Apache Hadoop Install (이론 20% / 실습 80%)

[Phase 04] 하둡 설치 실습
- Virtual Box를 이용한 가상화 환경 구축
- 가상 머신 3대 생성
- 하둡클러스터 매니저 YARN 개요

[Phase 05] 완전분산모드 Apache Hadoop 설치
- 네트워크 설정, Tarball 다운로드, SSH 인증
- 하둡 설정, 하둡 설치, HDFS Format, 서비스 시작/종료

3일차

[Module 03] 하둡에코시스템 (이론 80% / 실습 20%)

[Phase 06] Hive DataWarehouse
- Hive의 이해
- Hcatalog의 이해
- SQL On Hadoop 기술의 이해

[Phase 07] In-Memory Spark
- 인메모리 데이터 처리 및 분석 도구인 Spark 이해
- Spark 아키텍처
- Spark를 이용한 다양한 대용량 데이터 처리 및 분석 방법

4일차

[Module 04] 하둡의 활용 (이론 20% / 실습 80%)

[Phase 08] 하둡 활용 사례
- 국내 공공기관과 기업의 하둡 플랫폼 활용 사례 연구

[Phase 09] 실시간 처리 및 분석 시스템
- ELK Stack의 이해

[Phase 10] 미니 프로젝트
- HDFS, MapReduce, Hive, Spark, SQL On Hadoop, Sqoop을 이용하여 데이터 수집, 저장, 처리, 분석, 서비스의 전과정을 미니 프로젝트 방법으로 실습

* 본 교육과정은 개강일 기준으로 약 7일 전 개강 여부를 확정하며,
최소한의 수강생이 모이지 않을 경우 폐강될 수도 있음을 알려드립니다.
(수강신청 완료자분들을 대상으로 개강일 기준 약 7일 전 문자/메일로 안내드리고 있습니다.)

 

수강후기

연관 자격

자격증명 자격증관련링크

하둡기반의 빅데이터 처리기술 실무

2022-05-23~2022-05-26

 
한국생산성본부

슬기로운 직장생활을 위한 한국생산성본부 교육과정 상세 안내

과정명 : 하둡기반의 빅데이터 처리기술 실무

교육일정 2022-05-23 ~ 2022-05-26 교육시간 09:30 : 17:30 교육장소 한국생산성본부 7층 705호
교육비 지원 고용보험 비환급 담당자 T. 02-724-1228 / F. 02-724-1875 / jekim@kpc.or.kr

교육비

정상가 1사2인 이상시 1인당 KPC회원(일반,특별)
800,000원 760,000원 720,000원

※ 2일이하 과정은 산업인력공단 실시신고 등록마감으로 인해 훈련 개시 1일전(근무일기준) 18:00까지 신청할 수 있습니다.

상세안내

교육시간

[월~목] 09:30~17:30

교육목적/특징

■ 하둡(HDFS,YARN, MapReduce) 및 하둡 에코시스템(Pig,Hive,Zookeepr 등)의 작동 원리와 아키텍처 이해
■ 하둡기반의 빅데이터 플랫폼의 구조 이해
■ 수집/저장/처리/분석/시각화의 각 단계별 분산 시스템 이해 및 실무 적용
■ 대화형 분석 기술인 Spark, 분산수집 기술 Kafka, 실시간검색 솔루션 ELKStack의 개념 및 구조 이해

교육대상

■ 하둡과 Hive 등의 하둡 에코시스템을 이용해 데이터 수집/저장/처리/분석을 하고 싶은 분
■ 빅데이터 분석 및 처리 도구에 관심 있는 분
■ 하둡, Spark, R 등 빅데이터 플랫폼 기반의 분석 절차와 방법에 관심 있는 분

교육내용

일자별 교육내용을 나타낸 표입니다.

일자

내용

1일차

[Module 01] BigData Platform with Hadoop EcoSystem (이론 100%)

[Phase 01] Meet Hadoop
- 하둡을 중심으로한 빅데이터 플랫폼의 이해
- 하둡 및 하둡 에코시스템 개요

[Phase 02] HDFS와 MapReduce
- HDFS : 분산파일시스템의 이해
- MapReduce : 분산병렬처리의 이해

[Phase 03] 빅데이터 플랫폼 아키텍처
- 빅데이터 플랫폼 설계 방안
- H/W와 N/W 인프라 구성 및 설계

2일차

[Module 02] Apache Hadoop Install (이론 20% / 실습 80%)

[Phase 04] 하둡 설치 실습
- Virtual Box를 이용한 가상화 환경 구축
- 가상 머신 3대 생성
- 하둡클러스터 매니저 YARN 개요

[Phase 05] 완전분산모드 Apache Hadoop 설치
- 네트워크 설정, Tarball 다운로드, SSH 인증
- 하둡 설정, 하둡 설치, HDFS Format, 서비스 시작/종료

3일차

[Module 03] 하둡에코시스템 (이론 80% / 실습 20%)

[Phase 06] Hive DataWarehouse
- Hive의 이해
- Hcatalog의 이해
- SQL On Hadoop 기술의 이해

[Phase 07] In-Memory Spark
- 인메모리 데이터 처리 및 분석 도구인 Spark 이해
- Spark 아키텍처
- Spark를 이용한 다양한 대용량 데이터 처리 및 분석 방법

4일차

[Module 04] 하둡의 활용 (이론 20% / 실습 80%)

[Phase 08] 하둡 활용 사례
- 국내 공공기관과 기업의 하둡 플랫폼 활용 사례 연구

[Phase 09] 실시간 처리 및 분석 시스템
- ELK Stack의 이해

[Phase 10] 미니 프로젝트
- HDFS, MapReduce, Hive, Spark, SQL On Hadoop, Sqoop을 이용하여 데이터 수집, 저장, 처리, 분석, 서비스의 전과정을 미니 프로젝트 방법으로 실습

* 본 교육과정은 개강일 기준으로 약 7일 전 개강 여부를 확정하며,
최소한의 수강생이 모이지 않을 경우 폐강될 수도 있음을 알려드립니다.
(수강신청 완료자분들을 대상으로 개강일 기준 약 7일 전 문자/메일로 안내드리고 있습니다.)

 

한국생산성본부

우) 03170 서울시 종로구 새문안로5가길 32 생산성빌딩
Copyright ⓒ Korea Productivity Center. All Rights Reserved.