온앤오프 Python을 이용한 웹 크롤링 및 비즈니스 활용
교육일정 | |
---|---|
교육시간 | 3일, 21시간 / 09:30 ~ 17:30 |
교육장소 | 한국생산성본부 2층 206호 |
고용보험 | 고용보험 비환급 ? |
교육비
|
정상가 770,000 원 KPC 유료법인회원 720,000 원 |
교육문의 | ICT교육센터 02-724-1830 / jekim@kpc.or.kr / 결제·계산서문의 : 02-724-1212 |
교육시간
09:30 ~ 17:30
교육목적/특징
■ Python 라이브러리를 통해 웹 크롤링을 할 수 있다.
■ Python 크롤러를 만들 수 있다.
■ 다양한 타입의 자료를 수집하여 비즈니스 관점으로 활용할 수 있다.
교육대상
■ 웹 서비스 개발자
■ 마케팅 정보 수집 및 분석자
■ Python 문법을 선수학습하였거나, 다뤄본 경험이 있는 실무자
■ 데이터 과학 또는 머신러닝 분야에서 현업에 활용하고자 하는 실무자
※ 온앤오프 진행방식은 개강일 1주일 전 선호도 조사 결과에 따라 진행방식이 결정됩니다. 온앤오프 병행 수업으로 진행되거나, 온라인(또는 오프라인) 희망자가 소수인 경우 오프라인(또는 온라인) 전용 과정으로 진행될 수 있으니 이점 참고하여 주시기 바랍니다. |
교육내용
일자 | 내용 | |
---|---|---|
1일차 | 오전 | [Phase 01] DOM과 데이터 스크래핑 기초 - 환경 설정 : 프로 개발자의 작업 공간 조성 - HTML과 DOM 구조 분석 - BeautifulSoup 라이브러리 이해와 활용 - BeautifulSoup을 이용한 데이터 추출 전략 |
오후 | [Phase 02] 데이터 스크래핑 심화 : 정적 웹 크롤링의 세계로 - API 통신의 핵심, requests 라이브러리 마스터하기 - HTTP 프로토콜의 심층 탐구 - Web Parameter 조작을 통한 정밀 데이터 추출 | |
2일차 | 오전 | [Phase 03] Selenium 라이브러리를 활용한 동적 웹 크롤링 - Selenium과 파서의 구축 및 설정 - WebDriver 고급 옵션 구성 - 단일 요소 탐색 : find_element 메소드 활용법 - 다중 요소 탐색 : find_elements 메소드 활용법 - 동적 웹 페이지 처리를 위한 실행 시간 지연 비법 |
오후 | [Phase 04] 동적 웹 페이지 크롤링의 기술적 깊이 - 웹 브라우저의 원격 조작 기술 - 웹 요소의 정밀 탐색 알고리즘 - 웹 요소 조작을 통한 인터랙션 자동화 - 이미지 자동 다운로드 및 처리 | |
3일차 | 오전 | [Phase 05] 웹 데이터 수집의 다면성과 자동화 전략 - 웹 자원의 자동 다운로드 기법 - 웹 댓글 시스템 구조 분석 및 데이터 추출 - 다수의 데이터 파일 통합 처리 |
오후 | - JSON 형식의 데이터 파싱 및 처리 - 정규 표현식을 이용한 고급 문자열 추출 - 실시간 트렌드 분석을 위한 데이터 수집 자동화 - 크롤링 작업의 타이밍 조절과 자동 스케쥴링 | |
* 본 교육과정은 개강일 기준으로 약 7일 전 개강 여부를 확정하며, |
연관 자격
자격증명 | 자격증관련링크 |
---|