INDEX 1. 사이킷런 소개 2. 붓꽃 품종 예측하기 3. 사이킷런 기반 프레임워크 익히기 4. Model Selection 소개 - train_test_split() 5. 교차검증 - K-Fold, Stratified K-Fold 이해 6. cross_val_score() 와 GridSearchCV 1. 사이킷런 소개 사이킷런 (scikit-learn)은 파이썬 머신러닝 라이브러리 중 가장 많이 사용되는 라이브러리 사이킷런의 특징 파이썬 기반의 다른 머신러닝 패키지도 사이킷런 스타일의 API 지향할정도로 쉽고 가장 파이썬스러운 API 제공 머신러닝을 위한 매우 다양한 알고리즘과 개발을 위한 편리한 프레임워크와 API 제공 오랜 기간 실전환경에서 검증, 매우 많은 환경에서 사용되는 성숙한 라이브러리 N..
INDEX 1. 정적 크롤링(Requests + BeautifulSoup) 2. Requests와 BeautifulSoup을 이용한 네이버 뉴스 크롤링 3. 네이버 금융 크롤링후 엑셀에 저장하기 4. 마무리 1. 정적크롤링 웹 크롤링 웹 크롤링이란 웹 페이지에서 원하는 정보를 추출하는 것으로 3단계로 이루어진다. 1. 웹 페이지의 HTML 문서를 가져온다. 2. 가져온 HTML 문서를 파싱한다. 3. 파싱한 내용에서 원하는 정보만을 추출한다. 정적 크롤링 정적 웹 페이지는 웹 서버에 미리 저장된 파일이 그대로 전달되는 웹 페이지를 말하며 URL 주소만으로 모든 정보를 가져올 수 있다. 이 정적 웹 페이지를 크롤링하는 것을 정적 크롤링이라고하며 주로 Requests와 BeautifulSoup 라이브러리를 ..