본문 바로가기

파이썬27

[MachineLearning] Ensemble 모델을 활용한 유방암 분류 실습 1. 유방암 데이터를 활용하여 Ensemble 모델을 학습해보자 wisconsin의 유방암 데이터 셋 총 569건의 데이터(악성-212, 양성-357) In [1]: # 데이서 셋 불러오기 from sklearn.datasets import load_breast_cancer cancer_data = load_breast_cancer() cancer_data # 데이터 형태: 전체적인 형태 - 딕셔너리 구조, bunch 객체 Out[1]: {'data': array([[1.799e+01, 1.038e+01, 1.228e+02, ..., 2.654e-01, 4.601e-01, 1.189e-01], [2.057e+01, 1.777e+01, 1.329e+02, ..., 1.860e-01, 2.750e-01, 8.. 2023. 9. 14.
[MachineLearning] mushroom_tree 분류 mushroom_tree 버섯의 특징을 활용해 독/식용 이진 분류 Decision Tree 모델 활용 Decision Tree 학습현황 시각화 & 과대적합 제어(하이퍼 파라미터 튜닝) 특성의 중요도를 파악 확인(불순한 정도를 파악하는 것: 지니 불순도) In [1]: import pandas as pd import numpy as np import matplotlib.pyplot as plt # train, test 랜덤 샘플링 도구 from sklearn.model_selection import train_test_split from sklearn.tree import DecisionTreeClassifier 데이터 불러오기 In [2]: # data 변수에 담아주기 # data 폴더에 있는 mushr.. 2023. 9. 11.
[Python] 크롤링 이미지 데이터 수집하기 from selenium import webdriver as wb from selenium.webdriver.common.by import By import time from selenium.webdriver.common.keys import Keys # 파일 시스템을 위한 라이브러리(삭제, 생성) import os # 이미지의 경로를 실제 파일로 저장 from urllib.request import urlretrieve In [1]: # 폴더 생성 # 바탕화면에 이미지라는 폴더가 없다면 바탕화면에 이미지라는 폴더를 만들기 if not os.path.isdir("C:/Users/gjaischool/Desktop/이미지") : os.mkdir("C:/Users/gjaischool/Desktop/이미지") .. 2023. 9. 5.
[Python] 크롤링 네이버 지도 데이터 수집- iframe 전환 In [1]: from selenium import webdriver as wb from selenium.webdriver.common.by import By import time from selenium.webdriver.common.keys import Keys In [2]: # 1. 크롬드라이버를 실행해서 네이버지도 사이트로 이동 driver = wb.Chrome() driver.get("https://map.naver.com/p?c=15.00,0,0,0,dh") In [3]: # 2. 검색창에 검색어를 입력(동명동 회식) # 검색창의 구분자인 id값이 실행할 때마다 변한다 # 이런 경우 다른 선택자를 활용 search = driver.find_element(By.CSS_SELECTOR,".inpu.. 2023. 9. 4.