1. 배운 내용 (1) GridSearchCV를 사용하여 Decision Tree 모델의 하이퍼파라미터를 최적화하는 방법을 학습했습니다. (2) K-Fold 교차 검증을 활용하여 데이터를 안정적으로 평가하고, 최적의 하이퍼파라미터 조합을 도출했습니다. (3) 하이퍼파라미터(max_depth, min_samples_split, min_samples_leaf)의 의미와 설정이 모델 성능에 미치는 영향을 이해했습니다.2. 세부 설명GridSearchCV하이퍼파라미터를 탐색할 수 있는 Scikit-learn 도구로, 모든 조합을 평가하여 최적의 모델을 선택합니다.사용한 하이퍼파라미터parameters = {'max_depth': [2, 3, 5, 10], 'min_samples_split..
1. 데이터 로드import pandas as pddf = pd.read_csv('./titanic.csv')print('Train 데이터 정보')print(df.info())df.head(3) pd.read_csv('./titanic.csv')titanic.csv 파일을 읽어 DataFrame으로 불러옵니다.파일 경로와 이름이 정확해야 오류가 발생하지 않습니다.df.info()데이터의 구조(열 이름, 데이터 타입, 결측값 여부 등)를 출력합니다.데이터를 탐색하기 위한 기본적인 정보를 제공합니다.df.head(3)DataFrame의 상위 3개 행을 출력합니다.데이터 샘플을 확인할 수 있습니다.df.head(3):2. 데이터 전처리1) 결측치 처리Age : 평균 값으로 채우기Cabin : N으로 채우기Em..