내일배움캠프 본캠프 23일차 - 이상치 처리
1. 이상치 탐지 및 분석이상치 탐지 방법:IQR (Interquartile Range):Q1(1사분위수), Q3(3사분위수)를 기준으로 IQR 계산.이상치 조건:아래 경계: Q1 - 1.5 * IQR위 경계: Q3 + 1.5 * IQR코드: Q1 = df[column].quantile(0.25)Q3 = df[column].quantile(0.75)IQR = Q3 - Q1lower_bound = Q1 - 1.5 * IQRupper_bound = Q3 + 1.5 * IQRoutliers = df[(df[column] upper_bound)]박스플롯 시각화:sns.boxplot()을 활용하여 이상치 분포 확인.로그 변환 전후, 스케일링 후 이상치가 어떻게 변하는지 비교.변수별 이상치 개수 확인:각 변수에서..
TIL
2024. 12. 26. 20:38