개발 중(자동화)
이상치(Outlier)는 어떻게 다루어야 할까?
이상치가 뭐야? 이상치(Outlier)는 다른 값들에서 아주 멀리 떨어져 있는 값을 말합니다. 예를 들어서 반 평균이 50점인데 한 학생의 점수는 100점인 경우 이 학생의 점수는 이상치가 될 수 있습니다. 이상치는 평균이나 표준편차 처럼 대상의 일반적인 상태를 파악하는데 쓰이는 수치들에 큰 영향을 줍니다. 예를 들어서 위 반에서 3명이 있었는데 저 학생이 100점이고 나머지 두 명이 25점이었다면 이 반 아이들의 수준은 그래도 절반 정도는 알고 있다는 잘못된 추측을 할 수 있게 합니다. 평균이나 표준편차 같은 수치에 비해서 5가지 요약 수치(최솟값, 최댓값, 1분위수, 3 분위수)의 경우 영향을 덜 받기 때문에 이상치가 있는 경우는 5가지 요약 수치를 활용하는 것이 유리합니다. 추천 링크 5가지 수치 ..
2022. 1. 25. 20:27