[Machine Learning] K-Nearest Neighbors(KNN)

less than 1 minute read

K-Nearest Neighbors(KNN)

데이터 분류 시 이웃한 데이터 포인트의 분류를 바탕으로 하는 알고리즘
데이터의 Label을 정의할 때 주변 데이터들의 Label을 조사하여 다수결로 K개 이상이며, 가장 많은 것의 Label로 정의함

  • K : 최근접 이웃의 개수, 하이퍼파라미터
  • 최적의 K 값을 찾기 위해 파라미터를 튜닝(Cross Validation)
  • 사기 탐지(Fraud Detection), 이상 감지(Anomaly Detection)에 적합
  • 데이터 시각화를 통해 용이하게 분류 가능
    • 다차원 공간에서 계산량이 급격히 증가함
    • 예측자의 개수가 적고, 분류의 크기가 비슷할 때 사용 권장

Leave a comment