- k개의 가장 가까운 이웃 데이터를 이용하여 분류와 회귀 분석을 할 수 있다.
- 분류: 그룹으로 나누기
- 회귀: 숫자로 된 반응을 예측하기
- 특징 추출은 항목을 비교 가능한 몇 개의 숫자로 만드는 일이다.
- 좋은 특징을 고르는 것은 성공적인 KNN 알고리즘을 만드는 데 있어 중요하다.
- 머신러닝에 사용된다.
영화 추천 시스템
- 특징 추출: 고객 간의 유사도를 이용해 고객을 그래프에 나타낸다. 즉, 고객을 숫자의 집합으로 나타낸다.
- 이는 처음 시스템에 고객이 등록할 때 영화 장르에 대한 선호도를 평가하도록 만들 수 있다.
- 그래프에 나타낸 고객과의 거리를 측정한다. (피라고라스의 정리)
- 거리는 숫자 집합의 유사도, 즉 두 숫자 집합이 얼마나 비슷한지를 나타낸다.