머신러닝-지도학습알고리즘

 

지도학습은 입력과 출력이 있는 데이터로 학습을 시키는 것으로 자주 사용되는 머신러닝 방법 중 하나이다. 이와 반대 개념에는 비지도 학습이 있으며, 이는 입력만 있고 출력이 없는 상태에서 학습을 시키는 것을 말한다.

지도학습에는 분류classification와 회귀regression가 있다. 분류란 미리 정의된, 가능성 있는 여러 클래스 레이블 중 하나를 예측하는 것이다. 앞서 다뤄보았던 붓꽃의 품종 분류하기 실습이 이에 해당한다. 분류는 딱 두 개의 클래스로 분류하는 이진 분류 binary classification와 셋 이상의 클래스로 분류하는 다중 분류 multiclass classification로 나뉜다. 이진 분류는 맞다/아니다로 답이 나오는 것이고 다중 분류는 앞서 다룬 붓꽃의 품종 분류하기 실습과 같은 것이다.

또다른 지도학습인 회귀는, 연속적인 숫자 또는 프로그래밍 용어로 말하면 부동 소수점수를 예측하는 것이다. 예를 들어, 옥수수 농장의 수확량 예측하기, 어떤 사람의 교육 수준/나이/주거지 등을 바탕으로 연간 소득을 예측하는 것이다.

출력값의 연속성에 따라 분류와 회귀를 쉽게 구분할 수 있으며, 연속성이 존재할 경우 회귀문제라고 할 수 있다.