상세 컨텐츠

본문 제목

머신러닝야학 2기 4일차 : 머신러닝의 종류, 지도학습 (회귀vs분류)

IT/스터디

by J KIMS 2021. 1. 7. 19:51

본문

반응형

머신러닝의 분류

 

 

머신러닝의 종류엔 대표적으로 강화학습, 비지도학습, 지도학습이 있다.

 

- 지도학습 : 정답이 있는 문제를 해결하는 것

- 비지도학습 : 무언가의 관찰을 통해 새로운 사실이나 관계를 밝히는 것

- 강화학습 : 더 좋은 보상을 받기위해 하는 것

 

지도학습 Supervised Learning

 

 

 

지도학습은 정답이 있는 문제를 해결하는 것이라고 했다.

온도라는 독립변수와 판매량이라는 종속변수가 있을때, 지도학습을 이용하면 미지의 데이터를 도출해낼 수 있다.

다시 바꿔말하면 지도학습은 공식을 찾는 것이다.

 

위의 경우 온도x2=판매량이라는 식을 도출해낼 수 있다.

이 공식을 머신러닝에선 '모델'이라고 한다. 

 

 

회귀 vs 분류

 

지도학습에는 크게 회귀와 분류가 있는데 다음과 같이 구분할 수 있다.

 

- 구하는 결과가 숫자라면 => 회귀

- 구하는 결과가 이름 혹은 문자라면 => 분류

 

사실 분류는 이미 했었는데, 1일차에 한 손톱과 정상 그룹을 나누는 것이 분류에 해당한다.

더 많은 예시들을 살펴보면 이렇다.

 

💡 회귀(Regression)의 예 (순서대로 각 독립변수 종속변수)

1. 공부시간과 시험점수

2. 온도와 레모네이드 판매량

3. 온실 기체량과 기온 변화량

 

💡 분류(Classification)의 예 (순서대로 각 독립변수 종속변수)

1. 공부시간과 합격 여부

2. 품종, 산도, 당도 등의 요인과 와인의 등급

3. 메일 발신인, 제목, 본문 내용 등의 요인과 스팸 메일 여부

 

양적 데이터와 범주형 데이터

 

- 양적 데이터 = 숫자

- 범주형 데이터 = 이름

 

양적 데이터라는 말을 들으면 아 그냥 숫자로 된거구나 범주형 데이터는 이름으로 된 거구나 하면 된다.

그렇다면 각 데이터의 종류에 따라 적용가능한 머신러닝 기법은??

 

- 양적 데이터 => 지도학습 회귀

- 범주형 데이터 => 지도학습 분류

 

오늘은 여기까지~

 

 

📚Reference

- 생활코딩 머신러닝1 머신러닝의 분류 ~ 회귀 VS 분류

반응형

관련글 더보기

댓글 영역