본문 바로가기
AI/AI 기초 이론

6. 기계학습 방식의 종류

by 긍열! 2020. 5. 13.
728x90

2020/05/06 - [분류 전체보기] - [AI 기초] 5. 기계학습의 의미와 학습 과정

 기계학습은 위 글에서 설명한 일반적인 방법을 따르되, 구체적인 방식의 차이에 따라 크게 세 가지(지도 학습,비지도 학습, 강화학습)로 구분할 수 있다. 이번 글을 통해 각 기계학습 방법의 특징과 각 방법이 어떤 과제 수행에 적합한지 정리해보고자 한다. 

 

*강화 학습을 지도 학습에 속하는 방법으로 분류하는 경우도 있다. 나는 가장 보편적인 분류 방법으로, 강화학습을 독립적인 것으로 나눠 설명할 것이다. 

*2021년 기준 최근 준지도학습 semisupervised learning에 대한 주목이 늘고 있다. 추후 더 공부를 한 뒤 부연 설명을 추가할 예정이다.

 

1. 지도학습 (Supervised Learning)

① 예시:

-"1이 입력되면 답은 2, 2가 입력되면 4, 4가 입력되면 8이 출력된다. 3이 입력되면 어떤 수를 출력할까?"

-"이 사진은 고양이, 이 사진은 개다. 이 사진은 무슨 동물일까?"

② 특징: input= label+data

'정답'을 샘플데이터와 함께 입력해줘 기계를 학습시키는 방법이다. 이때 정답을 꼬리표(label, 레이블)라고 부른다. 

③ 어떤 과제 수행에 적합한 학습 방식인가?

-분류(Classification)

-회귀분석(Regression)


  분류는 사진 속 대상이 무엇인지 맞히는  물체인식 과제,

 회귀분석은 이전 글에서 예로 들었던 경우와 같이 입력된 데이터를 통해 이들의 추세를 나타내는 적절한 함수를 추론해내는 과제로 이해하면 된다. 이전 글에 예시로 설명한 경우는 선형(일차함수 형태) 회귀분석으로 아래 그림의 왼쪽 사진이 해당한다. 회귀분석에는 선형뿐만 아니라 아래 오른쪽 그림과 같이 차수가 큰 방정식의 그래프의 형태 또한 포함된다.

 

*회귀 분석:
 "관찰된 연속형 변수들에 대해 두 변수 사이의 모형을 구한 뒤 적합도를 측정해 내는 분석 방법이다.."-위키백과.

  예) 관찰된 연속형 변수들: x축과 y축의 요소

   두 변수 사이의 모형: 그래프

       적합도: 데이터의 추세를 잘 표현하는 정도

Linear Regression(선형 회귀) 과 Polynomial Regression(다항식 회귀) 출처: https://ko.wikipedia.org/wiki/%EC%84%A0%ED%98%95_%ED%9A%8C%EA%B7%80, https://codingchloe.github.io/Overfitting%EC%9D%B4%EB%9E%80/ 

④ 지도 학습에 해당되는 구체적인 방법, 알고리즘의 종류에는 어떤 것이 있는가?

-선형 회귀 (Linear Regressiom)

-로지스틱 회귀 (Binary Classification)

-다항 로지스틱 회귀 (Softmaw Classification)

-CNN (Convolutional Neural Network)

-RNN (Recurrent Neural Network)

-KNN (K-Nearest Neighbors)

 

 

2. 비지도 학습(Unsupervised Learning)

 예시:

-(각 사진이 고양이 혹은 개라는 정답을 알려주지 않고 사진을 보여주며)"이 사진들 간의 특징을 찾고 이를 바탕으로 비슷한 것

끼리 묶어 그룹을 나눠보아라"

② 특징: input= data

꼬리표 없이 샘플데이터만을 입력해 기계를 학습시키는 방법이다.

③ 어떤 과제 수행에 적합한 학습 방식인가?

-군집화(Clustering)

출처: https://bioinformaticsandme.tistory.com/131

-표현학습(Representation Learning, 표상 학습)**추가 조사 필요

 

 군집화는 분류되지 않고 입력된 데이터들 사이에서 패턴을 찾아내 군집을 만드는 것으로,  분류 기준을 컴퓨터가 생성하는 것이다. 이러한 특징으로 사람이 발견하지 못하는 데이터들 간의 규칙을 발견해낼 때 사용한다.

④ 지도 학습에 해당되는 구체적인 방법, 알고리즘의 종류에는 어떤 것이 있는가?

-K-means

-DBSCAN(Density-Based Spatial Clustering of Application with Noise)

 

3.강화 학습(Reinforcement Learning)

 예시:

-"현재 상대편 에이전트(게임 수행자)가 가까이 오고 있으며 위치가 발각된 상황이다. 행동의 선택지는 뛰기, 주위 물건 뒤에 숨기, 가만히 있기 이렇게 세 가지가 있다. 이 중 어느 행동을 할 것인가?"

 

② 특징: '보상(reward)'

주어진 행동의 선택지 중에서 컴퓨터(정확한 용어는 agent 에이전트로 강화학습 관련 용어에 대한 설명은 새로운 글에서 정리할 예정이다.)가 환경 변화에 맞는 의사결정을 통해 어떤 행동을 할지 선택하여 이를 수행하고 그 결과에 따라 보상을 통해 피드백받는다. 보상을 최대로 만드는 것을 목표로 하여 각 상황에 어떤 행동을 할지 학습하게 된다. 

③ 어떤 과제 수행에 적합한 학습 방식인가?

-게임분야

대표적으로 알파고와 알파고 제로에 활용된 머신러닝 방식이 강화 학습이며, 아타리(Atari) 게임 사례도 있다.

 

 

 

기계학습(머신러닝)의 종류   출처: https://www.mobiinside.co.kr/2020/03/12/ai-perceptron/

 

 

기계학습 방식의 세 가지, 지도 학습, 비지도 학습, 강화 학습에 대한 개요를 정리해보았다. 다음 글을 통해서는 딥러닝 기초 용어인 퍼셉트론과 인공신경망에 대한 내용을 정리해보고자 한다. 

728x90

'AI > AI 기초 이론' 카테고리의 다른 글

4. 기계학습의 의미와 학습 과정  (0) 2020.05.06
2. 인공지능의 세부 분야  (0) 2020.04.16
1. 인공지능의 의미와 종류  (0) 2020.04.06