코딩하는 해맑은 거북이

기계학습 정의, 기계학습의 분류(지도학습, 비지도학습, 강화학습) 본문

AI

기계학습 정의, 기계학습의 분류(지도학습, 비지도학습, 강화학습)

#CJE 2021. 3. 21.
해당 글은 아래의 2가지를 다룬다.
1. 기계학습(Machine Learning)이란?
2. 기계학습(Machine Learning) 분류별 주요 학습 기법

 

1. 기계학습(Machine Learning)이란?

- 컴퓨터가 알고리즘을 이용해 데이터를 분석하고, 분석을 통해 스스로 학습하며, 이를 기반으로 판단이나 예측을 수행하는 것이다.

- '딥러닝(Deep Learning) < 기계학습(Machine Learning) < 인공지능(AI)'으로 인공지능의 하위 집합이다.

 

인공지능, 머신러닝, 딥러닝의 관계

 

 

2. 기계학습(Machine Learning) 분류별 주요 학습 기법

1) 지도학습(Supervised Learning)

  : 훈련 데이터(training data)로 부터 예측(Prediction), 추정(Estimation), 분류(Classification) 함수를 만들어내는 기계학습 방법

▶ 회귀(Regression) 기법 : 어떤 데이터들의 Feature를 기준으로, 연속된 값을 예측하는 것.

* 회귀 평가 지표(MAE, SSE, MSE, RMSE, RMSLE)

 

- 선형회귀(Linear Regression)

- 릿지(Ridge) : https://cje1125.tistory.com/34

- 라쏘(Lasso) : https://cje1125.tistory.com/34

- 엘라스틱넷(LeasticNet)

- 로지스틱 회귀(Logistic Regression)

 

 

▶ 분류(Classification) 기법 : 주어진 데이터를 정해진 카테고리(Label)에 따라 분류하는 것.

* 분류 평가 지표(accuracy, 오차행렬(confusion matrix), 정밀도&재현율(precision&recall), F1-score, ROC-AUC)

 

- 의사결정트리(Decision Tree)

- KNN

- SVM

- 앙상블 학습(Ensemble Learning) : https://cje1125.tistory.com/30

 

 

2) 비지도학습(Unsupervised Learning)

  : 관찰한 데이터로부터 숨겨진 패턴/규칙을 탐색, 찾아내는 기계학습 방법

▶ 군집화 기법 : 주어진 데이터들의 특성을 고려해 데이터 집단(Cluster)을 정의하고 데이터 집단의 대표할 수 있는 대표점을 찾는 것.

  - k-means, k-medoids, hierarchical clustering

▶ 차원축소 기법 : 많은 Feature로 구성된 다차원의 데이터 셋을 차원을 축소하여 새로운 차원의 데이터 세트를 생성하는 것.

  - 주성분분석(PCA), 독립성분석(ICA), 선형판별분석(LDA, Linear Discriminant Analysis)

 

 

3) 강화학습(Reinforcement Learning)

  : 어떤 환경에서 동작하는 에이전트가 있을 때, 에이전트가 현재 상태(State)에서 향후 기대되는 누적 보상값(Reward)이 최대가 되도록 행동(Action)을 선택하는 정책(Policy)을 찾는 학습방법

- 강화학습에서 취급하는 대상은 마르코프 결정 과정(MDP, Markov Decision Process)이라는 불확실성을 전제로 하므로 확률 시스템이다.

- 강화학습은 좋은 정책을 계속 채택하는 것이 목표이므로

  "미래에 얻을 수 있는 보상의 기대치를 극대화하는 정책을 결정해 가는 것"이라고 할 수 있다.

 

 

Comments