파이썬(Python)/머신러닝 공부

머신 러닝(Machine Learning) 알고리즘의 선택

BlueNoa 2023. 12. 26. 15:06
728x90
반응형

<목차>


• 알고리즘 선택 방법 종류

머신러닝에 사용되는 알고리즘은 각각의 특성에 따라 사용하는 종류가 달라진다.

큰 범주로 보면 세 가지로 볼 수 있다.

지도 학습(Supervised Learning), 비지도 학습(Unsupervised Learning), 강화 학습(Reinforcement Learning)이 있다.

(각 범주에 속해 있는 알고리즘에 대해서는 따로 자세히 다룰 것이다.)

여기서도 각 특성으로 정리가 된다.

 

지도 학습(Supervised Learning)

레이블(정답)이 있는 데이터로 모델을 훈련하고 예측한다.

회귀(Regression) : 정답과 입력 데이터 변수 간의 관계를 학습하여 새로운 데이터를 통해 연속적인(Continuous) 값을 예측한다.
분류(Classification) : 데이터가 비연속적(이산형, Discrete) 클래스(범주)로 분류하여 새로운 데이터의 클래스를 예측한다.

 

비지도 학습(Unsupervised Learning)

레이블(정답)이 없는 데이터로 모델을 훈련한다.

군집화(Clustering) : 데이터의 유사한 특성이나 패턴을 가진 그룹으로 나눈다.
차원 축소(Dimensionality Reduction) : 고차원의 데이터를 저차원으로 변환하는 과정을 통해 시각화 또는 계산량 절감을 목적으로 매핑한다.
이상 탐지(Anomaly Detection) : 데이터 집합에서 일반적인 패턴과는 다른 패턴을 갖는 비정상적인 사례를 탐지하는 과정을 의미한다. 정상적인 데이터의 패턴을 학습한 후, 새로운 데이터가 학습된 패턴과 얼마나 다른지를 평가하여 데이터를 식별한다.
고빈도 패턴 마이닝(High-Frequency Pattern Mining) : 대규모 데이터 집합에서 자주 발생하는 패턴을 탐색하고 식별하는 데이터 마이닝 기술이다. 자주 발생하는 패턴이란 특정 패턴, 규칙, 혹은 항목 집합을 찾아내는 것을 목적으로 한다.

 

강화 학습(Reinforcement Learning)

에이전트(Agent : 의사 결정을 하는 주체, 강화 학습의 대상이되는 주체)환경(Environment : 에이전트가 상호 작용하는 대상이며, 에이전트의 행동에 반응하여 상태가 변하고, 보상을 제공한다.)과 상호작용하며 어떤 작업을 수행 후, 그 결과로 얻은 보상(Reward : 에이전트의 행동 후 환경으로부터 받는 피드백, 목표는 누적된 보상을 최대화 하는 것)을 최대화하기 위해 학습하는 방법이다.

반응형

• 알고리즘 선택 요령

사이킷런 튜토리얼 홈페이지에서는 각 상황에 선택할 수 있는 컨닝 페이퍼(Cheat-Sheet)를 제공해주고 있다.

해당 사이트의 표를 보기 편하게 임의로 정리해보았다.

(작은 글씨로 써놓은 설명 글이 안보인다면 Ctrl + 마우스 휠로 확대/축소 해서 볼 수 있다.)

알고리즘 선택 요령

 

728x90

 

 

 

 

 

 

 

 

 

 

728x90
반응형