본문 바로가기
Machine Learning/분류모델

Ensemble(앙상블) 모델의 개념 [ voting(보팅) / Bagging(배깅) / Boosting(부스팅) ]

by leehii 2022. 8. 9.

 

앙상블 학습 : 여러 알고리즘을 사용하여 그 예측을 결합, 더 정확한 예측을 도출하는 것

이미지, 영상, 음성등의 비정형 데이터는 딥러닝을 주로 사용하고

정형데이터의 분류에서 앙상블이 자주 쓰임

 

 

앙상블의 대표적인 방법 3가지

학습의 유형은 보팅(Voting), 배깅(Bagging), 부스팅(Boosting), 스태킹(Stacking) 

 

 

 

보팅은 여러 알고리즘을 사용한 각각의 결과에 대해 투표를 통해 최종 결과를 예측

!서로 다른 모델! 사용

 

 

배깅은 같은 알고리즘에 대해 데이터 셋을 다르게 두고 각각 학습 (병렬적) /

대표적으로 Random Forest가 있음

 

여러 알고리즘이 순차적으로 학습을 하되

먼저 학습한 알고리즘에서 예측이 잘못된 데이터에 대해

 

다음 순서엔 데이터에 가중치를 부여하여

 

새롭게 생성된 데이터세과 모델로 학습과 예측을 진행하는 방식