* 앙상블이라는 말은 많이 들어봤지만 머릿 속에 구체화 되지 않았다.


https://www.kaggle.com/erikbruin/titanic-2nd-degree-families-and-majority-voting

다음 게시글에서 "타이타닉 생존 문제"에 대한 분석을 보며 약간의 직관적인 이해를 할 수 있었다.


 - 준비 RF, SVM, GBM(Gradient Boosting Machine)의 3가지 방법을 사용할 때,

   1) 3가지 모델을 통해 결과를 출력하고, 다수결에 의해 최종 생존여부를 결정한다.

   2) 3가지 모델 중 가장 예측력이 좋다고 생각되는 1개의 모델을 선정하고,

       그것을 기준으로 하되, 나머지 2개의 모델이 모두 상반된 결과를 예측하면 이를 따른다.

   3) 각 변수마다 다른 최적의 모델을 결정한다.


등 과 같은 방식으로 앙상블을 구체화한 것을 확인했다.

+ Recent posts