* 앙상블이라는 말은 많이 들어봤지만 머릿 속에 구체화 되지 않았다.
https://www.kaggle.com/erikbruin/titanic-2nd-degree-families-and-majority-voting
다음 게시글에서 "타이타닉 생존 문제"에 대한 분석을 보며 약간의 직관적인 이해를 할 수 있었다.
- 준비 RF, SVM, GBM(Gradient Boosting Machine)의 3가지 방법을 사용할 때,
1) 3가지 모델을 통해 결과를 출력하고, 다수결에 의해 최종 생존여부를 결정한다.
2) 3가지 모델 중 가장 예측력이 좋다고 생각되는 1개의 모델을 선정하고,
그것을 기준으로 하되, 나머지 2개의 모델이 모두 상반된 결과를 예측하면 이를 따른다.
3) 각 변수마다 다른 최적의 모델을 결정한다.
등 과 같은 방식으로 앙상블을 구체화한 것을 확인했다.
'분석 > 통계' 카테고리의 다른 글
[스크랩] 딥러닝 연습을 위한 여러가지 데이터 셋 (0) | 2018.04.05 |
---|---|
learning statistics on YouTube (0) | 2018.04.03 |
통계 관련 구직 인터뷰 (0) | 2018.03.20 |
pycharm에서 tensorflow를 활용한 머신러닝 배우기(2) (0) | 2018.01.28 |
pycharm에서 tensorflow를 활용한 머신러닝 배우기(1) (0) | 2018.01.28 |