2022-10-06 데이터마이닝_5
1. Random Forest 기계 학습에서의 랜덤 포레스트는 분류, 회귀 분석 등에 사용되는 앙상블 학습 방법의 일종이다. 훈련 과정에서 구성한 다수의 결정 트리로부터 부류(분류) 또는 평균 예측치(회귀 분석)를 출력함으로써 동작한다. ( 출처 : https://ko.wikipedia.org/wiki/랜덤_포레스트 ) Decision Tree는 overfitting될 가능성이 높다는 약점을 가지고 있다. 가지치기를 통해 트리의 최대 높이를 설정해 줄 수 있지만 overfitting을 충분히 해결할 수 없다. 그러므로 좀더 일반화된 트리를 만드는 방법을 생각해야한다. 이에 Random Forest(랜덤 포레스트)가 사용된다. Random forest는 ensemble(앙상블) machine learnin..
2022.10.06