랜덤포레스트 : 배깅 방식으로 데이터를 리샘플리아여 다수의 결정트리를 학습하고 결합하면서 숲 형태를 생성
배깅 : 부트스트랩 방법을 앙상블 적용, 다수의 모델이 같은 데이터에 대해 구하는 대신 시도할 때마다 매번 부트스트랩의 표본에 대한 새 모델을 일일이 생성
앙상블 | 배깅 | 랜덤 포레스트 | 변수 중요도 |
모델 평균화라고도 하며 여러 모델의 집합을 이용해서 하나의 예측결과를 도출하는 방식 | 데이터를 부투스트래핑해 다수의 모델을 생성하는 방법 | 결정트리에 기반하여 배깅추정한 모델 | 생성된 모델의 성능에 미치는 예측변수의 중요도를 나타냄 |
# 변수 중요도 대출 예제 예시 일부
rf <- randomForest(outcome ~., data=loan_data, importance = TRUE)
rf
# importance = TURE 옵션은 랜덤포레스트 함수에 다른 변수들의 중요도에 관한 정보를 추가 저장하도록 설정하는 옵션
'통계데이터과학과 및 컴퓨터과학 독서' 카테고리의 다른 글
7-1. 비지도 학습 (0) | 2025.06.23 |
---|---|
6-6. 통계적 머신러닝 (0) | 2025.06.16 |
6-3. 통계적 머신러닝 (0) | 2025.05.26 |
6-2. 통계적 머신러닝 (0) | 2025.05.19 |
6-1. 통계적 머신러닝 (0) | 2025.05.12 |