KNOU STUDYREAD

한국방송통신대학교 통계데이터과학과 블로그

CS & Department of Statistics and Data Science

통계데이터과학과 및 컴퓨터과학 독서

6-5. 통계적 머신러닝

Harryㅤ 2025. 6. 9.

 

랜덤포레스트 : 배깅 방식으로 데이터를 리샘플리아여 다수의 결정트리를 학습하고 결합하면서 숲 형태를 생성
배깅 : 부트스트랩 방법을 앙상블 적용, 다수의 모델이 같은 데이터에 대해 구하는 대신 시도할 때마다 매번 부트스트랩의 표본에 대한 새 모델을 일일이 생성

앙상블 배깅 랜덤 포레스트 변수 중요도
모델 평균화라고도 하며 여러 모델의 집합을 이용해서 하나의 예측결과를 도출하는 방식 데이터를 부투스트래핑해 다수의 모델을 생성하는 방법 결정트리에 기반하여 배깅추정한 모델 생성된 모델의 성능에 미치는 예측변수의 중요도를 나타냄

 

# 변수 중요도 대출 예제 예시 일부
rf <- randomForest(outcome ~., data=loan_data, importance = TRUE)
rf

# importance = TURE 옵션은 랜덤포레스트 함수에 다른 변수들의 중요도에 관한 정보를 추가 저장하도록 설정하는 옵션

 

 

 

 

 

'통계데이터과학과 및 컴퓨터과학 독서' 카테고리의 다른 글

7-1. 비지도 학습  (0) 2025.06.23
6-6. 통계적 머신러닝  (0) 2025.06.16
6-3. 통계적 머신러닝  (0) 2025.05.26
6-2. 통계적 머신러닝  (0) 2025.05.19
6-1. 통계적 머신러닝  (0) 2025.05.12