5-2. 분류

통계데이터과학과 및 컴퓨터과학 독서

5-2. 분류

Harryㅤ 2025. 5. 5.

수치형 변수에 베이즈 방법 적용 : 수치형 변수의 범주형 변환 방법, 조건부 확률 추정을 위한 확률모형 사용
- 나이브 베이즈의 경우 예측변수와 결과변수 모두 범주형이어야 함
- 베이즈 분류기는 예측변수가 범주형일때 적합하며 수치형 변수일 경우엔 위의 두 가지 방법으로 사용해서 해결
1) 수치형 -> 범주형 전환
2) 조건부 확률 : 예측변수 벡터의 조건부 확률의 곱으로 추정. 어떤 사건이 주어졌을 때 해당 사건을 관찰할 확률이라고 정의

판별분석 : 초기의 통계 분류 방법.

공분산	판별함수	판별가중치
한 변수가 다른 변수와 함께 변화하는 정도를 나타내는 척도	예측변수 적용시 클래스 구분을 최대화하기 위한 함수	판별함수를 적용해 얻은 결과를 말하며 어떤 클래스에 속할 확률을 추정하는데 사용되는 값

library(MASS) # 해당 패키지에서 제공하는 LDA 함수를 사용하기 위해 로드
loan_lda_ex <- lda(outcome ~ borrower_score + payment_inc_ratio, data=loan3000) # 예측변수 borrowe_score, payment_inc_ratio 사용
loadn_lda_ex$scaling # 선형판별 가중치 계산

# 상환확률 계산
pred <- predict(loan_lda_ex)
head(pred$posterior)
pred=pd.DataFrame(loan_lda_ex.predict_prova(loan3000[predictors]), columns=loan_lda_ex.classes_)
pred.hear()

- 판별분석은 에측변수나 결과변수가 범주형 뿐만 아니라 연속형이어도 상관없이 작동한다
- 공분산행렬을 이용해 한 클래스와 다른 한 클래스에 속한 데이터를 구분짓는 선형판별함수(LDA)를 계산한다
- 이 방법으로 각 레코드 혹은 데이터 값들이 어떤 클래스에 속하는지 가중치화, 점수를 구해서 구분짓는다

'통계데이터과학과 및 컴퓨터과학 독서' 카테고리의 다른 글

6-2. 통계적 머신러닝 (0)	2025.05.19
6-1. 통계적 머신러닝 (0)	2025.05.12
4-5~5-1. 회귀와 예측, 분류 (0)	2025.04.28
4-3. 회귀와 예측 (0)	2025.04.21
04-1. 회귀와 예측 (0)	2025.04.07

현재글5-2. 분류

ㅤ

5-2. 분류

'통계데이터과학과 및 컴퓨터과학 독서' 카테고리의 다른 글

'통계데이터과학과 및 컴퓨터과학 독서'의 다른글

티스토리툴바

5-2. 분류

'통계데이터과학과 및 컴퓨터과학 독서' 카테고리의 다른 글

'통계데이터과학과 및 컴퓨터과학 독서'의 다른글

관련글

티스토리툴바