자격증/빅데이터분석기사

[빅데이터분석기사 필기 요약정리] 혼동행렬과 연관성분석

방랑청년 2023. 4. 7.
반응형

빅데이터분석기사 필기
잡고가야 하는 두번째, 혼동행렬과 연관성분석
이것도 2문제 정도는 나오니까!
 
유튜버 @그로잉린 채널에서 정말 도움 많이 받음! (추천해요)

 


<혼동행렬표>

 예측
PositiveNegative
실제PositiveTrue Positive (TP)False Negative (FN)
NegativeFalse Positive (FP)True Negative (TN)

 - 약어의 앞자리는 실제에서 가져오고 (실제와 예측이 같으면 P, 다르면 F)
 

정확도전체 데이터 중 예측을 정확하게 한 데이터의 비율TP + TN / TP + TN + FP + FN (전체)
정밀도모형이 P로 예측한 데이터 중 실제 P인 데이터의 비율TP / TP + FP
민감도 = 재현율 (민재!)실제 P인 데이터 중 모형이 P로 예측한 데이터의 비율TP / (TP + FN)
특이도 (특이하게 맞추네)실제 N인 데이터 중 모형이 N으로 예측한 데이터의 비율TN / (TN + FP)
F1 - Score정밀도와 재현율의 조화평균2 * 정밀도 * 재현율 / (정밀도 + 재현율)
거짓긍정률(FPR)실제 N인 데이터 중 모형이 P로 예측한 데이터의 비율FP / (TN + FP)
참 긍정률(TPR) = 민재는 참 긍정적이야!실제 P인 데이터 중 모형이 P로 예측한 데이터의 비율TP / (TP + FN)

 
<연관성분석>
- 지지도 : A와 B를 모두 포함하는 거래의 수 / 전체 거래의 수
- 신뢰도 : A와 B를 모두 포함하는 거래의 수 / A를 포함하는 거래의 수
- 향상도 : (A와 B를 모두 포함하는 거래의 수 * 전체 거래 수) / (A를 포함하는 거래의 수 * B를 포함하는 거래의 수)

반응형

댓글

💲 추천 글