반응형
빅데이터분석기사 필기
잡고가야 하는 두번째, 혼동행렬과 연관성분석
이것도 2문제 정도는 나오니까!
유튜버 @그로잉린 채널에서 정말 도움 많이 받음! (추천해요)
<혼동행렬표>
예측 | |||
Positive | Negative | ||
실제 | Positive | True Positive (TP) | False Negative (FN) |
Negative | False Positive (FP) | True Negative (TN) |
- 약어의 앞자리는 실제에서 가져오고 (실제와 예측이 같으면 P, 다르면 F)
정확도 | 전체 데이터 중 예측을 정확하게 한 데이터의 비율 | TP + TN / TP + TN + FP + FN (전체) |
정밀도 | 모형이 P로 예측한 데이터 중 실제 P인 데이터의 비율 | TP / TP + FP |
민감도 = 재현율 (민재!) | 실제 P인 데이터 중 모형이 P로 예측한 데이터의 비율 | TP / (TP + FN) |
특이도 (특이하게 맞추네) | 실제 N인 데이터 중 모형이 N으로 예측한 데이터의 비율 | TN / (TN + FP) |
F1 - Score | 정밀도와 재현율의 조화평균 | 2 * 정밀도 * 재현율 / (정밀도 + 재현율) |
거짓긍정률(FPR) | 실제 N인 데이터 중 모형이 P로 예측한 데이터의 비율 | FP / (TN + FP) |
참 긍정률(TPR) = 민재는 참 긍정적이야! | 실제 P인 데이터 중 모형이 P로 예측한 데이터의 비율 | TP / (TP + FN) |
<연관성분석>
- 지지도 : A와 B를 모두 포함하는 거래의 수 / 전체 거래의 수
- 신뢰도 : A와 B를 모두 포함하는 거래의 수 / A를 포함하는 거래의 수
- 향상도 : (A와 B를 모두 포함하는 거래의 수 * 전체 거래 수) / (A를 포함하는 거래의 수 * B를 포함하는 거래의 수)
반응형
'자격증 > 빅데이터분석기사' 카테고리의 다른 글
[빅데이터분석기사 필기 불합격 후기] 6회 시험 (4) | 2023.04.24 |
---|---|
[빅데이터분석기사 필기 요약정리] : Part 03. 빅데이터 모델링 & Part 04. 빅데이터 결과 해석 / 23년 제6회 시험 대비 (feat. 김계철 교수님) (19) | 2023.04.08 |
[빅데이터분석기사 필기 요약정리] 프로세스(절차) 정리 (8) | 2023.04.07 |
[빅데이터분석기사 필기 요약정리] : Part 02. 빅데이터 탐색 / 23년 제6회 시험 대비 (feat. 김계철 교수님) (11) | 2023.04.05 |
[빅데이터분석기사 필기 기출문제 오답노트] : 23년 제6회 시험 대비 네번째 (13) | 2023.04.03 |
댓글