728x90
반응형
지금까지는 에측 모델이다, 로지스틱 회귀 같은 경우도 예측선을 그어주기는 하지만 데이터가 존재하는 예측선을 그어주고 서로 분류를 해주는 것이다. 예를들어 해당 범위에 있는 것을 참 거짓을 판별해준다.

- employee_id : 임의의 아이디
- department : 부서
- region : 지역
- education : 학력
- gender : 성별
- recruitment_channel : 어떤 방식으로 채용도히었는지
- no_of_trainings : 트레이닝 받은 횟수
- age : 나이
- previous_year_rating : 작년 고과 점수
- length_of_service : 근속 년수
- awards_won : 수상경력
- avg_training_score : 고과 평균점수
- is_promoted : 승진 여부









- 도큐먼트
- 독립변수의 선형 결합을 이용하여 사건의 발생 가능성을 예측하는데 사용되는 통계 기법
- 로지스틱 회귀, 서포트 백터 머신과 같은 알고리즘은 이진 분류만 가능(2개의 클래스 판별만 가능)
- 3개 이상의 클래스에 대한 판별을 진행하는 경우 아래와 같은 정략으로 판별
- one-vs-rest(OvR) : k 개의 클래스가 존재할 때, 1개의 클래스를 제외한 다른 클래스를 제외한 다른 클래스를 k개 만들어 각각의 이진 분류에 대한 확률을 구하고 총합을 통해 최종 클래스를 판
- one-vs-one(OvO) : 예로 4개의 계쩡을 구분하는 클래스가 존재한ㄷ나고 항때 0vs1, 0vs2, 0vs3, .. 2vs3까지의 NX(N-1)/2개의 분류기를 만들어 가장 양성으로 선택된 클래스를 판별 대부분 OvsR 전략을 선호


정밀도(precision)
- TP/(TP+FP)
- 무조건 양성으로 판단해거 계산하는 방
- 1이라고 예측한 것 중, 얼마 만큼을 제대로 맞췄는가?
재현율(recall)
- TP/(TP+FN)
- 정확하게 감지한 양성 샘플의 비율
- 민감도 또는 TPR(True Positive Rate)라고도 부름
- 민감도 또는 TPR(True Positive Rate)라고도 부
- "실제 1인 것 중에, 얼마 만큼을 제대로 맞췄는가?"
정밀도와 재현률이 서로 상반관계에 있음. 즉, 정밀도가 높으면 재현률이 떨어지고 재현률이 높아지면 정밀도가 떨어지는 경향이 있음
f1 score
- 정밀도와 재현율의 조화평균을 나타내는 지표
2∗정밀도∗재현율정밀도+재현율=TPTP+FN+FP2




교차 검증(Cross Validation)
- Train_Test_Split에서 발생하는 데이터의 섞임에 따라 성능이 좌우되는 문제를 해결하기 위한 기술

반응형
'대학원 시험 공부' 카테고리의 다른 글
텐서플로우 (1) | 2023.02.27 |
---|---|
신경망 (0) | 2023.02.26 |
머신러닝 Iris 데이터셋 (0) | 2023.02.18 |
머신러닝 - 사이킷런 (0) | 2023.02.17 |
머신러닝 딥러닝 기초 (0) | 2023.02.13 |