본문 바로가기
대학원 시험 공부

머신러닝 로지스틱 회귀

by code2772 2023. 2. 25.

[ 목차 ]

    728x90
    반응형

    지금까지는 에측 모델이다, 로지스틱 회귀 같은 경우도 예측선을 그어주기는 하지만 데이터가 존재하는 예측선을 그어주고 서로 분류를 해주는 것이다. 예를들어 해당 범위에 있는 것을 참 거짓을 판별해준다.

     

    • employee_id : 임의의 아이디
    • department : 부서
    • region : 지역
    • education : 학력
    • gender : 성별
    • recruitment_channel : 어떤 방식으로 채용도히었는지
    • no_of_trainings : 트레이닝 받은 횟수
    • age : 나이
    • previous_year_rating : 작년 고과 점수
    • length_of_service : 근속 년수
    • awards_won : 수상경력
    • avg_training_score : 고과 평균점수
    • is_promoted : 승진 여부

    • 도큐먼트
    • 독립변수의 선형 결합을 이용하여 사건의 발생 가능성을 예측하는데 사용되는 통계 기법
    • 로지스틱 회귀, 서포트 백터 머신과 같은 알고리즘은 이진 분류만 가능(2개의 클래스 판별만 가능)
    • 3개 이상의 클래스에 대한 판별을 진행하는 경우 아래와 같은 정략으로 판별
      1. one-vs-rest(OvR) : k 개의 클래스가 존재할 때, 1개의 클래스를 제외한 다른 클래스를 제외한 다른 클래스를 k개 만들어 각각의 이진 분류에 대한 확률을 구하고 총합을 통해 최종 클래스를 판
      2. one-vs-one(OvO) : 예로 4개의 계쩡을 구분하는 클래스가 존재한ㄷ나고 항때 0vs1, 0vs2, 0vs3, .. 2vs3까지의 NX(N-1)/2개의 분류기를 만들어 가장 양성으로 선택된 클래스를 판별 대부분 OvsR 전략을 선호

    정밀도(precision)

    • TP/(TP+FP)
    • 무조건 양성으로 판단해거 계산하는 방
    • 1이라고 예측한 것 중, 얼마 만큼을 제대로 맞췄는가?
     

    재현율(recall)

    • TP/(TP+FN)
    • 정확하게 감지한 양성 샘플의 비율
    • 민감도 또는 TPR(True Positive Rate)라고도 부름
    • 민감도 또는 TPR(True Positive Rate)라고도 부
    • "실제 1인 것 중에, 얼마 만큼을 제대로 맞췄는가?"
     

    정밀도와 재현률이 서로 상반관계에 있음. 즉, 정밀도가 높으면 재현률이 떨어지고 재현률이 높아지면 정밀도가 떨어지는 경향이 있음


     

    f1 score

    • 정밀도와 재현율의 조화평균을 나타내는 지표
      2+=TPTP+FN+FP2

    교차 검증(Cross Validation)

    • Train_Test_Split에서 발생하는 데이터의 섞임에 따라 성능이 좌우되는 문제를 해결하기 위한 기술

    반응형

    '대학원 시험 공부' 카테고리의 다른 글

    텐서플로우  (0) 2023.02.27
    신경망  (0) 2023.02.26
    머신러닝 Iris 데이터셋  (0) 2023.02.18
    머신러닝 - 사이킷런  (0) 2023.02.17
    머신러닝 딥러닝 기초  (0) 2023.02.13