본문 바로가기
대학원 시험 공부

머신러닝 딥러닝 기초

by code2772 2023. 2. 13.

[ 목차 ]

    728x90
    반응형

    1. 머신러닝

    • 인공지능 : 인공(Artificial) + 지능(Intelligence)
    • 머신러닝 : 학습(learning)하는 기계(machine)
    • 딥러닝 : 깊은(deep) 신경망 구조의 머신러닝

    1-1. 배경

    • 과거 컴퓨터로 데이터를 읽어들이고, 그 데이터 안에서 특징을 학습하여 패턴을 찾아내는 작업(패턴인식)
    • 데이터를 대량으로 수집 처리할 수 있는 환경이 갖춰짐으로 할 수 있는 열이 많아짐
    • 머신러닝은 데이터로부터 특징이나 패턴을 찾아내는 것이기 때문에 데이터가 가장 중요함

    1-2. 정의

    • 머신러닝은 인공지능의 한 분야로 컴퓨터가 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 분야
    • 무엇(x)으로 무엇(y)을 예측하고 싶다의 f(함수)를 찾아내는 것
    • 주어진 데이터를 통해서 입력변수와 출력변수간의 관계를 만드는 f(함수)를 만드는 것
    • x: 입력변수(독립변수), y: 출력변수(종속변수), f:모형(머신러닝 알고리즘)
     

    2. 머신러닝으로 할수 있는 것

    2-1. 회귀*Resgression)

    • 시계열(시간적인 변화를 연속적으로 관측한 데이터) 데이터 같은 연속된 데이터를 취급할 때 사용하는 기법
    • 과거의 주식 추세를 학습에서 내일의 주가를 예측하는 시스템을 개발

    2-2. 분류(Classification)

    • 주어진 데이터의 클래스별로 구별해 내는 과정으로 데이터와 데이터의 레이블값을 학습시키고 어느 범주에 속한 데이터인지 판단하고 에측
    • 스팸메일인지 아닌지 구별해주는 시스템을 개발

    2-3. 클러스터링(Clustering)

    • 분류와 비슷하지만 데이터에 레이블(정답)이 없음
    • 유사한 속성들을 갖는 데이터를 일정한 수의 군집으로 그룹핑하는 비지도 학습
    • SNS 데이터를 통해 소설 및 사회 및 사회 이슈를 파

    3. 학습

    3-1. 지도 학습

    • 문제와 정답을 모두 학습시켜 예측 또는 분류하는 문제
    • y=f(x)에 대하여 입력 변수(x)와 출력 변수(y)의 관계에 대하여 모델링하는 것
    • y에 대하여 예측 또는 분류하는 문제

    3-2. 비지도 학습

    • 출력 변수(y)가 존재하지 않고, 입력 변수(x)간의 관걔애 대해 모델링 하는 것
    • 군집분석: 유사한 데이터끼리 그룹화
    • PCA : 독립변수들의 차원을 축소화

    3-3. 강화 학습

    • 수 많은 시뮬레이션을 통해 현재의 선택이 먼 미래에 보상이 최대가 되도록 학습
    • Agent가 action을 취하고 환경에서 보상을 받고, 이 보상을 최대가 되도록 최적의 action을 취하고 환경에서 보상을 받고, 이 보상을 최대가 되도록 최적의 action을 취하는 방법을 스스로 배움
     

    4. 머신러닝의 종류

    4-1. 선형회귀분석

    • 독립변수와 종속뵨수가 "선형적인 관계가 있다"라는 가정하에 분석
    • 독립변수를 통해 종속변수를 예측하기 때문에 독립변수의 중요도와 영향력을 파악하기 쉬움

    4-2. 의사결정나무

    • 독랍뱐수의 조건에 따라 종속변수를 분리
    • 이해하기 쉬우나 overfitting이 잘 일어남

    4-3. KNN(K-NEighbor Nearest)

    • k 최근접 이웃법으로 분류 문제에 사용하는 알고리즘
    • 새로운 데이터가 들어왔을 때 기존 데이터의 그룹 중 어떤 그룹에 속하는지 분류하는 문제에 활용

    4-4. Neutal Network

    • 입력, 은닉, 출력층으로 구성된 모형으로 각 층을 연결하는 노드의 가중치를 업데이트하면서 학습

    4-5. SVM(Support Vector Machine)

    • 두 틀래스로부터 최대한 멀리 떨어져 있는 결정 경계를 찾는 분류기 알고리즘
    • 특정 조건을 만족하는 동시에 클래스를 분류하는 것을 목표
    • 선형이나 비선형 분류 회귀, 이상치 탐색등에서 강력한 성능을 갖는 지도학습 모델

    4-6. Ensemble Learning

    • 여러개의 모델을 결합하여 사용하는 모델

    4-7. K-means clustrting

    • Label 없이 데이터의 군집으로 k개를 생성

     

    반응형

    '대학원 시험 공부' 카테고리의 다른 글

    텐서플로우  (0) 2023.02.27
    신경망  (0) 2023.02.26
    머신러닝 로지스틱 회귀  (0) 2023.02.25
    머신러닝 Iris 데이터셋  (0) 2023.02.18
    머신러닝 - 사이킷런  (0) 2023.02.17