ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 인공지능 - 1. 개요
    인공지능 2021. 5. 23. 19:50

    본 포스팅은 학부생이 공부하며 작성하는 글입니다. 부정확한 표현이나 잘못 이해한 부분이 있을 수 있습니다. 양해부탁드립니다.

     

    인공지능의 큰 주제는 데이터를 어떻게 다루느냐 이다.

    데이터를 어떻게 분석하느냐, 표현하느냐에 따라 그 목적이 달라지고 다양한 기법이 적용된다.

     

    Data Analysis 

    - Classification (분류)

    - Clustering (군집화)

    - Regression & Prediction (회귀와 예측)

     

    Data Representation

    - Feature Extractio (특징 추출)

     

    1. Classification(분류)

    입력된 데이터가 어떤 부류에 속하는지 판단하는 문제: 문자인식, 생체인식, 문서분류, 음성인식, 객체인식

    • Naive Bayes Classification
    • K-NN
    • Neural Network(MLP, CNN, LSTM)
    • SVM(Support Vector Machine)
    • HMM(Hidden Markow Model)

     

    2. Clustering(군집화)

    데이터 집합을 서로 비슷한 몇개의 그룹으로 묶는 문제: Video Segmentation, 데이터 그룹화

    • k-means
    • Mixture of Gaussian
    • Neural Network(SOM)

     

    3. Regression & Prediction (회귀와 예측)

    회귀분석: 입력변수와 출력변수 사이의 매칭 관레를 분석

    예측: 과거 관찰했던 데이터집합의 특성을 분석하여 새로 관찰될 데이터에 대해 예측하는 문제 (시간의 입력값을 같이 입력받는다.): 시장예측, 주가예측

     

    • Linear regression
    • Gaussian process
    • Neural Network(MLP, RBF, CNN, LSTM)

     

    4. Feature Extraction

    데이터(Raw data) 로부터 분류/ 군집화에 적용하기 좋은 특징을 찾아낸다: 영상데이터 축소, 데이터 시각화, Representation Learning

    • PCA
    • LDA
    • t_SNE(고차원의 데이터를 2차원으로 변형한다)
    • Manifold Learning

     

    대다수의 Machine Learning System이 공유하는 구조이다.

     

    Machine Learning System의 Flow

     

    데이터 수집 → 데이터 전처리 → 데이터 분석 → 특징 추출기, 분류기 개발 → 성능평가 → 수정 보완 

     

     

    성능평가: 개발자가 임의로 설계한 분류기, 추출기를 통해 나온 결과를 기계가 얼마나 알아들었는지 평가한다.

    Objective Function(목적함수): 학습 시스템이 달성해야 하는 목표를 함수로 정의한다.

    Error Function(오차함수): 원하는 값과 실제값의 차이를 나타낸다. Error을 최소화 하는것이 학습의 목적이 된다.

    • Traning error: 학습에 사용된 데이터에 대해 계산된 오차
    • Test error: 학습에 사용되지 않은 새로운 집합에 대해 계산된 오차
    • Generalization error: 학습 데이터가 아닌 모든 가능한 데이터에 데헤 정의되는 오차. 실제 계산은 불가능 하며 Test Error로 대체한다. Generalization error을 최소화 하는 것이 궁극적 목표이다.

     

    Supevised VS Unsupervised Learning and etc.. 

    • Supervised Learning(지도학습, 교사학습): 학습시스템이 내야할 출력값(Target Output)이 이미 정의되어있다. (전처리를 통해 라벨링된 데이터가 입력된다. 이 때, 출력값과의 오차를 줄이는 것이 목표이다.)
    • Unsupervised Learning(비지도학습, 비교사학습): 원하는 출력값이 정의되어있지 않다.
    • Reinforcement Learning(강화학습): 어떠한 행동을 취할때 보상을 주고, 이 보상을 최대화 하는 학습법이다. 데이터가 처리중인 상태(online)에서의 성능에 초점을 맞춘다.
    • Semi-Supervised Learning
    • Weakly Supervised Learning

     

     

     

    '인공지능' 카테고리의 다른 글

    인공지능 - 5. Neural Network(CNN)  (0) 2021.05.30
    인공지능 - 3. Classification  (0) 2021.05.23

    댓글

Designed by Tistory.