[Machine Learning] 머신러닝 개요(Machine Learning)

1 minute read

1. Machine Learning

Machine

  • 함수(Function)

Learning

  • Model에 들어 있는 파라미터를 업데이트 하는 것
    • Model = 학습이 완료된 함수 = 알고리즘
  • 학습 이후 입력된 데이터는 이미 학습된 함수로 처리됨

Machine + Learning

  • 미래를 예측하기 위해 과거의 데이터를 처리하여 수학의 함수를 가져다가 학습을 한 뒤, 사람이 하는 지적작업을 대신하게 하는 것
  • 데이터로부터 일관된 패턴 또는 새로운 지식을 찾아내 학습하는 방법
  • 데이터를 함수에 집어 넣는 것
  • 통계적으로는 데이터 마이닝(Data Mining)
  • 머신러닝으로는 데이터 예측(회귀)과 분류를 할 수 있음



2. Data Analytics Vs. Machine Learning

Data Analytics

  • 과거 행동의 특징 확인
  • EDA(Exploratory Data Analysis, 탐색적 데이터 분석) 진행
    • 본격적인 모델링에 들어가기 앞서 반드시 선행되어야하는 과정
    • 히스토그램, 산점도, 상관관계표 등 다양한 시각화 방법을 사용함

Machine Learning

  • 미래 행동의 결과 예측
  • predict() 함수에 의해 예측

3. 지도학습과 비지도 학습

종류 알고리즘(Algorithm
지도학습
(Supervised Learning)
- 회귀분석(Regression Analysis), 수치예측
- 로지스틱 회귀(Logistic Regression), 분류
- 의사결정 나무(Decision Tree)
- 랜덤 포레스트(Random Forest)
- 신경망(Neural Network)
비지도학습
(Unsupervised Learning)
주성분 분석(Principal Component Analysis)
K-평균 군집(K-means Clustering)
연관 규칙(Association Rules)|

1) 지도학습

  • 데이터에 존재하는 특징(Feature)을 바탕으로 처리
  • Input에 대한 Output을 제공
  • Input Data와 Output Data(Label)의 관계를 학습

2) 비지도학습

  • 데이터에 존재하는 특징(Feature)을 확인(군집, 연관)
    • 특징이 비슷한(유사한) Data points를 군집 또는 연관 시킴
  • Input은 주어지지만 Output은 제공되지 않음
  • Input Data에 대한 해석, Grouping
  • 지도학습을 위한 전처리 작업으로 수행

4. 데이터 라벨링(Data Labeling) & 데이터댐(Data Dam)

데이터 라벨링(Data Labeling)

AI 학습을 위해 데이터를 가공하는 것 라벨이 없는 데이터에 사람이 직접 라벨을 붙이는 활동

데이터 댐(Data Dam)

데이터 수집부터 데이터를 축적ㆍ가공하고 이를 거래하거나 AI에 활용하기 위한 전반의 사업

Leave a comment