Gilbert

DevOps Engineer
interested in @MSA @CloudArchitect @Log

[Machine Learning] 머신러닝 개요(Machine Learning)

February 24, 2021 1 minute read

1. Machine Learning

Machine

함수(Function)

Learning

Model에 들어 있는 파라미터를 업데이트 하는 것
- Model = 학습이 완료된 함수 = 알고리즘
학습 이후 입력된 데이터는 이미 학습된 함수로 처리됨

Machine + Learning

미래를 예측하기 위해 과거의 데이터를 처리하여 수학의 함수를 가져다가 학습을 한 뒤, 사람이 하는 지적작업을 대신하게 하는 것
데이터로부터 일관된 패턴 또는 새로운 지식을 찾아내 학습하는 방법
데이터를 함수에 집어 넣는 것
통계적으로는 데이터 마이닝(Data Mining)
머신러닝으로는 데이터 예측(회귀)과 분류를 할 수 있음

2. Data Analytics Vs. Machine Learning

Data Analytics

과거 행동의 특징 확인
EDA(Exploratory Data Analysis, 탐색적 데이터 분석) 진행
- 본격적인 모델링에 들어가기 앞서 반드시 선행되어야하는 과정
- 히스토그램, 산점도, 상관관계표 등 다양한 시각화 방법을 사용함

Machine Learning

미래 행동의 결과 예측
predict() 함수에 의해 예측

3. 지도학습과 비지도 학습

종류	알고리즘(Algorithm
지도학습 (Supervised Learning)	- 회귀분석(Regression Analysis), 수치예측
	- 로지스틱 회귀(Logistic Regression), 분류
	- 의사결정 나무(Decision Tree)
	- 랜덤 포레스트(Random Forest)
	- 신경망(Neural Network)
비지도학습 (Unsupervised Learning)	주성분 분석(Principal Component Analysis)
	K-평균 군집(K-means Clustering)
	연관 규칙(Association Rules)\|

1) 지도학습

데이터에 존재하는 특징(Feature)을 바탕으로 처리
Input에 대한 Output을 제공
Input Data와 Output Data(Label)의 관계를 학습

2) 비지도학습

데이터에 존재하는 특징(Feature)을 확인(군집, 연관)
- 특징이 비슷한(유사한) Data points를 군집 또는 연관 시킴
Input은 주어지지만 Output은 제공되지 않음
Input Data에 대한 해석, Grouping
지도학습을 위한 전처리 작업으로 수행

4. 데이터 라벨링(Data Labeling) & 데이터댐(Data Dam)

데이터 라벨링(Data Labeling)

AI 학습을 위해 데이터를 가공하는 것 라벨이 없는 데이터에 사람이 직접 라벨을 붙이는 활동

데이터 댐(Data Dam)

데이터 수집부터 데이터를 축적ㆍ가공하고 이를 거래하거나 AI에 활용하기 위한 전반의 사업

Leave a comment

You may also enjoy

[Docker] VM, Docker, Kubernetes 구조

[Java] Stream (스트림)

Stream (스트림)

[Java] Map Struct(Entity, DTO 변환)

Map Struct Entity ↔ DTO 변환을 용이하게 해주는 라이브러리

[Java] Abstract Class (추상클래스)

Abstract Class