IT 기록/머신러닝

[머신러닝]01-1.머신러닝의 개념과 용어

Lazy Quant 2018. 6. 24. 12:18
반응형


※본 포스팅은 직접 강의하는 내용이 아닌, 김성훈 교수님의 머신러닝 강의를 정리하기 위한 포스팅입니다.

김성훈 교수님의 강의는 모두를 위한 머신러닝/딥러닝(http://hunkim.github.io/ml)에서 들을 수 있습니다.



머신러닝은 무엇인가?

  • 일종의 소프트웨어, 프로그램

  • Explicit(명시적) programming의 한계로 인해 제안, 발전
    ex) 스팸 필터 : 많은 규칙 / 자율 주행 : 아주 많은 규칙
    개발자가 일일히 프로그래밍 할 수 없다. 프로그램이 학습해서 스스로 정하도록 개발


러닝(학습)은 무엇인가?

  • Supervised learning(지도 학습) : 정해져 있는 데이터(labeled examples, training data set)로 학습
    ex) 고양이 사진들을 주고 학습시키고, 사진이 고양이인지 확인

  • Unsupervised learning(비지도 학습) : 명시되지 않은 데이터로 학습
    ex) Google news grouping / Word clustering 등

→본 강의에서는 Supervised learning을 주로 다룰 것

이미지 Labeling / 이메일 스팸 필터 / 시험 점수 예측 등

알파고(AlphaGo)도 Supervised learning의 일종(수 많은 기보를 넣고 학습) 



Supervised learning의 종류

  • 시험 점수 예측 - Regression

X(hours)

Y(score) 

 10

8

 9

7

 3

2

 2

?

  • 합격/불합격(Pass/Non-pass) 예측 - Binary classification

X(hours)

Y(P/N) 

 10

P

 9

P

 3

N

 2

?

  • 성적 등급(A,B,C,D and F) 예측 - Multi-label classification

X(hours)

Y(grade) 

 10

A

 9

B

 3

D

 2

?


반응형