[머신러닝]01-1.머신러닝의 개념과 용어
※본 포스팅은 직접 강의하는 내용이 아닌, 김성훈 교수님의 머신러닝 강의를 정리하기 위한 포스팅입니다.
김성훈 교수님의 강의는 모두를 위한 머신러닝/딥러닝(http://hunkim.github.io/ml)에서 들을 수 있습니다.
머신러닝은 무엇인가?
일종의 소프트웨어, 프로그램
Explicit(명시적) programming의 한계로 인해 제안, 발전
ex) 스팸 필터 : 많은 규칙 / 자율 주행 : 아주 많은 규칙
→개발자가 일일히 프로그래밍 할 수 없다. 프로그램이 학습해서 스스로 정하도록 개발
러닝(학습)은 무엇인가?
Supervised learning(지도 학습) : 정해져 있는 데이터(labeled examples, training data set)로 학습
ex) 고양이 사진들을 주고 학습시키고, 사진이 고양이인지 확인Unsupervised learning(비지도 학습) : 명시되지 않은 데이터로 학습
ex) Google news grouping / Word clustering 등
→본 강의에서는 Supervised learning을 주로 다룰 것
이미지 Labeling / 이메일 스팸 필터 / 시험 점수 예측 등
알파고(AlphaGo)도 Supervised learning의 일종(수 많은 기보를 넣고 학습)
Supervised learning의 종류
시험 점수 예측 - Regression
X(hours) | Y(score) |
10 | 8 |
9 | 7 |
3 | 2 |
2 | ? |
합격/불합격(Pass/Non-pass) 예측 - Binary classification
X(hours) | Y(P/N) |
10 | P |
9 | P |
3 | N |
2 | ? |
성적 등급(A,B,C,D and F) 예측 - Multi-label classification
X(hours) | Y(grade) |
10 | A |
9 | B |
3 | D |
2 | ? |