[혼공머신] 용어 02장

bluelimn 2022. 1. 16. 14:29

2022. 1. 16. 14:29

728x90

From : 혼자공부하는 머신러닝+딥러닝 (한빛미디어)

지도학습 : Supervised Learning

- data와 target로 이뤄진 훈련 데이터가 필요하며 새로운 데이터를 예측하는데 활용

비지도학습 : Unsupervised Learning

- Target data없이 input data만 있을 때 사용 -> 정답을 사용하지 않기 때문에 무엇가를 맞힐 수는 없고 data를 잘 파악하거나 변형하는데 도움을 줌

훈련데이터 : Training data

- 지도학습의 경우 필요한 입력(data)과 정답(target)을 합쳐놓은 것

훈련세트/테스트세트 : Train set / Test set

- test set 전체 data의 20~30%로 사용

샘플링 편향 : Sampling bias

- 훈련세트와 테스트세트에서 샘플이 고르게 섞여있지 않을 때 나타남

데이터 전처리 : data preprocessing

- 머신러닝 모델에 훈련 데이터를 주입하기 전 가공하는 단계. 특성값을 일정한 기준으로 맞추어 주는 작업.

- data를 표현하는 기준이 다르면 알고리즘을 올바르게 예측할 수 없음

728x90

[혼공머신] 04-2 확률적 경사 하강법 (0)	2022.02.05
[혼공머신] 용어 03장 (0)	2022.02.03
[혼공머신] 04-1 로지스틱 회귀 (0)	2022.01.23
[혼공머신] 03-3 특성공학과 규제 (0)	2022.01.22
[혼공머신] 03-2 선형 회귀 (0)	2022.01.16
[혼공머신] 03-1 k-최근접 이웃회귀 (0)	2022.01.09
[혼공머신] 02-2 데이터 전처리(data preprocessing) (0)	2022.01.08
[혼공머신] 용어 01장 (0)	2022.01.05
[혼공머신] 02-1 훈련세트와 테스트 세트 (0)	2022.01.03
[혼공머신] 01-3 마켓과 머신러닝 (0)	2022.01.02

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

ANMIAN