728x90
From : 혼자공부하는 머신러닝+딥러닝 (한빛미디어)
지도학습 : Supervised Learning
- data와 target로 이뤄진 훈련 데이터가 필요하며 새로운 데이터를 예측하는데 활용
비지도학습 : Unsupervised Learning
- Target data없이 input data만 있을 때 사용 -> 정답을 사용하지 않기 때문에 무엇가를 맞힐 수는 없고 data를 잘 파악하거나 변형하는데 도움을 줌
훈련데이터 : Training data
- 지도학습의 경우 필요한 입력(data)과 정답(target)을 합쳐놓은 것
훈련세트/테스트세트 : Train set / Test set
- test set 전체 data의 20~30%로 사용
샘플링 편향 : Sampling bias
- 훈련세트와 테스트세트에서 샘플이 고르게 섞여있지 않을 때 나타남
데이터 전처리 : data preprocessing
- 머신러닝 모델에 훈련 데이터를 주입하기 전 가공하는 단계. 특성값을 일정한 기준으로 맞추어 주는 작업.
- data를 표현하는 기준이 다르면 알고리즘을 올바르게 예측할 수 없음
728x90
'Programming > Machine Learning' 카테고리의 다른 글
[혼공머신] 04-2 확률적 경사 하강법 (0) | 2022.02.05 |
---|---|
[혼공머신] 용어 03장 (0) | 2022.02.03 |
[혼공머신] 04-1 로지스틱 회귀 (0) | 2022.01.23 |
[혼공머신] 03-3 특성공학과 규제 (0) | 2022.01.22 |
[혼공머신] 03-2 선형 회귀 (0) | 2022.01.16 |
[혼공머신] 03-1 k-최근접 이웃회귀 (0) | 2022.01.09 |
[혼공머신] 02-2 데이터 전처리(data preprocessing) (0) | 2022.01.08 |
[혼공머신] 용어 01장 (0) | 2022.01.05 |
[혼공머신] 02-1 훈련세트와 테스트 세트 (0) | 2022.01.03 |
[혼공머신] 01-3 마켓과 머신러닝 (0) | 2022.01.02 |