Programming/Machine Learning
[혼공머신] 용어 02장
bluelimn
2022. 1. 16. 14:29
728x90
From : 혼자공부하는 머신러닝+딥러닝 (한빛미디어)
지도학습 : Supervised Learning
- data와 target로 이뤄진 훈련 데이터가 필요하며 새로운 데이터를 예측하는데 활용
비지도학습 : Unsupervised Learning
- Target data없이 input data만 있을 때 사용 -> 정답을 사용하지 않기 때문에 무엇가를 맞힐 수는 없고 data를 잘 파악하거나 변형하는데 도움을 줌
훈련데이터 : Training data
- 지도학습의 경우 필요한 입력(data)과 정답(target)을 합쳐놓은 것
훈련세트/테스트세트 : Train set / Test set
- test set 전체 data의 20~30%로 사용
샘플링 편향 : Sampling bias
- 훈련세트와 테스트세트에서 샘플이 고르게 섞여있지 않을 때 나타남
데이터 전처리 : data preprocessing
- 머신러닝 모델에 훈련 데이터를 주입하기 전 가공하는 단계. 특성값을 일정한 기준으로 맞추어 주는 작업.
- data를 표현하는 기준이 다르면 알고리즘을 올바르게 예측할 수 없음
728x90