728x90

From : 혼자공부하는 머신러닝+딥러닝 (한빛미디어)

지도학습 : Supervised Learning

      - data와 target로 이뤄진 훈련 데이터가 필요하며 새로운 데이터를 예측하는데 활용

 

비지도학습 : Unsupervised Learning

      - Target data없이 input data만 있을 때 사용 -> 정답을 사용하지 않기 때문에 무엇가를 맞힐 수는 없고 data를 잘 파악하거나 변형하는데 도움을 줌

 

훈련데이터 : Training data

      - 지도학습의 경우 필요한 입력(data)과 정답(target)을 합쳐놓은 것

 

훈련세트/테스트세트 : Train set / Test set

      - test set 전체 data의 20~30%로 사용

 

샘플링 편향 : Sampling bias

      - 훈련세트와 테스트세트에서 샘플이 고르게 섞여있지 않을 때 나타남

 

데이터 전처리 : data preprocessing

      - 머신러닝 모델에 훈련 데이터를 주입하기 전 가공하는 단계. 특성값을 일정한 기준으로 맞추어 주는 작업.

      - data를 표현하는 기준이 다르면 알고리즘을 올바르게 예측할 수 없음

728x90

+ Recent posts