SVM

정확한 분포를 찾을 수 없을 때 > lda 를 적용하기 힘들 때 - 선형관계가 아닌 경우

범주형일 때 - classifier > 보통 기본

  • 핵심 - cost 문제 모든 자료를 고려 x 코스트에 영향을 끼치는 값들만 고려할 것 . 경계 부근 점들을 반영해 모델 코스트 계산
  • 바운더리 근처 관측치만 고려 > 예측 정확도 높음
  • c (에러의 합) 고려 필요 - c가 작으면 에러를 다수 범해도 괜찮음

연속형 - regression >

  • ?

내적이 아니라 커널로 바꿀 것 ( 커널 : 두 값이 차이날 수록 값이 작아짐 - 가까울 수록 커지는 값)

정규분포 exp 내부 값과 비슷함 > 가우시안 커널


One class SVM

원 반지름의 최소화 > 점이 반지름 안에 있어야 함

에러 포함 시 c 값 삽입 (작을 수록 에러를 어느정도 허용)

라그랑쥬 > 커널 식으로 바꾸면 … 3차원 6차원으로 설정해 원이 아닌 경우를 만들 수 있음

시그마 - 커질 수록 차이가 완화됨 > 모형이 간단해짐 ( 민감한 반응 > 작은 시그마 값)