정확한 분포를 찾을 수 없을 때 > lda 를 적용하기 힘들 때 - 선형관계가 아닌 경우
범주형일 때 - classifier > 보통 기본
- 핵심 - cost 문제 모든 자료를 고려 x 코스트에 영향을 끼치는 값들만 고려할 것 . 경계 부근 점들을 반영해 모델 코스트 계산
- 바운더리 근처 관측치만 고려 > 예측 정확도 높음
- c (에러의 합) 고려 필요 - c가 작으면 에러를 다수 범해도 괜찮음
연속형 - regression >
- ?
내적이 아니라 커널로 바꿀 것 ( 커널 : 두 값이 차이날 수록 값이 작아짐 - 가까울 수록 커지는 값)
정규분포 exp 내부 값과 비슷함 > 가우시안 커널
One class SVM
원 반지름의 최소화 > 점이 반지름 안에 있어야 함
에러 포함 시 c 값 삽입 (작을 수록 에러를 어느정도 허용)
라그랑쥬 > 커널 식으로 바꾸면 … 3차원 6차원으로 설정해 원이 아닌 경우를 만들 수 있음
시그마 - 커질 수록 차이가 완화됨 > 모형이 간단해짐 ( 민감한 반응 > 작은 시그마 값)