728x90
반응형
J(세타)는 Cost함수로 에러값을 나타냄
이것을 줄이는 것이 경사하강법 사용 이유
- 간단하지만 많이 쓰임
- 주어진 조건에 대해 의사 결정을 하여 테니스를 칠지 말지 결정하는 트리 구조
- 대표적인 알고리즘 (ID3)
- 제일 중요한 자료가 무엇인지 확인한다. 예를 들어 위 테니스 예시에서 비 여부, 온도, 습도, 바람 중 제일 중요한 비 여부를 선택
- 정보를 이용하는 방식이기 때문에 information method
- 최적화를 위해 현재 상태에서 가장 효과적인 방법을 선택하는 것
엔트로피를 구하는 공식
- 데이터가 얼마나 분산되어있는지
- 위 ID3와 계산하는 방식이 다름
- Gini index를 사용하여 불순도를 계산하는 방식이다.
- 위 방식 중 분류를 위한 더 좋은 특징이 무엇일까? 직관적으로 보기에는 B가 더 좋아보이는데 이것을 계산해본다.
결과적으로 이런 형태가 나옴
시험 범위는 여기까지
ID3 - Entropy
Cart - Gini Index
위 두 가지 방식으로 트리를 만들 수 있다.
식은 위에 다 존재하고 결국 트리 형태를 만드는 것이 목적
728x90
반응형
'2023 > 2023-1' 카테고리의 다른 글
[4월 27일(목)] 인공지능 입문(이론) - Ensemble Learning (2) (0) | 2023.04.27 |
---|---|
[4월 20일(목)] 인공지능 입문(이론) - Ensemble Learning (0) | 2023.04.20 |
[4월11일(화)] 인공지능 입문(이론) (0) | 2023.04.11 |
[캡스톤 디자인] 4월 5일(수) 회의록 (0) | 2023.04.05 |
[4월4일(화)] 인공지능 입문(이론) - Introduction to Machine Learning (0) | 2023.04.04 |