2023/2023-1

[4월 13일(목)] 인공지능 입문(이론)

JWonK 2023. 4. 13. 14:15
728x90
반응형

 

J(세타)는 Cost함수로 에러값을 나타냄

이것을 줄이는 것이 경사하강법 사용 이유

 

 

 

  • 간단하지만 많이 쓰임

 

 

  • 주어진 조건에 대해 의사 결정을 하여 테니스를 칠지 말지 결정하는 트리 구조

 

 

  • 대표적인 알고리즘 (ID3)
  • 제일 중요한 자료가 무엇인지 확인한다. 예를 들어 위 테니스 예시에서 비 여부, 온도, 습도, 바람 중 제일 중요한 비 여부를 선택
  • 정보를 이용하는 방식이기 때문에 information method

 

 

 

  • 최적화를 위해 현재 상태에서 가장 효과적인 방법을 선택하는 것

 

 

 

 

엔트로피를 구하는 공식

 

 

 

 

 

 

 

 

 

 

  • 데이터가 얼마나 분산되어있는지
  • 위 ID3와 계산하는 방식이 다름

 

 

  • Gini index를 사용하여 불순도를 계산하는 방식이다.
  • 위 방식 중 분류를 위한 더 좋은 특징이 무엇일까? 직관적으로 보기에는 B가 더 좋아보이는데 이것을 계산해본다.

 

 

 

 

 

 

결과적으로 이런 형태가 나옴

 

시험 범위는 여기까지

ID3 - Entropy

Cart - Gini Index

위 두 가지 방식으로 트리를 만들 수 있다.

 

식은 위에 다 존재하고 결국 트리 형태를 만드는 것이 목적

 

728x90
반응형