Lv2 | 튜닝 | 하이퍼파라미터, GridSearch 개념 (정지규칙)
Data Analyst

빅데이터 관련 자료/Dacon

Lv2 | 튜닝 | 하이퍼파라미터, GridSearch 개념 (정지규칙)

carpe08 2021. 8. 9. 16:47
320x100
320x100

하이퍼 파라미터 튜닝은 정지규칙 값들을 설정하는 것을 의미한다.

의사결정나무에는 정지 규칙이라는 개념이 있다.

 

1. 최대깊이

최대깊이는 최대로 내려갈 수 있는 depth 이다. 뿌리 노드로부터 내려갈 수 있는 깊이를 지정하며 작을수록 트리는 작아지게 된다.

 

2. 최소노드크기

최소노드크기는 노드를 분할하기 위한 데이터 수이다. 해당 노드에 이 값보다 적은 확률변수 수가 있다면 stop 작을수록 트리는 커지게 된다.

 

3.최소향상도

최소향상도는 노드를 분할하기 위한 최소 향상도이다. 향상도가 설정값 이하라면 더 이상 분할하지 않는다. 작을수록 트리는 커진다.

 

4.비용 복잡도

트리가 커지는 것에 대해 패널티 계수를 설정해서 불순도와 트리가 커지는 것에 대해 복잡도를 계산하는 것이다.

 

이와 같은 정지규칙들을 종합적으로 고려해 조건값을 설정할 수 있으며, 이를 하이퍼파라미터 튜닝이라고 한다.

하이퍼파라미터 튜닝에는 다양한 방법론이 있다. 그 중 Best성능을 나타내는 GridSearch는 완전 탐색을 사용한다. 가능한 모든 조합 중에서 가장 우수한 조합을 찾아준다. 하지만, 완전 탐색이기 때문에 Best 조합을 찾을 땎지 시간이 매우 오래 걸린다는 단점이 있다.

320x100
320x100