728x90
반응형
분류 나무(Classification Tree)
- 종속변수가 명목형인 경우 사용
- 각 노드 분류 알고리즘은 이진 분류 시 Gini Index 기반의 CART(Classification And Regression Tree) 사용
회귀 나무(Regression Tree)
- 종속변수가 연속형인 경우 사용
- 각 노드 분류에는 평균, 표준편차를 활용하여 모델을 만들어 나가고 노드를 분류함
- 과적합 방지, 모델 단순화를 위해 Depth, Impurity 등 관련 설정 활용
from sklearn.tree import DecisionTreeClassifier
from sklearn.tree import DecisionTreeRegressor
sklearn - DecisionTreeClassifier()
- 분류나무를 수행
sklearn - DecisionTreeRegressor()
- 회귀 나무를 수행
- max_depth : 모델의 성장 설정 가능. 줄일수록 성능이 안 좋아짐
728x90
반응형
'Data Science > 실습' 카테고리의 다른 글
A_1['B'].value_counts(nomalize = True) 와 pd.crosstab(A, B, nomalize = True) 가 다른 이유? (1) | 2024.12.09 |
---|---|
DataScience 예제, 샘플문항 (2) | 2024.12.08 |
DS 실습 17- KNN(K-Nearest Neighbor) (0) | 2024.12.07 |
DS 실습 16- 나이브 베이즈, 예측 확률값의 두번째 열이 1이 될 확률? (0) | 2024.12.07 |
DS 실습 15- 로지스틱 회귀분석 (0) | 2024.12.07 |