728x90
반응형
※ 학습자료 정리한 내용입니다.
11차시 상관 분석
- 두 변수의 선형관계를 확인
- 두 수치형 변수의 비교는 Pearson' Correlation Coefficient를 확인하며 그 외 다양한 상관계수 존재
- 상관계수가 0 에 가까울수록 선형관계가 약하며, 절댓값이 1에 가까울수록 강함
- 기울기는 상관없음!
Quantitiative | Ordinal | ||
Quantitiative | Pearson 's | ||
Ordinal | Spearman |
Pandas - corr ( )
- 각 열 간의 상관 계수를 반환하는 메서드
Parameters
----------
method : {'pearson', 'kendall', 'spearman'} or callable
Method of correlation:
* pearson : standard correlation coefficient (default)
* kendall : Kendall Tau correlation coefficient
* spearman : Spearman rank correlation
호출
import pandas as pd
from scipy.stats import pearsonr
from scipy.stats import spearmanr
from scipy.stats import kendalltau
scipy - pearsonr ( )
- Person 상관분석을 실시하는 함수
- 상관계수뿐만 아니라 p-value까지 출력. 통계적 유의성까지 같이 볼 수 있다.
scipy - spearmanr( )
- 상관계수 뿐만 아니라 p-value 까지 출력
Scipy - kendalltau ( )
- 상관계수 뿐만 아니라 p-value 까지 출력
Q.
728x90
반응형
'Data Science > 실습' 카테고리의 다른 글
실기시험 준비 Python 기초 (3) | 2024.12.06 |
---|---|
DS 실습 12- 비계층적 군집분석(KMeans,MinMaxScaler,StandardScaler,shilhouette_score) (1) | 2024.12.06 |
DS 실습9~10-데이터전처리(정렬 및 변환-crosstab, sort_values, melt/ def) (0) | 2024.12.01 |
DS 실습6~8- 데이터전처리(결측치,이상치,파생변수,데이터병합) (0) | 2024.11.24 |
DS 실습5- 표본 추출(sample, random_state, train_test_split) (0) | 2024.11.23 |