Data Science/실습

DS 실습 11- 상관분석(Pandas.corr, scipy)

에너지_2 2024. 12. 5. 18:48
728x90
반응형

※ 학습자료 정리한 내용입니다.

11차시 상관 분석

- 두 변수의 선형관계를 확인

- 두 수치형 변수의 비교는 Pearson' Correlation Coefficient를 확인하며 그 외 다양한 상관계수 존재

- 상관계수가 0 에 가까울수록 선형관계가 약하며, 절댓값이 1에 가까울수록 강함

- 기울기는 상관없음!

  Quantitiative Ordinal  
Quantitiative Pearson 's    
Ordinal   Spearman  

 

Pandas - corr ( )  

- 각 열 간의 상관 계수를 반환하는 메서드

Parameters
----------
method : {'pearson', 'kendall', 'spearman'} or callable
    Method of correlation:

    * pearson : standard correlation coefficient (default)
    * kendall : Kendall Tau correlation coefficient
    * spearman : Spearman rank correlation

 

호출

import pandas as pd
from scipy.stats import pearsonr
from scipy.stats import spearmanr
from scipy.stats import kendalltau

 

(1) dataFrame 형태 (2) corr () 사용

 

 

scipy - pearsonr ( )  

- Person 상관분석을 실시하는 함수

- 상관계수뿐만 아니라 p-value까지 출력. 통계적 유의성까지 같이 볼 수 있다.

 

scipy - spearmanr( )  

- 상관계수 뿐만 아니라 p-value 까지 출력

 

Scipy - kendalltau ( )  

- 상관계수 뿐만 아니라 p-value 까지 출력

 

 


Q. 

728x90
반응형