728x90
반응형

Data Science/이론 17

DS 이론10-선형회귀분석2_통계파트(주요 가정)

※ 학습자료 정리한 내용입니다.  [이전 내용]2024.11.20 - [Data Science/이론] - DS 이론09- 선형회귀분석 DS 이론09- 선형회귀분석※ 학습자료 정리한 내용입니다.  - 상관분석을 통하여 두 변수 간에 선형성이 있음을 알았으나, 인과관계를 알 수는 없음! 회귀분석 (Regression Analysis)- (상관분석을 통해서) 두 개의 변수가 선sometipsfor.tistory.com선형회귀분석의 4가지 가정 ***출처: http://kocw-n.xcache.kinxcdn.com/data/keris/2021/leeyoonmo1021/3-4.pdf 선형성 : 독립변수와 종속변수 간 선형관계정규성 * : 오차 분산의 형태. 한 개의 x 가 가진 y 값의 오차 분산 형태.등분산성 ..

Data Science/이론 2024.11.22

DS 이론09- 선형회귀분석

※ 학습자료 정리한 내용입니다.  - 상관분석을 통하여 두 변수 간에 선형성이 있음을 알았으나, 인과관계를 알 수는 없음! 회귀분석 (Regression Analysis)- (상관분석을 통해서) 두 개의 변수가 선형성이 있고, (회귀분석은) 인과관계를 알고 싶을 때 사용 ex) 마케팅 횟수를 늘리면 매출이 늘어나는가? 얼마나 늘어나는 가? 개념: 연속형 변수들 사이의 모형을 구한 뒤, 적합도를 측정해 내는 분석 방법목적 **설명: 종속변수에 대한 설명변수(독립변수)의 영향을 측정, 설명예측: 설명변수(독립변수) 정보가 있을 때 이에 따른 종속변수를 예측종류예측함수의 형태에 따라 선형회귀/ 비선형회귀독립변수의 개수에 따라 단순회귀/ 다중회귀종속변수의 개수에 따라 단변량회귀/ 다변량회귀 [수학적 표현]$$y..

Data Science/이론 2024.11.20

DS 이론07~08-추론통계(점/구간추정),상관분석

※ 학습자료 정리한 내용입니다.  추론 통계1_추정 Q. 계산 문제. 의미 문제. 많이 나옴 추정, Estimation: 표본을 통하여 모집단의 특성이 어떠한 가에 대해 추측하는 과정 - 추정량: 표본정보에 의존하는 확률변수로서, 모수를 추정하는 데 사용되는 표본통계량- 추정치: 추정량을 평가하여 얻게되는  특정한 수치점추정- 모집단의 특성을 단일한 값으로 추정하는 방법 (고정된 값)- 모르는 모수를 가장 잘 대표할 수 있는 표본을 추출하고 필요한 계산을 하여 얻는 하나의 수치- 표본이 모집단의 특성을 잘 표현하지 못할 경우에는 통계량과 모수 간의 오차가 클 수 있음- 점추정방법: 적률, 최대우도 -> 표본평균이 모평균의 점추정량이 됨 구간추정 ★- 모수의 참값이 포함되리라고 기대하는 추정치를 일정한 범..

Data Science/이론 2024.11.19

DS 이론 06- 연속확률분포(지수,정규,t,카이제곱,f)

※ 학습자료 정리한 내용입니다. - 공식을 말로도 풀 수 있어야 함- 어떤 경우에 어떤 분포를 사용해야하는 지, 계산식 외우기 * 분포 간의 관계표본평균, 표본분산으로 정의되는 확률변수들로써,표본의 수가 많아질수록 중심극한정리에 의해 결국 정규분포에 수렴 특징지수분포정규분포t 분포카이제곱 분포F 분포형태비대칭 단봉형,오른쪽 꼬리 대칭형 종 모양 대칭형,꼬리 두꺼움  비대칭 단봉형, 오른쪽 꼬리 비대칭 단봉형, 오른쪽 꼬리 평균​1 / λ μ 0  (ν > 1)  k  분산 ​1 / (λ^2) σ^2 ν​ / (ν−2) (ν > 2)  2 k  꼬리 두께 오른쪽 꼬리 두꺼움 꼬리 얇음 정규분포보다꼬리 두꺼움  오른쪽 꼬리 두꺼움 오른쪽 꼬리 두꺼움 사용사례 대기 시간, 서비스 시간 분석 자..

Data Science/이론 2024.11.18

DS 이론 05- 확률변수, 이산확률분포(베르누이, 이항, 포아송)

※ 학습자료 정리한 내용입니다.더보기https://recipesds.tistory.com/ 통계분석의 재료 - 확률변수통계분석의 원리 - 추정분석결과의 증명 - 검정본격적 통계분석 - 분석통계와 기계학습 - 회귀* 통계 수치화된 자료(데이터) 자체 데이터에 대한 대표적 수치 또는 요약 데이터를 분석하는 방법과 결과 *데이터를 분석한다고 하면 해야 할 것들① 주어진 데이터가 어떻게 생겼는지 알고 싶다.   → 기술통계 (Descriptive statistics)로 데이터셋을 시각화한다. (탐색적 분석)    기술통계 : 주어진 데이터 세트를 설명하고 요약하기 위한 통계 기법-> 위치(모메민)/변이(Box plot)/모양(skew,kurt) 통계량② 주어진 샘플로 모수를 알고 싶다.  → 통계에 기반한 추정..

Data Science/이론 2024.11.17

DS 이론 04- 확률실험, 베이즈정리

※ 학습자료 정리한 내용입니다.확률확률 : 0~1 사이의 값. 합은 1확률을 계산하는 문제가 나올 수 있음Q. 전체 중에서 몇번 나왔나?  확률실험 (E) = 확률시행: 다음 3가지를 만족할 때 **결과는 알 수 없음 ex) 동전을 던지면, 앞면이 나올지 뒷면이 나올지 알 수 없음결과로 나타날 수 있는 가능한 경우들은 알고 있음 ex 동전을 던지면, 앞면 or 뒷면이 나옴동일한 실험을 반복할 수 있음 ex) 동전 던지는 실험은 반복 가능표본공간(S: sample)확률시험으로 출현 가능한 모든 결과들의 모임S={H,T} ->  S=동전 던지기 표본공간, H:앞면, T:뒷면사건표본공간의 각 원소들의 부분집합 {H}, {T}근원사건: 어떤 사건이 표본공간 상의 하나의 원소로 구성된 사건 {H} or {T}사건..

Data Science/이론 2024.11.16

DS 이론 01~03- 변수, 일변량/다변량차트, 위치/변이/모양 통계량

※ 학습자료 정리한 내용입니다.기본용어모집단: 통계 분석 방법을 적용할 분석 대상의 전체 집합 모수: 모집단을 분석하여 얻어진 결과 수치. 모집단의 특성을 나타내는 값/변수. 통계적 추론에서 분석자의 최종목표!평균, 분산, 표준편차, 비율 등의 모집단 특성: 모평균(μ, 뮤) . 모분산(σ^2), 모표준편차(σ), 모비율(p)표본: 모집단으로부터 무작위 추출된 일부(sample). 모집단을 대표하는 분석 대상!통계량: 표본을 분석하여 얻어진 결과 수치. 표본들의 함수평균, 분산, 표준편차, 비율 등의 표본의 특성: 표본평균(x^2), 표본분산(s^2), 표본표준편차(s), 표본비율(p^ '피 햇')  모집단    ≫ ≫ ≫    추출(sampling) ≫ ≫ ≫   표본모수      ≪ ≪ ≪      ..

Data Science/이론 2024.11.16
728x90
반응형