728x90
반응형

2024/11/22 4

DS 실습4- Numpy, pandas(Series,DataFrame)*

- 데이터를 다루고 분석하기 위해서는 수만 개의 데이터셋을 불러오고 가공하고 분석해야 함- 그래프나 통계적인 방법 - EDA 를 위해 Numpy, pandas 사용 - Numpy 와 pandas 차이 NumPy는 다차원 배열을 다루는 데 특화되어 있으며, Pandas는 데이터 조작과 분석을 위한 테이블 형식의 데이터를 다루는 데 특화되어 있습니다. - https://challenge.tistory.com/32- https://cleancode-ws.tistory.com/13 01 Numpy 객체 기본- 주로 array 함수 사용- 이 외에도 특수한 행렬의 형태를 생성하기 위한 함수 다수 존재- 배열 생성은 1~다차원 구조 가능- 전차행렬 등 선형대수 관련 연산 가능 배열 생성 - .reshape : 행렬..

Data Science/실습 2024.11.22

DS 실습1~3- Python 기본문법

cmd > jupyter notebook Q1. 주피터 노트북에 대한 설명 중 옳지 않은 것은? 31. 셀에는 코드를 입력할 수 없다.2. 셀은 명령모드와 편집모드가 있다.3. 한번 지운 셀은 되살릴 수 없다. -> 단축키 Z , Edit-Undo Delete Cells 사용4. 셀에는 주석을 입력할 수 있다. Q2. 주피터 노트북의 파일명이 있는 영역은? 11. 헤더2. 툴바3. 셀4. 네임스페이스 Q3. 셀의 코드를 실행하는 단축키 : Ctrl + Enter   print- 구분자로 쓸 값을 sep 사용print(1, 2, sep="/")  -> 1/2  02 자료형 - index 0부터 시작하고, 마이너스 개념은 마지막 index부터 옴- [2:] : index 2부터 끝까지- [:3] : 처음부터..

Data Science/실습 2024.11.22

DS 이론 11-선형회귀분석3_이슈처리,성능평가지표,명목형변수

※ 학습자료 정리한 내용입니다.[이전 내용]2024.11.22 - [Data Science/이론] - DS 이론10-선형회귀분석2_통계파트(주요 가정) DS 이론10-선형회귀분석2_통계파트(주요 가정)※ 학습자료 정리한 내용입니다.  선형회귀분석의 4가지 가정 ***출처: http://kocw-n.xcache.kinxcdn.com/data/keris/2021/leeyoonmo1021/3-4.pdf 선형성 : 독립변수와 종속변수 간 선형관계정규성 * : 오차 분산의 형sometipsfor.tistory.com- 앞선 선형회귀분석 4가지 가정 관련 이슈 이외 다른 이슈에 대해 설명 다른 이슈가 있는 데이터일 때[이상치 이슈]확인방법히스토그램, 막대그래프 등대응방법데이터 변환 : 이상치 데이터를 지움Robus..

Data Science/이론 2024.11.22

DS 이론10-선형회귀분석2_통계파트(주요 가정)

※ 학습자료 정리한 내용입니다.  [이전 내용]2024.11.20 - [Data Science/이론] - DS 이론09- 선형회귀분석 DS 이론09- 선형회귀분석※ 학습자료 정리한 내용입니다.  - 상관분석을 통하여 두 변수 간에 선형성이 있음을 알았으나, 인과관계를 알 수는 없음! 회귀분석 (Regression Analysis)- (상관분석을 통해서) 두 개의 변수가 선sometipsfor.tistory.com선형회귀분석의 4가지 가정 ***출처: http://kocw-n.xcache.kinxcdn.com/data/keris/2021/leeyoonmo1021/3-4.pdf 선형성 : 독립변수와 종속변수 간 선형관계정규성 * : 오차 분산의 형태. 한 개의 x 가 가진 y 값의 오차 분산 형태.등분산성 ..

Data Science/이론 2024.11.22
728x90
반응형