본문 바로가기

혼공분석 with 파이썬 공부4

[혼공분석] with 파이썬 4주차 공부 ( 4주차 추가 숙제 포함) 4-1 통계로 요약하기(1) 기술통계(=요약통계) 용어 정리 - 기술통계: 자료의 내용을 압축하여 설명하는 방법 - 통계량 : 평균, 표준편차 등 - 탐색적 데이터 분석 : 데이터 시각화를 아우르는 데이터 분석 방법 (2) 기술통계 구하기 ( 4주차 추가 과제 포함) 1) describe() 메소드 : 수치 타입 열의 기술통계를 자동으로 추출함.(%  지정하는 매개변수 : percentiles = [0.3, 0.6, 0.9] 예시. - count : (누락된 값을 제외)데이터 개수 - mean : 평균 - std : 표준편차 - min, max : 최소, 최대 - 50% : 중앙값 - 25% , 75% : 순서대로 늘어놓았을때 25% 위치한 값, 75% 위치한 값. 2) include() : 수치 외에 .. 2024. 7. 26.
[혼공분석] with 파이썬 3주차 공부 3-1 판다스 이용하여 데이터 수정하기(=데이터 정제하기, 전처리)import gdowngdown.download('https://bit.ly/3RhoNho', 'ns_202104.csv',quiet=False)import pandas as pdns_df= pd.read_csv('ns_202104.csv',low_memory = False)ns_df.head()1. 열 삭제하기(1) 범위를 지정하는 **슬라이싱**으로 열삭제(2) 범위 중간에 열만 제외하려면?  -> 불리언 배열(3) **drop(삭제할열, axis = 1, inplace = True)** 메서드 이용하기(4)판다스의 빈값인 NaN을 하나라도 포함하는 열 삭제 .**dropna(axis = 1)** 이용 ( how = 'all' 추가하면.. 2024. 7. 21.
[혼공분석] 2주차. API와 웹 스크래핑 2-1. API (1) API : 프로그램 간 데이터 전달을 위한 규칙.          → 빈번하게 반복되는 작업에는 공개 API 사용여부를 체크하기. (2)  HTTP : 웹에서 데이터 주고 받기 위한 프로토콜(=통신규약) * HTML :  웹서버로부터 회신받는 데이터               웹서버 → 웹브라우저 → HTML이 그래픽으로 화면에 표시됨.  (3) JSON : 근래에 많이 사용되는 데이터 전달 포맷                →  자바 스크립트와 웹기반 API 에서      1) 장점 :  HTML, XML과 비교하여 사람이 읽기 편함.                → 간단히 파이썬 객체로 변환 가능        2) json.dumps()와 json.loads() 메소드        .. 2024. 7. 11.
[혼공분석] with 파이썬 1주차 내용 정리 ( 새로 알게된 사실 위주) 1-1장. 데이터 분석이란1. 데이터 분석과 데이터 과학의 차이 2. 데이터 분석의 의미   3. 파이썬의 패키지 1) 넘파이(numpy) : 과학, 수학 계산 및 배열에 필요 (주로 2차원 이상의 배열인 행렬,텐서 계산 시 사용했었음) 2) 판다스(pandas) : 액셀처럼 표로 사용 3) 사이파이(SciPy) : 미적분, 선형대수 등 4) 맷플롯립(matplotlib) : 정적, 동적 그래프 작도 5) 사이킷런(scikit-learn) : 머신러닝에 사용 1-2장. 구글코랩과 주피터 노트북1. 코랩 파일 = 노트북 = 코랩 메모장 2. 코랩의 셀  1) 코드셀 2) 텍스트 셀 (HTML, 마트다운)    ◈ 마크다운# 제목1  : 큰글씨 제목##제목2 : 중간글씨 제목###제목3 : 작은글씨 제목**.. 2024. 7. 7.