판다스 3

PANDAS 데이터 구조 소개

pandas의 기본 데이터 구조에 대한 빠르고 포괄적이지 않은 개요부터 시작하겠습니다. 데이터 유형, 인덱싱 및 축 레이블 지정/정렬에 대한 기본 동작은 모든 개체에 적용됩니다. 시작하려면 NumPy를 가져오고 pandas를 네임스페이스에 로드합니다. In [1]: import numpy as np In [2]: import pandas as pd 다음은 명심해야 할 기본 원칙입니다. 데이터 정렬은 본질적 입니다. 레이블과 데이터 간의 연결은 사용자가 명시적으로 수행하지 않는 한 끊어지지 않습니다. 시리즈 Series모든 데이터 유형(정수, 문자열, 부동 소수점 숫자, Python 객체 등)을 보유할 수 있는 1차원 레이블 배열입니다. 축 레이블을 집합적으로 인덱스 라고 합니다 . 시리즈를 만드는 기본 ..

카테고리 없음 2021.10.25

데이터 프레임을 html 로 변환하는 방법

판다스에서 작업을 하다보면 결과물인 데이터프레임을 이메일, 웹사이트 등에 붙여넣고 싶을 때가 종종있습니다. 스크린 샷으로 붙여넣을 수도 있겠지만 HTML 테이블 태그를 삽입한다면 더 깔끔하고 보기 좋을겁니다. 이번 시간에는 DataFrame을 HTML 형식으로 변환시켜주는 메서드 to_html()에 대해 알아보겠습니다. 1. 데이터프레임을 HTML 테이블 태그로 변환하기 [In] import pandas as pd # 데이터프레임 샘플 df_sample = pd.DataFrame( {'name': ['Kim', 'LEE', 'Park', 'Choi'], 'math': [88, 74, 72, 85], 'english': [80, 90, 78, 80] }) # HTML로 변환하기 html = df_sampl..

Python 2021.09.30

[PANDAS] csv 파일 읽어 오는법

Pandas란? 데이터를 효과적으로 처리하고, 보여줄 수 있도록 도와주는 라이브러리 Numpy와 함께 사용되어 다양한 연계적인 기능을 제공 인덱스에 따라 데이터를 나열하므로 사전(Dictionary) 자료형에 가까움 시리즈(Series)를 기본적인 자료형으로 사용 # Series: 시리즈는 인덱스와 값으로 구성됨 (칼럼이 하나) # DataFrame: 다수의 Series를 모아 처리하기 위한 목적으로 사용 (칼럼이 여러개) 표 형태로 데이터를 손쉽게 출력하고자 할 때 사용 가능 파일 읽어오기 다양한 포맷으로 된 파일을 DataFrame으로 로딩할 수 있다. read_csv( ) / read_table( ) / read_fwf( ) read_csv와 read_table의 차이는 필드 구분 문자(delimi..

Python 2021.09.30