개발고생일지/파이썬

pandas Dataframe 데이터프레임 정보 조회 방법들

Fartist 2023. 3. 27. 14:00
- 목차
들어가는 말
1. 전체 출력
2. 상위 n행, 하위 n행 출력
3. 행, 열 구성 확인
갈무리

[그림 1] 데이터프레임 정보 조회 방법 총정리
[그림 1] 데이터프레임 정보 조회 방법 총정리


들어가는 말

 pandas Dataframe을 사용하면서 데이터프레임의 정보를 열람해야 하는 일이 잦습니다. 간단히 열과 행의 개수부터, 데이터프레임의 특정 행이나 열의 탐색까지 그 방식과 종류도 다양합니다. 다양한 방식을 크게 3가지로 분류해서 각 항목마다 어떠한 열람 방식이 있는지 알아보도록 하겠습니다.

#연습용 데이터프레임
import pandas as pd

name = ['홍길동', '김철수', '나일류','박민수','변지성','민지선', '강민지', '고목나','홍길동']
ID = ['apple', 'banaba', 'coconut','durian','egg','jazz', 'kiwi', 'lemon','honey']
mail = ['apple@gaegosaeng.com', 'banana@gaegosaeng.com', 'coconut@gaegosaeng.com',
         'durian@gaegosaeng.com','egg@gaegosaeng.com','jazz@gaegosaeng.com', 
         'kiwi@gaegosaeng.com', 'lemon@gaegosaeng.com','honey@gaegosaeng.com']

df_01 = pd.DataFrame({'ID': ID, 'name': name, 'E-mail': mail})

[코드 1] 연습용 데이터프레임

[그림 2] 연습용 데이터프레임
[그림 2] 연습용 데이터프레임


1.  전체 출력

1) 전체 출력 방법 1

# 전체 출력방법 1
df_01

[코드 2] 전체 출력 방법 1

[그림 3] 전체 출력 방법1
[그림 3] 전체 출력 방법1

 [코드 2]에서 처럼 데이터프레임 이름을 입력하면 바로 표 형태의 데이터프레임을 출력해줍니다.


2) 전체 출력 방법 2

# 전체 출력방법 2
print(df_01)

[코드 3] 전체 출력 방법 2

[그림 4] 전체 출력 방법2
[그림 4] 전체 출력 방법2

 [코드 3]은 print()함수를 사용하여 데이터프레이을 출력합니다. 


3) 전체 출력 방법3

# 전체 출력방법 3
#특히 빈 데이터프레임은 Empty표기를 해줍니다.
df_01.info

[코드 4] 전체 출력 방법 3

[그림 5] 전체 출력 방법3
[그림 5] 전체 출력 방법3

 [코드 4]는 .info를 이용해 데이터프레임의 정보를 열람합니다. 특히 빈 데이터프레임인 경우에는 'Empty'를 표기해 줍니다.


2.  상위 n행, 하위 n행 출력

1) 상위 5행 출력

# 상위 5행 출력
df_01.head()

[코드 5] 상위 5행 출력

[그림 6] 상위 5행 출력
[그림 6] 상위 5행 출력

 .head() 메서드는 상위 5행까지 출력해주는 메서드입니다. [그림 6]을 보면  첫 번째부터 다섯 번째 행까지 데이터프레임의 데이터 값이 출력된 것을 확인할 수 있습니다. 소괄호() 안에는 숫자를 입력할 수 있습니다. 숫자에 해당하는 개수만큼 행을 출력해줍니다.


2) 상위 n행 출력

# 소괄호() 안에 원하는 행의 개수를 입력하면 그 숫자만큼 출력합니다.
df_01.head(3)

[코드 6] 상위 n행 출력

[그림 7] 상위 n행 출력
[그림 7] 상위 n행 출력

 [코드 6]은 소괄호() 안에 임의의 숫자인 3을 넣어서 상위 3개의 행을 출력하는 코드입니다. [그림 7]을 보면 3개의 행이 출력된 것을 확인할 수 있습니다.


3) 하위 5행 출력

# 하위 5행 출력
df_01.tail()

[코드 7] 하위 5행 출력

[그림 8] 하위 5행 출력
[그림 8] 하위 5행 출력

.tail() 메서드는 하위 5개의 행을 출력해주는 메서드입니다. [그림 8]을 보면 최하단에 위치한 행부터 차례대로 5개의 행이 출력된 것을 확인할 수 있습니다.


4) 하위 n행 출력

# 소괄호() 안에 원하는 행의 개수를 입력하면 그 숫자만큼 출력합니다.
df_01.tail(3)

[코드 8] 하위 n행 출력

[그림 9] 하위 n행 출력
[그림 9] 하위 n행 출력

 [코드 8]은 소괄호() 안에 임의의 숫자 3을 넣어 최하단부터 3개의 행을 출력하는 코드입니다. [그림 9]를 보면 최하단부터 3개의 행이 출력된 것을 확인할 수 있습니다.


3.  행, 열 구성 확인

1) columns 이름(열 이름) 확인하기

# columns 이름(열 이름) 확인하기
df_01.columns

[코드 9] columns 이름(열 이름) 확인하기

[그림 10] 열 이름 확인
[그림 10] 열 이름 확인

 [코드 9]는 .columns를 데이터프레임 이름에 붙이므로써 해당 데이터프레임이 가진 모든 열 이름을 조회할 수 있습니다.

 


2) 특정 columns 선택

# 특정 columns 선택
#첫번째 열은 인덱스 넘버 = 0
df_01.columns[1]

[코드 10] 특정 columns 선택

[그림 11] 특정 열 선택
[그림 11] 특정 열 선택

 [코드 10]은 .columns[]의 대괄호[] 안에 인덱스 값을 넣어서 특정 열을 선택할 수 있습니다. 


3) 행 구성 확인하기

# 행 구성 확인하기
#여기서는 표기 index가 아닌 실질 index입니다.
#표기 index 8은 9 번째 행이므로 stop=9로 표기됩니다.
df_01.index

[코드 11] 행 구성 확인하기

[그림 12] 행 구성 확인
[그림 12] 행 구성 확인

 [코드 11]은 .index를 데이터프레임 이름 뒤에 붙여서 해당 데이터프레임이 가진 행의 구성 정보를 열람할 수 있습니다. 


4) 행/열 개수 확인하기

# 행/열 개수 확인하기
df_01.shape

[코드 12] 행/열 개수 확인하기

[그림 13] 행, 열 구성 확인

 [코드 12]는 .shape를 데이터프레임 이름 뒤에 붙여서 행의 개수와 열의 개수를 간단하게 출력할 수 있습니다. df_01 데이터프레임의 행의 개수는 9개 이고, 열의 개수는 3개 이므로 (9, 3)으로 출력됩니다. 


갈무리

- 코드 전체보기

#연습용 데이터프레임
import pandas as pd

name = ['홍길동', '김철수', '나일류','박민수','변지성','민지선', '강민지', '고목나','홍길동']
ID = ['apple', 'banaba', 'coconut','durian','egg','jazz', 'kiwi', 'lemon','honey']
mail = ['apple@gaegosaeng.com', 'banana@gaegosaeng.com', 'coconut@gaegosaeng.com',
         'durian@gaegosaeng.com','egg@gaegosaeng.com','jazz@gaegosaeng.com', 
         'kiwi@gaegosaeng.com', 'lemon@gaegosaeng.com','honey@gaegosaeng.com']

df_01 = pd.DataFrame({'ID': ID, 'name': name, 'E-mail': mail})
--------------------------------------
#1) 전체 출력방법 1
df_01

#2) 전체 출력방법 2
print(df_01)

#3) 전체 출력방법 3
#특히 빈 데이터프레임은 Empty표기를 해줍니다.
df_01.info
-------------------------------------
#4) 상위 5행 출력
df_01.head()

#5) 소괄호() 안에 원하는 행의 개수를 입력하면 그 숫자만큼 출력합니다.
df_01.head(3)

#6) 하위 5행 출력
df_01.tail()

#7) 소괄호() 안에 원하는 행의 개수를 입력하면 그 숫자만큼 출력합니다.
df_01.tail(3)
-------------------------------------
#8) columns 이름(열 이름) 확인하기
df_01.columns

#9) 특정 columns 선택
#첫번째 열은 인덱스 넘버 = 0
df_01.columns[1]

#10) 행 구성 확인하기
#여기서는 표기 index가 아닌 실질 index입니다.
#표기 index 8은 9 번째 행이므로 stop=9로 표기됩니다.
df_01.index

#11) 행/열 개수 확인하기
df_01.shape

[코드 13] 코드 전체보기

 이상으로 데이터프레임의 정보를 조회하고 열람하는 방법을 알아보았습니다. 본인의 필요에 따라 적절한 방법을 골라서 사용하시기 바랍니다. 

 

 

반응형