- 목차
들어가는 말
1. 전체 출력
2. 상위 n행, 하위 n행 출력
3. 행, 열 구성 확인
갈무리
들어가는 말
pandas Dataframe을 사용하면서 데이터프레임의 정보를 열람해야 하는 일이 잦습니다. 간단히 열과 행의 개수부터, 데이터프레임의 특정 행이나 열의 탐색까지 그 방식과 종류도 다양합니다. 다양한 방식을 크게 3가지로 분류해서 각 항목마다 어떠한 열람 방식이 있는지 알아보도록 하겠습니다.
#연습용 데이터프레임
import pandas as pd
name = ['홍길동', '김철수', '나일류','박민수','변지성','민지선', '강민지', '고목나','홍길동']
ID = ['apple', 'banaba', 'coconut','durian','egg','jazz', 'kiwi', 'lemon','honey']
mail = ['apple@gaegosaeng.com', 'banana@gaegosaeng.com', 'coconut@gaegosaeng.com',
'durian@gaegosaeng.com','egg@gaegosaeng.com','jazz@gaegosaeng.com',
'kiwi@gaegosaeng.com', 'lemon@gaegosaeng.com','honey@gaegosaeng.com']
df_01 = pd.DataFrame({'ID': ID, 'name': name, 'E-mail': mail})
[코드 1] 연습용 데이터프레임
1. 전체 출력
1) 전체 출력 방법 1
# 전체 출력방법 1
df_01
[코드 2] 전체 출력 방법 1
[코드 2]에서 처럼 데이터프레임 이름을 입력하면 바로 표 형태의 데이터프레임을 출력해줍니다.
2) 전체 출력 방법 2
# 전체 출력방법 2
print(df_01)
[코드 3] 전체 출력 방법 2
[코드 3]은 print()함수를 사용하여 데이터프레이을 출력합니다.
3) 전체 출력 방법3
# 전체 출력방법 3
#특히 빈 데이터프레임은 Empty표기를 해줍니다.
df_01.info
[코드 4] 전체 출력 방법 3
[코드 4]는 .info를 이용해 데이터프레임의 정보를 열람합니다. 특히 빈 데이터프레임인 경우에는 'Empty'를 표기해 줍니다.
2. 상위 n행, 하위 n행 출력
1) 상위 5행 출력
# 상위 5행 출력
df_01.head()
[코드 5] 상위 5행 출력
.head() 메서드는 상위 5행까지 출력해주는 메서드입니다. [그림 6]을 보면 첫 번째부터 다섯 번째 행까지 데이터프레임의 데이터 값이 출력된 것을 확인할 수 있습니다. 소괄호() 안에는 숫자를 입력할 수 있습니다. 숫자에 해당하는 개수만큼 행을 출력해줍니다.
2) 상위 n행 출력
# 소괄호() 안에 원하는 행의 개수를 입력하면 그 숫자만큼 출력합니다.
df_01.head(3)
[코드 6] 상위 n행 출력
[코드 6]은 소괄호() 안에 임의의 숫자인 3을 넣어서 상위 3개의 행을 출력하는 코드입니다. [그림 7]을 보면 3개의 행이 출력된 것을 확인할 수 있습니다.
3) 하위 5행 출력
# 하위 5행 출력
df_01.tail()
[코드 7] 하위 5행 출력
.tail() 메서드는 하위 5개의 행을 출력해주는 메서드입니다. [그림 8]을 보면 최하단에 위치한 행부터 차례대로 5개의 행이 출력된 것을 확인할 수 있습니다.
4) 하위 n행 출력
# 소괄호() 안에 원하는 행의 개수를 입력하면 그 숫자만큼 출력합니다.
df_01.tail(3)
[코드 8] 하위 n행 출력
[코드 8]은 소괄호() 안에 임의의 숫자 3을 넣어 최하단부터 3개의 행을 출력하는 코드입니다. [그림 9]를 보면 최하단부터 3개의 행이 출력된 것을 확인할 수 있습니다.
3. 행, 열 구성 확인
1) columns 이름(열 이름) 확인하기
# columns 이름(열 이름) 확인하기
df_01.columns
[코드 9] columns 이름(열 이름) 확인하기
[코드 9]는 .columns를 데이터프레임 이름에 붙이므로써 해당 데이터프레임이 가진 모든 열 이름을 조회할 수 있습니다.
2) 특정 columns 선택
# 특정 columns 선택
#첫번째 열은 인덱스 넘버 = 0
df_01.columns[1]
[코드 10] 특정 columns 선택
[코드 10]은 .columns[]의 대괄호[] 안에 인덱스 값을 넣어서 특정 열을 선택할 수 있습니다.
3) 행 구성 확인하기
# 행 구성 확인하기
#여기서는 표기 index가 아닌 실질 index입니다.
#표기 index 8은 9 번째 행이므로 stop=9로 표기됩니다.
df_01.index
[코드 11] 행 구성 확인하기
[코드 11]은 .index를 데이터프레임 이름 뒤에 붙여서 해당 데이터프레임이 가진 행의 구성 정보를 열람할 수 있습니다.
4) 행/열 개수 확인하기
# 행/열 개수 확인하기
df_01.shape
[코드 12] 행/열 개수 확인하기
[코드 12]는 .shape를 데이터프레임 이름 뒤에 붙여서 행의 개수와 열의 개수를 간단하게 출력할 수 있습니다. df_01 데이터프레임의 행의 개수는 9개 이고, 열의 개수는 3개 이므로 (9, 3)으로 출력됩니다.
갈무리
- 코드 전체보기
#연습용 데이터프레임
import pandas as pd
name = ['홍길동', '김철수', '나일류','박민수','변지성','민지선', '강민지', '고목나','홍길동']
ID = ['apple', 'banaba', 'coconut','durian','egg','jazz', 'kiwi', 'lemon','honey']
mail = ['apple@gaegosaeng.com', 'banana@gaegosaeng.com', 'coconut@gaegosaeng.com',
'durian@gaegosaeng.com','egg@gaegosaeng.com','jazz@gaegosaeng.com',
'kiwi@gaegosaeng.com', 'lemon@gaegosaeng.com','honey@gaegosaeng.com']
df_01 = pd.DataFrame({'ID': ID, 'name': name, 'E-mail': mail})
--------------------------------------
#1) 전체 출력방법 1
df_01
#2) 전체 출력방법 2
print(df_01)
#3) 전체 출력방법 3
#특히 빈 데이터프레임은 Empty표기를 해줍니다.
df_01.info
-------------------------------------
#4) 상위 5행 출력
df_01.head()
#5) 소괄호() 안에 원하는 행의 개수를 입력하면 그 숫자만큼 출력합니다.
df_01.head(3)
#6) 하위 5행 출력
df_01.tail()
#7) 소괄호() 안에 원하는 행의 개수를 입력하면 그 숫자만큼 출력합니다.
df_01.tail(3)
-------------------------------------
#8) columns 이름(열 이름) 확인하기
df_01.columns
#9) 특정 columns 선택
#첫번째 열은 인덱스 넘버 = 0
df_01.columns[1]
#10) 행 구성 확인하기
#여기서는 표기 index가 아닌 실질 index입니다.
#표기 index 8은 9 번째 행이므로 stop=9로 표기됩니다.
df_01.index
#11) 행/열 개수 확인하기
df_01.shape
[코드 13] 코드 전체보기
이상으로 데이터프레임의 정보를 조회하고 열람하는 방법을 알아보았습니다. 본인의 필요에 따라 적절한 방법을 골라서 사용하시기 바랍니다.
'개발고생일지 > 파이썬' 카테고리의 다른 글
pandas Dataframe(데이터프레임) 열 제목(columns), index(행) 변경 방법 (0) | 2023.03.28 |
---|---|
pandas Dataframe 데이터 값 정렬 .sort_index(), .sort_values() (0) | 2023.03.27 |
pandas Dataframe(데이터프레임) 행, 열 데이터 삭제 (0) | 2023.03.26 |
pandas Dataframe(데이터프레임) 행, 열 합치기 (병합) (0) | 2023.03.26 |
pandas dataframe(데이터프레임) index(행) 추가 (0) | 2023.03.25 |