본문 바로가기
Programming Language/Python

[Python]excel file 불러와서 특정 컬럼 추출 후 정렬, 인덱스 리셋

by trotoys 2022. 6. 16.

CDW에서 병리결과 raw data를 엑셀파일로 받아와서 Main operation 이후 Meta & Recurr로 수술한 케이스를 찾는 일을 파이썬으로 해결하고자 한다.

지금은 파일을 어떻게 해 볼지 이리저리 굴려 보는 중....

 

import pandas as pd

df = pd.read_excel('./pathology.xlsx')

# 이 과정은 for 문을 돌리기 위해 필요하다.
num_rows = df.shape[0]      # 전체 row 갯수
last_index = num_rows - 1   # index는 0부터이므로, -1 해주어야 함.

# 데이터프레임에서 특정컬럼의 데이터만 추출해서 다시 데이터셋 만들기
subset = df.loc[:,['환자번호','검사시행일','검사코드','검사명','검사결과','검사유형','처방전표분류']]

# 데이터셋 오름차순 정렬
subset = subset.sort_values(['환자번호','검사시행일'], ascending=True)


# 정렬 후 인덱스 리셋
subset = subset.reset_index(drop=True)

print(subset.head())