반응형
Pandas를 사용해서 여러 csv 파일 합치는 방법을 알아 보겠습니다.
다음과 같은 4개 파일이 있다고 가정합니다.
- br.csv: 브라질의 매출 데이터
- id.csv: 인도네시아의 매출 데이터
- kr.csv: 한국의 매출 데이터
- jp.csv: 일본의 매출 데이터
아래 python code를 사용하여 위 4개 파일을 병합하고 csv 파일로 저장합니다.
import pandas as pd
market_list = ['br', 'id', 'kr', 'jp']
# 빈 딕셔너리 생성
market_data = {}
# 각 파일을 불러와서 딕셔너리에 저장
for market in market_list:
market_data[market] = pd.read_csv(f'{market}.csv')
# 모든 데이터를 합치기
all_data = pd.concat(market_data.values(), ignore_index=True)
# csv 파일로 저장
all_data.to_csv('combined_data.csv', index=False)
합칠 csv 파일들의 리스트를 작성합니다. 그리고 빈 딕셔너리를 생성하고, for 문을 사용하여 각 국가별 CSV 파일을 불러와 딕셔너리에 저장합니다. Pandas의 concat 함수를 사용하여 딕셔너리에 저장된 모든 데이터를 하나로 병합합니다.
combined_data.csv 파일을 열어 모든 국가의 매출 데이터가 정상적으로 병합되었는지 확인할 수 있습니다.
반응형
'Skills > Python' 카테고리의 다른 글
pip로 라이브러리 설치 후 ModuleNotFoundError 오류 해결법 (0) | 2023.05.23 |
---|---|
반복문과 딕셔너리를 활용한 다중 파일 데이터 처리 (0) | 2023.04.05 |
파이썬으로 그룹별 합계와 총합계 구하기 (0) | 2023.03.22 |