본문 바로가기

Skills/Python

Pandas를 사용해서 여러 csv 파일 합치기

반응형

Pandas를 사용해서 여러 csv 파일 합치는 방법을 알아 보겠습니다.

다음과 같은 4개 파일이 있다고 가정합니다.

  • br.csv: 브라질의 매출 데이터
  • id.csv: 인도네시아의 매출 데이터
  • kr.csv: 한국의 매출 데이터
  • jp.csv: 일본의 매출 데이터

 
아래 python code를 사용하여 위 4개 파일을 병합하고 csv 파일로 저장합니다.

import pandas as pd

market_list = ['br', 'id', 'kr', 'jp']

# 빈 딕셔너리 생성
market_data = {}

# 각 파일을 불러와서 딕셔너리에 저장
for market in market_list:
    market_data[market] = pd.read_csv(f'{market}.csv')

# 모든 데이터를 합치기
all_data = pd.concat(market_data.values(), ignore_index=True)

# csv 파일로 저장
all_data.to_csv('combined_data.csv', index=False)

 
합칠 csv 파일들의 리스트를 작성합니다. 그리고 빈 딕셔너리를 생성하고, for 문을 사용하여 각 국가별 CSV 파일을 불러와 딕셔너리에 저장합니다. Pandas의 concat 함수를 사용하여 딕셔너리에 저장된 모든 데이터를 하나로 병합합니다. 
combined_data.csv 파일을 열어 모든 국가의 매출 데이터가 정상적으로 병합되었는지 확인할 수 있습니다.

반응형