반응형
필요한 라이브러리 설치 및 예시 데이터 생성
파이썬을 이용해 그룹별 합계와 총합계를 구하기 위해 먼저 Pandas 라이브러리를 불러오고 예시 데이터를 생성합니다.
import pandas as pd
# 예시 데이터 생성
data = {
'그룹': ['A', 'B', 'A', 'B', 'A', 'B', 'A', 'B'],
'값': [1, 2, 3, 4, 5, 6, 7, 8]
}
df = pd.DataFrame(data)
df.head()
데이터는 그룹(A, B)과 값(1~8)으로 구성됩니다.
판다스를 이용한 그룹별 합계 구하기
groupby 함수를 사용하여 '그룹' 열을 기준으로 데이터를 그룹화하고, sum 함수를 통해 그룹별 합계를 구합니다. 그리고 reset_index 함수를 이용해 인덱스를 초기화해 주었습니다.
grouped_sum = df.groupby('그룹').sum().reset_index()
grouped_sum
총합계를 추가하여 전체 데이터 확인하기
총합계를 구하기 위해 '값' 컬럼 값을 모두 더한 후, 새로운 행을 추가했습니다.
grouped_sum 데이터프레임에 전체 합계 정보를 담은 새로운 행을 추가하였습니다. append 함수를 활용하여 딕셔너리 형태로 '그룹'에 '전체'라는 문자열을 할당하고, '값'에는 이전에 계산한 총합계를 구했습니다. 또한, 인덱스 충돌을 방지하기 위해 ignore_index=True 옵션을 설정하여 인덱스를 초기화하였습니다.
# 총합계 계산
total_sum = grouped_sum['값'].sum()
# 총합계 행 추가
grouped_sum = grouped_sum.append(
{
'그룹': '전체',
'값': total_sum
},
ignore_index=True
)
grouped_sum
반응형
'Skills > Python' 카테고리의 다른 글
pip로 라이브러리 설치 후 ModuleNotFoundError 오류 해결법 (0) | 2023.05.23 |
---|---|
반복문과 딕셔너리를 활용한 다중 파일 데이터 처리 (0) | 2023.04.05 |
Pandas를 사용해서 여러 csv 파일 합치기 (0) | 2023.03.23 |