본문 바로가기

반응형

Skills/Python

(4)
pip로 라이브러리 설치 후 ModuleNotFoundError 오류 해결법 jupyter notebook에서 아래 문구 사용해서 sklearn 설치 후 pip install sklearn 아래 문구 사용해서 실행하려고 하니 from sklearn.linear_model import LinearRegression 아래와 같이 에러가 발생했다. 커널 restart도 했어도 동일했다. ModuleNotFoundError: No module named 'sklearn' 위와 같은 경우 아래와 같은 방법으로 작업하니 작동이 되었다. 1/ pip를 최신 버전으로 업그레이드. 다음 명령으로 pip를 업그레이드한다. pip install --upgrade pip 2/ scikit-learn으로 설치 pip install scikit-learn 아래 코드로 작동되는지 확인. 잘 작동되었음. f..
반복문과 딕셔너리를 활용한 다중 파일 데이터 처리 반복문과 딕셔너리를 활용한 다중 파일 데이터 처리에 대해 말씀드리겠습니다. 다음 python 코드는 각 국가별 CSV 파일을 읽어 들이고, 데이터프레임의 크기를 출력하는 코드입니다. korea = pd.read_csv('korea.csv') japan = pd.read_csv('japan.csv') china = pd.read_csv('china.csv') print('korea:', korea.shape) print('japan:', japan.shape) print('china:', china.shape)이 방법은 코드가 길어지고, 비슷한 작업이 반복되는 단점이 있습니다. 리스트가 적으면 상관없지만 리스트가 많아질 경우 코드가 길어질 수 있습니다. 다음과 같은 코드를 사용하여 동일한 결과를 도출합니다..
Pandas를 사용해서 여러 csv 파일 합치기 Pandas를 사용해서 여러 csv 파일 합치는 방법을 알아 보겠습니다. 다음과 같은 4개 파일이 있다고 가정합니다.br.csv: 브라질의 매출 데이터id.csv: 인도네시아의 매출 데이터kr.csv: 한국의 매출 데이터jp.csv: 일본의 매출 데이터 아래 python code를 사용하여 위 4개 파일을 병합하고 csv 파일로 저장합니다.import pandas as pd market_list = ['br', 'id', 'kr', 'jp'] # 빈 딕셔너리 생성 market_data = {} # 각 파일을 불러와서 딕셔너리에 저장 for market in market_list: market_data[market] = pd.read_csv(f'{market}.csv') # 모든 데이터를 합치기 all_d..
파이썬으로 그룹별 합계와 총합계 구하기 필요한 라이브러리 설치 및 예시 데이터 생성 파이썬을 이용해 그룹별 합계와 총합계를 구하기 위해 먼저 Pandas 라이브러리를 불러오고 예시 데이터를 생성합니다. import pandas as pd # 예시 데이터 생성 data = { '그룹': ['A', 'B', 'A', 'B', 'A', 'B', 'A', 'B'], '값': [1, 2, 3, 4, 5, 6, 7, 8] } df = pd.DataFrame(data) df.head() 데이터는 그룹(A, B)과 값(1~8)으로 구성됩니다. 판다스를 이용한 그룹별 합계 구하기 groupby 함수를 사용하여 '그룹' 열을 기준으로 데이터를 그룹화하고, sum 함수를 통해 그룹별 합계를 구합니다. 그리고 reset_index 함수를 이용해 인덱스를 초기화해 ..

반응형