본문 바로가기

반응형

Skills

(25)
일별 MTD ADO 계산: SQL 쿼리로 일별 MTD 평균 주문량 분석하기 데이터 분석가들은 종종 특정 시점에서 MTD(월간 누적) 평균 주문 건수, M-1 평균 주문 건수, M-3 평균 주문 건수 등을 계산해야 합니다. 이번 포스팅에서는 특정 시점이 아닌 일별로 MTD 평균 주문 건수를 계산하는 방법을 공유하려 합니다. 일별 MAU 계산도 동일한 로직으로 SQL 사용하여 계산 가능 하니 참조해 주세요.우선 MTD ADO에 대해 설명하겠습니다. MTD ADO는 Month-To-Date Average Daily Orders의 약자로, 현재 달의 시작일부터 오늘까지의 누적 주문 수를 해당 기간의 일수로 나눈 값을 의미합니다. 이는 특정 달의 일별 주문량 평균을 파악하는 데 유용합니다. 예를 들어, 특정 달의 15일까지의 주문량을 15일로 나누면, 그 달의 일별 평균 주문량을 구할 ..
데이터 분석가 포트폴리오 작성 방법 안녕하세요, 오늘은 데이터 분석가로서 포트폴리오를 작성하는 방법에 대한 제 생각을 나누고자 합니다. 요즘 데이터 분석가 및 취업 준비생들에게 이력서뿐만 아니라 포트폴리오 작성이 필수라고 느낍니다. 아래 3단계로 나눠서 작성한다면 도움이 되실 거 같습니다. 1. 배경 포트폴리오에서 프로젝트의 시작 배경을 명확히 설명해야 합니다. 프로젝트의 크기에 상관없이, 어떻게 시작되었는지가 중요합니다. 여러분이 맡았던 업무들을 그룹화하고, 그중에서 특히 영향력이 컸던 업무들을 강조합니다. 프로젝트가 단순한 지시에 의한 것이 아니라, 실제 비즈니스 문제나 필요에 대해 작성해야 합니다. 예를 들어, ad-hoc 분석 요청이나 대시보드 제작 및 관리가 있었다면, 그것이 단순한 요청에 의한 것이 아니라, 회사 내에서 어떤 필..
SQL CASE WHEN 효율적 사용법: 단일 vs 중첩 CASE WHEN 구문 단일 vs 중첩 CASE WHEN 구문을 비교해 보면서 각각의 장단점에 대해 설명해 드리겠습니다. 우선 테스트용 데이터를 생성하기 위해 아래와 같은 테이블을 생성하고 데이터를 삽입해 보겠습니다. CREATE TABLE sales ( id INT PRIMARY KEY, country VARCHAR(50), tiering VARCHAR(50) ); INSERT INTO sales (id, country, tiering) VALUES (1, 'KR', 'Tier 1'), (2, 'KR', 'Tier 2'), (3, 'KR', 'Tier 3'), (4, 'US', 'Tier 1'), (5, 'US', 'Tier 2'), (6, 'US', 'Tier 3'), (7, 'JP', 'Tier 1'), (8, 'JP',..
pip로 라이브러리 설치 후 ModuleNotFoundError 오류 해결법 jupyter notebook에서 아래 문구 사용해서 sklearn 설치 후 pip install sklearn 아래 문구 사용해서 실행하려고 하니 from sklearn.linear_model import LinearRegression 아래와 같이 에러가 발생했다. 커널 restart도 했어도 동일했다. ModuleNotFoundError: No module named 'sklearn' 위와 같은 경우 아래와 같은 방법으로 작업하니 작동이 되었다. 1/ pip를 최신 버전으로 업그레이드. 다음 명령으로 pip를 업그레이드한다. pip install --upgrade pip 2/ scikit-learn으로 설치 pip install scikit-learn 아래 코드로 작동되는지 확인. 잘 작동되었음. f..
반복문과 딕셔너리를 활용한 다중 파일 데이터 처리 반복문과 딕셔너리를 활용한 다중 파일 데이터 처리에 대해 말씀드리겠습니다. 다음 python 코드는 각 국가별 CSV 파일을 읽어 들이고, 데이터프레임의 크기를 출력하는 코드입니다. korea = pd.read_csv('korea.csv') japan = pd.read_csv('japan.csv') china = pd.read_csv('china.csv') print('korea:', korea.shape) print('japan:', japan.shape) print('china:', china.shape)이 방법은 코드가 길어지고, 비슷한 작업이 반복되는 단점이 있습니다. 리스트가 적으면 상관없지만 리스트가 많아질 경우 코드가 길어질 수 있습니다. 다음과 같은 코드를 사용하여 동일한 결과를 도출합니다..
[SQL]지난 30일간 일별 평균 주문건수 확인하기 지난 30일 동안의 일별 주문건수를 확인하는 방법에 대해 알아보겠습니다. 샘플 데이터를 생성하고, order_table에 10개의 샘플 데이터를 입력해 보겠습니다. -- 테이블 생성 CREATE TABLE order_table ( order_id INT, order_create_date DATE ); -- 샘플 데이터 삽입 INSERT INTO order_table (order_id, order_create_date) VALUES (1, '2023-03-06'), (2, '2023-03-08'), (3, '2023-03-10'), (4, '2023-03-15'), (5, '2023-03-16'), (6, '2023-03-20'), (7, '2023-03-22'), (8, '2023-04-02'), (9,..
VSCode Draw.io Integration default setting 변경 VSCode 익스텐션에서 Draw.io Integration을 받고 실행하니 화살표가 Orthogonal이 아니라 Straight으로 되어 있었고, Orthogoal로 변경하니 화살표 기본 설정이 Rounded로 되어 있었습니다. VSCode에서 해당 설정을 바꾸려면 다음과 같은 단계로 직접 설정 JSON 파일을 수정해야 합니다. 1/ Visual Studio Code를 열고, 상단 메뉴에서 파일(File) > 기본 설정(Preferences) > 설정(Settings)을 선택합니다. 2/ 설정 창의 상단에 있는 검색 상자에 "Draw.io"를 입력하여 Draw.io Integration 설정을 검색합니다. 3/ Edit in settings.json 파일을 클릭한 후에, 아래 부분은 지웁니다. 4/ 아..
[SQL] 다른 테이블의 데이터를 추가하는 방법 다른 테이블의 데이터를 추가하는 방법에 대해 설명하겠습니다. 먼저, CREATE TABLE 문과 INSERT INTO을 사용하여 새로운 테이블과 데이터를 삽입하겠습니다. -- 새로운 테이블 생성 CREATE TABLE table_a ( id INT PRIMARY KEY, column1 VARCHAR(50), column2 VARCHAR(50), column3 INT, column4 FLOAT ); -- 데이터 삽입 INSERT INTO table_a (id, column1, column2, column3, column4) VALUES (1, 'value1', 'value2', 10, 1.5), (2, 'value3', 'value4', 20, 2.5), (3, 'value5', 'value6', 30, ..

반응형