02 SCM과 수요 예측

SCM과 수요 예측
- 서울대학교 문일경 교수님

1. 공급망 관리(Supply Chain Management, SCM)

1.1. 공급망의 개념

개념
- 고객의 요구를 충족시키기 위해 직·간접적으로 참여하는 모든 관계자(공급업체, 제조업체, 배송업체, 소매업체, 고객)로 구성된 네트워크이다.
구성
- 원자재가 흐르는 상류(Upstream)에서
- 고객에게 도달하는 하류(Downstream)까지의 흐름을 포함한다.
목표
- 수요와 공급을 일치시키고, 전체 공급망의 수익성(고객 수입 - 총비용)을 극대화하는 것이다.
- 개별 단계의 이익보다는 전체 공급망의 수익성이 성공의 척도이다.
비용 구조
- 제조 원가(45%) 외에도 마케팅 비용(25%), 공급망 비용(20%)이 큰 비중을 차지한다.
전략
- 경쟁 전략(고객 요구 정의)과 공급망 전략(운영 방식 결정)이 일관성을 가져야 하며,
- 모든 상황에 통용되는 단 하나의 전략은 없다.

1.2. 공급망의 역사

메모
- 병참(군수)과 공급망
- 순회 판매원 경로 순회 문제 경진대회 (NP 난해 문제)
- 수요가 왜곡되는 채찍 효과
- 공급망 투명성
발전 과정
- 과거 (2차 대전~1981): 미국 중심의 제조, 대량 생산(Mass Production)
- 1980~90년대: 비용 절감과 효율성 추구, 닷컴 버블
- 2000년대: 중국의 WTO 가입, 아웃소싱 확대, 세계화
- 최근 (2019~현재): 미중 무역분쟁, 코로나19 등으로 인한 공급망 붕괴. 효율성보다는 회복탄력성(Resilience)이 중요해짐
물류의 진화
- Logistics 1.0(기계화)
- → 2.0(표준화/컨테이너)
- → 3.0(시스템화/IT)
- → Logistics 4.0(AI, IoT, 자동화 등 스마트 물류)

1.3. 공급망 구성 요소

공급망 성과는 **효율성(Efficiency)**과 대응성(Responsiveness) 사이의 트레이드오프(Trade-off)를 조절하는 6가지 요인에 의해 결정된다.

효율성	공급망 구조	대응성
설비	재고	수송
정보	외주결정	가격결정

설비 (Facilities): 제품 생산/보관 장소 (실제 물리적인 위치)
- 중앙 집중(효율성) vs 분산(대응성)
- 크로스 도킹
재고 (Inventory): 원자재, 재공품, 완제품
- 많은 재고(대응성↑, 비용↑) vs 적은 재고(효율성↑, 결품 위험)
- 종류: 주기 재고, 안전 재고(불확실성 대비), 계절 재고
수송 (Transportation): 재고의 이동
- 수단: 항공(빠름/비쌈), 선박/철도(느림/저렴) 등
- 혁신 사례: 1956년 말콤 맥린(Malcolm McLean)의 컨테이너 발명으로 물류 혁명 발생
- 수송 네트워크
정보 (Information): (가장 중요한 요인) 재고, 운송, 고객에 대한 데이터와 분석정보로 구성
- 좋은 정보는 효율성과 대응성을 동시에 개선할 수 있음 (Trade-off 불필요)
- 예: 월마트(Wal-Mart)의 정보 공유 시스템
- 수요 예측, 크로스 도킹 정보
외주 결정 (Sourcing): 공급사슬 활동을 누가 수행할 것인지 (직접 vs 외주)
- 예: 시스코(Cisco) - 저가 제품은 중국 생산(효율성), 고가 제품은 미국 내 생산(대응성)으로 전략 차별화
가격 결정 (Pricing): 공급망 내의 가용 상품과 서비스에 얼마를 지불한 것인지를 결정
- 규모의 경제, 가격 정책(High-low vs 고정 가격) 등

1.4. 공급망 관리 평가

Gartner 선정 공급망 순위: 매년 전 세계 기업의 SCM 역량을 평가하여 순위를 발표합니다.
- 평가 기준: 전문가 의견, 재고자산 회전율, 수익 상승률, ESG 지표 등을 종합한 Composite Score 사용.
- 주요 상위 기업: Cisco Systems, Schneider Electric, Colgate-Palmolive 등 (2021~2024년 순위 자료 제시).

1.5. 공급망 관리 혁신 사례

접이식 컨테이너 (Foldable Containers):
- 배경: 국가 간 무역 불균형(아시아→미주/유럽 수출량 > 수입량)으로 인해 빈 컨테이너 회수 및 보관 비용 문제 발생.
- 해결: 빈 컨테이너를 1/4 크기로 접을 수 있는 기술 개발.
- 효과: 물류 비용 절감, 보관 공간 효율화.

1.6. 공급망 관리와 재난

앰뷸런스 드론: 심정지 환자의 골든타임 확보를 위해 앰뷸런스보다 먼저 도착하여 제세동기(AED)를 전달, 생존율을 획기적으로 높임.
긴급 네트워크 복구: 통신 시설이 파괴된 재난 지역(예: KT 아현지사 화재)에 드론을 띄워 임시 통신 네트워크를 구축하고 구조 활동 지원. (관련 특허 및 최적 배치 연구 소개)

1.7. 공급망 컨트롤 타워

국가 차원과 기업 차원의 컨트롤 타워는 관리 대상과 목적이 다릅니다.

국가급 공급망 컨트롤 타워
- 목표: 국가 안보 및 산업 보호.
- 대상: 주요 원자재 (전략 품목 선정).
- 기능: 대외 의존도 모니터링, 조기 경보 시스템, 공급선 다변화, 부처 간(국정원, 산업부, 외교부 등) 협업 조정.
기업급 공급망 컨트롤 타워
- 목표: 이익 창출 및 공급 안정성.
- 대상: 완제품 및 부품.
- 방법: ABC 분석 (매출/수익 기여도에 따라 A/B/C 등급으로 나누어 차별화된 관리).
  - A군: 집중 관리 (매출의 50% 차지).
  - C군: 최소한의 관리.

2. 수요 예측 이론

2.1. 수요 예측 개요

Forecasts are always wrong. Yet, forecasting is still essential.

수요 예측의 필요성
- 재고 최적화: 과잉 재고 비용 방지 및 결품으로 인한 매출 손실 방지
- 생산 및 운영 계획 수립: 설비, 인력, 원자재의 사전 확보 및 리드 타임 안정화
- 고객 만족도 향상: 원하는 시점에 제품 제공, 개인화된 경험 제공
수요 예측 필수 요소
- 협업 기반 예측 (Collaborative Forecasting)
- 다양한 계층에서의 예측 (Multi-level Forecasting)
- 예측 정확도 측정 (Forecast Accuracy Measurement)
- 이벤트 기반 수요 반영 (Event Planning Integration)
- 시나리오 기반 계획 (Scenario-Based Planning)
성공 및 실패 사례
- 성공 (Zara): 매장별 실시간 데이터와 정성적 피드백 반영, 2주 내 디자인~물류 완결 구조로 재고 리스크 최소화
- 실패 (Target Canada): 현지화 부족, 데이터 시스템 미비, 피드백 부재로 인해 2년 만에 철수(20억 달러 손실)

2.2. 전통적 통계 기반 예측 기법

A. 회귀 분석

회귀분석 (Regression Analysis)
- 독립변수(X)와 종속변수(Y) 간의 관계를 함수로 정의 (예: 광고비 → 매출)
- 최소제곱법: 오차의 제곱합을 최소화하는 선을 찾아 예측
- 기본 가정: 선형성, 독립성, 등분산성, 정규성 등
단순 선형회귀 (Simple linear regression)
- 독립변수가 하나일 때, 독립변수와 종속변수의 관계를 1차 함수(직선)로 모델링하는 회귀분석 기법
- 최소제곱법: 오차의 제곱합을 최소화하는 계수 추정치를 구하는 방법
다중 선형회귀 (Multiple linear regression)
- 독립변수가 두 개 이상일 때, 독립변수와 종속변수의 관계를 1차 함수로 모델링하는 회귀분석 기법

B. 시계열 분석

시계열 분석 (Time Series Analysis)
- 회귀분석과 달리 독립변수를 사용하지 않고, 과거 데이터 중 종속변수만을 고려하여 종속변수의 패턴을 분석하고 이를 바탕으로 미래의 값을 예측하는 통계적 기법
- 기본 가정: 종속변수의 과거의 행태가 미래에도 유사하게 지속된다.
- 과거의 패턴이 미래에도 반복된다는 가정하에 시간의 흐름에 따른 데이터를 분석
- 변동 요인: 추세(Trend), 계절성(Seasonality), 순환성(Cycle), 불규칙성(Random)

이동평균법 (Moving Average)
- 과거의 일정 구간 데이터를 평균 내어 미래를 예측하는 방식
- 단순하고 직관적이며, 노이즈 제거와 패턴 파악에 유용함
- 급격한 데이터 변화에 대해 반응이 느림
- 뚜렷한 추세 혹은 계절성이 존재할 때 부적합
- 단순 이동평균과 최근 데이터에 더 큰 가중치를 두는 가중(weighted) 이동평균이 있음
지수평활법 (Exponential Smoothing)
- 과거 데이터에 지수적으로 감소하는 가중치를 적용하여 예측
- 최근 데이터에 더 큰 비중을 두어 변화에 민감하게 반응
- 단순 지수 평활(simple exponential smoothing): 이동평균법과 유사하게 추세 및 계절성이 없는 데이터에 사용하기 적합
홀트 선형 평활법(Holt’s linear exponential smoothing)
- 추세가 있는 시계열 데이터에 적합
- 추세가 반영되어 장기 예측이 가능
- 계절성까지는 다루지 못함
홀트-윈터스 평활법(Holt-Winters exponential smoothing)
- 추세와 계절성을 모두 고려하는 지수평활법
- 가법형(additive) 방식과 승법형(multiplicative) 방식이 있음

2.3. ARIMA 계열 예측 기법

ARIMA(Autoregressive Integrated Moving Average)
- 과거(p), 추세(d), 오차(q)를 종합적으로 고려하는 시계열 모델
구성 요소
- AR (AutoRegressive): 과거 관측치의 선형 결합
- I (Integrated): 차분을 통해 데이터의 정상성 확보
- MA (Moving Average): 과거 오차를 이용해 잡음 제거
ARIMA 주요 특징
- 파라미터형 모델: 파라미터(p, d, q)만 지정하면 적용 가능
- 해석이 용이함
- 선형성 기반
- 확장성: 계절성(SARIMA)이나 외생 변수(ARIMAX)로 확장 가능
절차: 식별 → 추정 → 진단 → 예측의 4단계 반복

2.4. 머신러닝 예측 기법

수요 예측에 활발히 쓰이는 머신러닝
- 엄청난 데이터 양 + 빠른 컴퓨터 → 수요 예측에 머신러닝 기법 활용
- 간단한 패턴, 공식 기반의 전통적 기법 → 컴퓨터가 자동으로 패턴을 찾아 예측
개요: 방대한 데이터를 통해 컴퓨터가 자동으로 복잡한 패턴(비선형 등)을 학습
장점: 요일, 계절, 이벤트 등 다양한 변수 추가 용이, 비선형 관계 파악 가능
단점: 충분한 데이터 양과 컴퓨팅 자원 필요
주요 모델
- Prophet
  - Meta(구 페이스북)에서 개발
  - 시계열(추세, 계절성, 휴일 등) 예측에 특화, 사용이 쉬움
- 의사결정나무 (Decision Tree)
  - 스무고개처럼 질문을 반복하며 예측
- 랜덤 포레스트 (Random Forest)
  - 여러 개의 의사결정나무를 모아 투표하는 방식(집단 지성)으로 예측 정확도를 높임

2.5. 하이브리드 예측 기법

개념: **[통계 모델 + 머신러닝 모델]**의 결합
작동 원리:
1. **통계 모델(예: Holt-Winters)**로 기본적인 시계열 패턴(추세, 계절성)을 1차 예측.
2. 여기서 발생한 **오차(Residual)**를 **머신러닝(예: Random Forest)**이 학습하여 보정. (이벤트, 프로모션 등 비선형적 요소 반영)
3. ==최종 예측 값 = 통계 모델 예측치 + 머신러닝이 예측한 오차 보정치==
사례 (아이스크림 수요 예측):
- 기온, 할인율, 프로모션 여부 등의 변수가 있을 때, 단일 모델(Holt-Winters나 Random Forest)보다 하이브리드 모델이 오차(MSE, MAE, MAPE)가 가장 낮아 성능이 우수함을 입증.
결론: 통계적 기본 패턴과 머신러닝의 변수 학습 능력을 결합하면 기업의 의사결정에 더 큰 도움을 줄 수 있음.

3. 수요 예측 실습 및 사례 분석

3.1. 실습 개요

목표
- 2016년 2월 ~ 2021년 1월 데이터를 학습하여,
- 2019년 10월 17일 이후 300일간의 구내식당 식수 인원(수요)을 예측하는 것
데이터
- 일자, 요일별 조/중/석식 메뉴, 식수 인원, 본사 정원 수, 휴가/출장/재택근무자 수 등
데이터 이해를 기반으로 모델 선정
- 시계열 데이터인지, 범주형 변수 포함 여부 등에 따라 적절한 알고리즘 선택
유의미한 요인선택 및 추가
- 계절성, 요일, 휴일, 날씨 등 예측에 영향을 줄 수 있는 변수 반영
- 도메인 지식을 바탕으로 feature engineering 수행
하이퍼파라미터 튜닝을 통한 성능 개선
- Grid Search, Random Search, Optuna 라이브러리 등 활용
하이브리드 또는 앙상블 모델 고려
- 서로 다른 예측 모델의 결과를 조합하여 예측 정확도 향상
- 최근 우수한 성능을 지속적으로 입증

3.2. 데이터 분석 (EDA) 및 전처리

예측 전 데이터 이해의 중요성
- 예측 모델 적용 전, 시계열 데이터의 기본 구조와 특성 파악이 필수
- 예측하고자 하는 시계열 데이터에 다음 요소가 있는지 확인: 추세 / 계절성 / 불규칙성
데이터 이해가 모델 성능 결정
- 데이터의 구조를 모르고 모델을 적용하면 오적합/과소적합 발생 가능
- 정확한 모델 선택과 튜닝을 위하여, 데이터 특성에 대한 이해로부터 적절한 전처리 수행 및 변수 추가 필요
Target Value 설정
- 단순 식수 인원이 아닌 식사 비율(식수 인원 / 총 잠재 식사 가능 인원)을 예측 목표로 설정
데이터 특성 파악
- 추세(Trend)
  - 2019년까지 감소하다가 이후 증가하는 경향
- 계절성(Seasonality)
  - 월별: 연초(1,2월)에 많고 연말(11,12월)에 적음
  - 요일별: 월요일이 가장 많고 금요일로 갈수록 감소
- 메뉴 지수(선호도) 산출
  - 육류 선호도가 높고 채소/해산물 선호도가 낮음
  - 메뉴 텍스트 분석을 통해 선호 지수 파생 변수 생성 (방법 A: 카테고리 분류, 방법 B: 과거 식사 비율 평균)
파생 변수 생성
- 날짜 분해(연/월/일/요일)
- 메뉴 토큰화 및 선호 지수 계산
- 외부 변수(날씨, 공휴일 등)

3.3. 예측 모델별 실습 및 특징

A. 회귀분석 (Regression Analysis)

방법: statsmodels 라이브러리의 OLS(최소제곱법) 사용
변수: 연도, 월, 요일, 메뉴 선호 지수, 전일 식수 인원 등
결과: P-value를 통해 유의미한 변수 확인 ( $R^{2}$ 값 등을 통해 설명력 확인). 기본적인 추세는 파악하나 복잡한 패턴 예측에는 한계가 있음

B. 시계열 예측 모델 (SARIMA)

방법: 과거 데이터(AR), 차분(I), 이동평균(MA)에 계절성(S)을 추가한 SARIMA 모델 사용
최적화: Grid Search 또는 pmdarima 라이브러리를 통해 최적의 파라미터(AIC 기준) 탐색
한계: 주간 패턴은 반영하지만, 예측값이 일정한 형태로 반복되어 실제 데이터의 비선형적 변동성을 충분히 반영하지 못함

C. 머신러닝 모델 (Random Forest)

방법: 다수의 의사결정나무를 결합한 앙상블 모델
특징: 비선형적 관계를 잘 학습하며, 하이퍼파라미터(n_estimators, max_depth 등) 튜닝이 중요
결과: 시계열 모델보다 데이터의 불규칙한 변동성을 더 잘 포착함

D. 하이브리드 모델 (Hybrid Model)

개념: 통계 모델(Holt-Winters) + 머신러닝 모델(Random Forest) 결합
작동 원리
1. 통계 모델로 기본적인 추세와 계절성을 예측
2. 발생한 오차(Residual)를 머신러닝 모델이 학습하여 예측
3. 최종 예측값 = 통계 모델 예측값 + 머신러닝이 예측한 오차값
성과: 단일 모델들보다 오차(MSE, MAE)가 낮고 설명력( $R^{2}$ )이 높아 가장 우수한 성능을 보임

E. 딥러닝 모델

방법: LSTM(Long Short-Term Memory) 활용
특징: 시계열의 흐름 학습에 강력하지만, 과적합 방지와 하이퍼파라미터 튜닝이 까다로움

3.4. 결론 및 요약

데이터 이해 필수
- 시계열 특성(추세, 계절성)과 변수 특성을 파악해 적절한 모델을 선정해야 함
Feature Engineering
- 메뉴 선호 지수, 외부 변수(날씨, 휴일) 등 유의미한 파생 변수 생성이 예측 성능에 큰 영향을 미침
성능 개선 전략
- 하이퍼파라미터 튜닝 (Grid Search 등)
- 하이브리드 또는 앙상블 모델 도입 (서로 다른 모델의 장점을 결합하여 정확도 향상)

Archive

탐색기

02 SCM과 수요 예측

1. 공급망 관리(Supply Chain Management, SCM)

1.1. 공급망의 개념

1.2. 공급망의 역사

1.3. 공급망 구성 요소

1.4. 공급망 관리 평가

1.5. 공급망 관리 혁신 사례

1.6. 공급망 관리와 재난

1.7. 공급망 컨트롤 타워

2. 수요 예측 이론

2.1. 수요 예측 개요

2.2. 전통적 통계 기반 예측 기법

A. 회귀 분석

B. 시계열 분석

2.3. ARIMA 계열 예측 기법

2.4. 머신러닝 예측 기법

2.5. 하이브리드 예측 기법

3. 수요 예측 실습 및 사례 분석

3.1. 실습 개요

3.2. 데이터 분석 (EDA) 및 전처리

3.3. 예측 모델별 실습 및 특징

A. 회귀분석 (Regression Analysis)

B. 시계열 예측 모델 (SARIMA)

C. 머신러닝 모델 (Random Forest)

D. 하이브리드 모델 (Hybrid Model)

E. 딥러닝 모델

3.4. 결론 및 요약

그래프 뷰

목차