- SCM과 수요 예측
- 서울대학교 문일경 교수님
1. 공급망 관리(Supply Chain Management, SCM)
1.1. 공급망의 개념
-
개념
- 고객의 요구를 충족시키기 위해 직·간접적으로 참여하는 모든 관계자(공급업체, 제조업체, 배송업체, 소매업체, 고객)로 구성된 네트워크이다.
-
구성
- 원자재가 흐르는 상류(Upstream)에서
- 고객에게 도달하는 하류(Downstream)까지의 흐름을 포함한다.
-
목표
- 수요와 공급을 일치시키고, 전체 공급망의 수익성(고객 수입 - 총비용)을 극대화하는 것이다.
- 개별 단계의 이익보다는 전체 공급망의 수익성이 성공의 척도이다.
-
비용 구조
- 제조 원가(45%) 외에도 마케팅 비용(25%), 공급망 비용(20%)이 큰 비중을 차지한다.
-
전략
- 경쟁 전략(고객 요구 정의)과 공급망 전략(운영 방식 결정)이 일관성을 가져야 하며,
- 모든 상황에 통용되는 단 하나의 전략은 없다.
1.2. 공급망의 역사
-
메모
- 병참(군수)과 공급망
- 순회 판매원 경로 순회 문제 경진대회 (NP 난해 문제)
- 수요가 왜곡되는 채찍 효과
- 공급망 투명성
-
발전 과정
- 과거 (2차 대전~1981): 미국 중심의 제조, 대량 생산(Mass Production)
- 1980~90년대: 비용 절감과 효율성 추구, 닷컴 버블
- 2000년대: 중국의 WTO 가입, 아웃소싱 확대, 세계화
- 최근 (2019~현재): 미중 무역분쟁, 코로나19 등으로 인한 공급망 붕괴. 효율성보다는 회복탄력성(Resilience)이 중요해짐
-
물류의 진화
- Logistics 1.0(기계화)
- → 2.0(표준화/컨테이너)
- → 3.0(시스템화/IT)
- → Logistics 4.0(AI, IoT, 자동화 등 스마트 물류)
1.3. 공급망 구성 요소
공급망 성과는 **효율성(Efficiency)**과 대응성(Responsiveness) 사이의 트레이드오프(Trade-off)를 조절하는 6가지 요인에 의해 결정된다.
| 효율성 | 공급망 구조 | 대응성 |
|---|---|---|
| 설비 | 재고 | 수송 |
| 정보 | 외주결정 | 가격결정 |
-
설비 (Facilities): 제품 생산/보관 장소 (실제 물리적인 위치)
- 중앙 집중(효율성) vs 분산(대응성)
- 크로스 도킹
-
재고 (Inventory): 원자재, 재공품, 완제품
- 많은 재고(대응성↑, 비용↑) vs 적은 재고(효율성↑, 결품 위험)
- 종류: 주기 재고, 안전 재고(불확실성 대비), 계절 재고
-
수송 (Transportation): 재고의 이동
- 수단: 항공(빠름/비쌈), 선박/철도(느림/저렴) 등
- 혁신 사례: 1956년 말콤 맥린(Malcolm McLean)의 컨테이너 발명으로 물류 혁명 발생
- 수송 네트워크
-
정보 (Information): (가장 중요한 요인) 재고, 운송, 고객에 대한 데이터와 분석정보로 구성
- 좋은 정보는 효율성과 대응성을 동시에 개선할 수 있음 (Trade-off 불필요)
- 예: 월마트(Wal-Mart)의 정보 공유 시스템
- 수요 예측, 크로스 도킹 정보
-
외주 결정 (Sourcing): 공급사슬 활동을 누가 수행할 것인지 (직접 vs 외주)
- 예: 시스코(Cisco) - 저가 제품은 중국 생산(효율성), 고가 제품은 미국 내 생산(대응성)으로 전략 차별화
-
가격 결정 (Pricing): 공급망 내의 가용 상품과 서비스에 얼마를 지불한 것인지를 결정
- 규모의 경제, 가격 정책(High-low vs 고정 가격) 등
1.4. 공급망 관리 평가
- Gartner 선정 공급망 순위: 매년 전 세계 기업의 SCM 역량을 평가하여 순위를 발표합니다.
- 평가 기준: 전문가 의견, 재고자산 회전율, 수익 상승률, ESG 지표 등을 종합한 Composite Score 사용.
- 주요 상위 기업: Cisco Systems, Schneider Electric, Colgate-Palmolive 등 (2021~2024년 순위 자료 제시).
1.5. 공급망 관리 혁신 사례
- 접이식 컨테이너 (Foldable Containers):
- 배경: 국가 간 무역 불균형(아시아→미주/유럽 수출량 > 수입량)으로 인해 빈 컨테이너 회수 및 보관 비용 문제 발생.
- 해결: 빈 컨테이너를 1/4 크기로 접을 수 있는 기술 개발.
- 효과: 물류 비용 절감, 보관 공간 효율화.
1.6. 공급망 관리와 재난
- 앰뷸런스 드론: 심정지 환자의 골든타임 확보를 위해 앰뷸런스보다 먼저 도착하여 제세동기(AED)를 전달, 생존율을 획기적으로 높임.
- 긴급 네트워크 복구: 통신 시설이 파괴된 재난 지역(예: KT 아현지사 화재)에 드론을 띄워 임시 통신 네트워크를 구축하고 구조 활동 지원. (관련 특허 및 최적 배치 연구 소개)
1.7. 공급망 컨트롤 타워
국가 차원과 기업 차원의 컨트롤 타워는 관리 대상과 목적이 다릅니다.
-
국가급 공급망 컨트롤 타워
- 목표: 국가 안보 및 산업 보호.
- 대상: 주요 원자재 (전략 품목 선정).
- 기능: 대외 의존도 모니터링, 조기 경보 시스템, 공급선 다변화, 부처 간(국정원, 산업부, 외교부 등) 협업 조정.
-
기업급 공급망 컨트롤 타워
- 목표: 이익 창출 및 공급 안정성.
- 대상: 완제품 및 부품.
- 방법: ABC 분석 (매출/수익 기여도에 따라 A/B/C 등급으로 나누어 차별화된 관리).
- A군: 집중 관리 (매출의 50% 차지).
- C군: 최소한의 관리.
2. 수요 예측 이론
2.1. 수요 예측 개요
Forecasts are always wrong. Yet, forecasting is still essential.
-
수요 예측의 필요성
- 재고 최적화: 과잉 재고 비용 방지 및 결품으로 인한 매출 손실 방지
- 생산 및 운영 계획 수립: 설비, 인력, 원자재의 사전 확보 및 리드 타임 안정화
- 고객 만족도 향상: 원하는 시점에 제품 제공, 개인화된 경험 제공
-
수요 예측 필수 요소
- 협업 기반 예측 (Collaborative Forecasting)
- 다양한 계층에서의 예측 (Multi-level Forecasting)
- 예측 정확도 측정 (Forecast Accuracy Measurement)
- 이벤트 기반 수요 반영 (Event Planning Integration)
- 시나리오 기반 계획 (Scenario-Based Planning)
-
성공 및 실패 사례
- 성공 (Zara): 매장별 실시간 데이터와 정성적 피드백 반영, 2주 내 디자인~물류 완결 구조로 재고 리스크 최소화
- 실패 (Target Canada): 현지화 부족, 데이터 시스템 미비, 피드백 부재로 인해 2년 만에 철수(20억 달러 손실)
2.2. 전통적 통계 기반 예측 기법
A. 회귀 분석
-
회귀분석 (Regression Analysis)
- 독립변수(X)와 종속변수(Y) 간의 관계를 함수로 정의 (예: 광고비 → 매출)
- 최소제곱법: 오차의 제곱합을 최소화하는 선을 찾아 예측
- 기본 가정: 선형성, 독립성, 등분산성, 정규성 등
-
단순 선형회귀 (Simple linear regression)
- 독립변수가 하나일 때, 독립변수와 종속변수의 관계를 1차 함수(직선)로 모델링하는 회귀분석 기법
- 최소제곱법: 오차의 제곱합을 최소화하는 계수 추정치를 구하는 방법
-
다중 선형회귀 (Multiple linear regression)
- 독립변수가 두 개 이상일 때, 독립변수와 종속변수의 관계를 1차 함수로 모델링하는 회귀분석 기법
B. 시계열 분석
- 시계열 분석 (Time Series Analysis)
-
회귀분석과 달리 독립변수를 사용하지 않고, 과거 데이터 중 종속변수만을 고려하여 종속변수의 패턴을 분석하고 이를 바탕으로 미래의 값을 예측하는 통계적 기법
-
기본 가정: 종속변수의 과거의 행태가 미래에도 유사하게 지속된다.
-
과거의 패턴이 미래에도 반복된다는 가정하에 시간의 흐름에 따른 데이터를 분석
-
변동 요인: 추세(Trend), 계절성(Seasonality), 순환성(Cycle), 불규칙성(Random)
-
-
이동평균법 (Moving Average)
- 과거의 일정 구간 데이터를 평균 내어 미래를 예측하는 방식
- 단순하고 직관적이며, 노이즈 제거와 패턴 파악에 유용함
- 급격한 데이터 변화에 대해 반응이 느림
- 뚜렷한 추세 혹은 계절성이 존재할 때 부적합
- 단순 이동평균과 최근 데이터에 더 큰 가중치를 두는 가중(weighted) 이동평균이 있음
-
지수평활법 (Exponential Smoothing)
- 과거 데이터에 지수적으로 감소하는 가중치를 적용하여 예측
- 최근 데이터에 더 큰 비중을 두어 변화에 민감하게 반응
- 단순 지수 평활(simple exponential smoothing): 이동평균법과 유사하게 추세 및 계절성이 없는 데이터에 사용하기 적합
-
홀트 선형 평활법(Holt’s linear exponential smoothing)
- 추세가 있는 시계열 데이터에 적합
- 추세가 반영되어 장기 예측이 가능
- 계절성까지는 다루지 못함
-
홀트-윈터스 평활법(Holt-Winters exponential smoothing)
- 추세와 계절성을 모두 고려하는 지수평활법
- 가법형(additive) 방식과 승법형(multiplicative) 방식이 있음
2.3. ARIMA 계열 예측 기법
-
ARIMA(Autoregressive Integrated Moving Average)
- 과거(p), 추세(d), 오차(q)를 종합적으로 고려하는 시계열 모델
-
구성 요소
- AR (AutoRegressive): 과거 관측치의 선형 결합
- I (Integrated): 차분을 통해 데이터의 정상성 확보
- MA (Moving Average): 과거 오차를 이용해 잡음 제거
-
ARIMA 주요 특징
- 파라미터형 모델: 파라미터(p, d, q)만 지정하면 적용 가능
- 해석이 용이함
- 선형성 기반
- 확장성: 계절성(SARIMA)이나 외생 변수(ARIMAX)로 확장 가능
-
절차: 식별 → 추정 → 진단 → 예측의 4단계 반복
2.4. 머신러닝 예측 기법
-
수요 예측에 활발히 쓰이는 머신러닝
- 엄청난 데이터 양 + 빠른 컴퓨터 → 수요 예측에 머신러닝 기법 활용
- 간단한 패턴, 공식 기반의 전통적 기법 → 컴퓨터가 자동으로 패턴을 찾아 예측
-
개요: 방대한 데이터를 통해 컴퓨터가 자동으로 복잡한 패턴(비선형 등)을 학습
-
장점: 요일, 계절, 이벤트 등 다양한 변수 추가 용이, 비선형 관계 파악 가능
-
단점: 충분한 데이터 양과 컴퓨팅 자원 필요
-
주요 모델
- Prophet
- Meta(구 페이스북)에서 개발
- 시계열(추세, 계절성, 휴일 등) 예측에 특화, 사용이 쉬움
- 의사결정나무 (Decision Tree)
- 스무고개처럼 질문을 반복하며 예측
- 랜덤 포레스트 (Random Forest)
- 여러 개의 의사결정나무를 모아 투표하는 방식(집단 지성)으로 예측 정확도를 높임
- Prophet
2.5. 하이브리드 예측 기법
-
개념: **[통계 모델 + 머신러닝 모델]**의 결합
-
작동 원리:
- **통계 모델(예: Holt-Winters)**로 기본적인 시계열 패턴(추세, 계절성)을 1차 예측.
- 여기서 발생한 **오차(Residual)**를 **머신러닝(예: Random Forest)**이 학습하여 보정. (이벤트, 프로모션 등 비선형적 요소 반영)
- ==최종 예측 값 = 통계 모델 예측치 + 머신러닝이 예측한 오차 보정치==
-
사례 (아이스크림 수요 예측):
- 기온, 할인율, 프로모션 여부 등의 변수가 있을 때, 단일 모델(Holt-Winters나 Random Forest)보다 하이브리드 모델이 오차(MSE, MAE, MAPE)가 가장 낮아 성능이 우수함을 입증.
-
결론: 통계적 기본 패턴과 머신러닝의 변수 학습 능력을 결합하면 기업의 의사결정에 더 큰 도움을 줄 수 있음.
3. 수요 예측 실습 및 사례 분석
3.1. 실습 개요
-
목표
- 2016년 2월 ~ 2021년 1월 데이터를 학습하여,
- 2019년 10월 17일 이후 300일간의 구내식당 식수 인원(수요)을 예측하는 것
-
데이터
- 일자, 요일별 조/중/석식 메뉴, 식수 인원, 본사 정원 수, 휴가/출장/재택근무자 수 등
-
데이터 이해를 기반으로 모델 선정
- 시계열 데이터인지, 범주형 변수 포함 여부 등에 따라 적절한 알고리즘 선택
-
유의미한 요인선택 및 추가
- 계절성, 요일, 휴일, 날씨 등 예측에 영향을 줄 수 있는 변수 반영
- 도메인 지식을 바탕으로 feature engineering 수행
-
하이퍼파라미터 튜닝을 통한 성능 개선
- Grid Search, Random Search, Optuna 라이브러리 등 활용
-
하이브리드 또는 앙상블 모델 고려
- 서로 다른 예측 모델의 결과를 조합하여 예측 정확도 향상
- 최근 우수한 성능을 지속적으로 입증
3.2. 데이터 분석 (EDA) 및 전처리
-
예측 전 데이터 이해의 중요성
- 예측 모델 적용 전, 시계열 데이터의 기본 구조와 특성 파악이 필수
- 예측하고자 하는 시계열 데이터에 다음 요소가 있는지 확인: 추세 / 계절성 / 불규칙성
-
데이터 이해가 모델 성능 결정
- 데이터의 구조를 모르고 모델을 적용하면 오적합/과소적합 발생 가능
- 정확한 모델 선택과 튜닝을 위하여, 데이터 특성에 대한 이해로부터 적절한 전처리 수행 및 변수 추가 필요
-
Target Value 설정
- 단순 식수 인원이 아닌 식사 비율(식수 인원 / 총 잠재 식사 가능 인원)을 예측 목표로 설정
-
데이터 특성 파악
- 추세(Trend)
- 2019년까지 감소하다가 이후 증가하는 경향
- 계절성(Seasonality)
- 월별: 연초(1,2월)에 많고 연말(11,12월)에 적음
- 요일별: 월요일이 가장 많고 금요일로 갈수록 감소
- 메뉴 지수(선호도) 산출
- 육류 선호도가 높고 채소/해산물 선호도가 낮음
- 메뉴 텍스트 분석을 통해 선호 지수 파생 변수 생성 (방법 A: 카테고리 분류, 방법 B: 과거 식사 비율 평균)
- 추세(Trend)
-
파생 변수 생성
- 날짜 분해(연/월/일/요일)
- 메뉴 토큰화 및 선호 지수 계산
- 외부 변수(날씨, 공휴일 등)
3.3. 예측 모델별 실습 및 특징
A. 회귀분석 (Regression Analysis)
- 방법:
statsmodels라이브러리의 OLS(최소제곱법) 사용 - 변수: 연도, 월, 요일, 메뉴 선호 지수, 전일 식수 인원 등
- 결과: P-value를 통해 유의미한 변수 확인 ( 값 등을 통해 설명력 확인). 기본적인 추세는 파악하나 복잡한 패턴 예측에는 한계가 있음
B. 시계열 예측 모델 (SARIMA)
- 방법: 과거 데이터(AR), 차분(I), 이동평균(MA)에 계절성(S)을 추가한 SARIMA 모델 사용
- 최적화: Grid Search 또는
pmdarima라이브러리를 통해 최적의 파라미터(AIC 기준) 탐색 - 한계: 주간 패턴은 반영하지만, 예측값이 일정한 형태로 반복되어 실제 데이터의 비선형적 변동성을 충분히 반영하지 못함
C. 머신러닝 모델 (Random Forest)
- 방법: 다수의 의사결정나무를 결합한 앙상블 모델
- 특징: 비선형적 관계를 잘 학습하며, 하이퍼파라미터(n_estimators, max_depth 등) 튜닝이 중요
- 결과: 시계열 모델보다 데이터의 불규칙한 변동성을 더 잘 포착함
D. 하이브리드 모델 (Hybrid Model)
- 개념: 통계 모델(Holt-Winters) + 머신러닝 모델(Random Forest) 결합
- 작동 원리
- 통계 모델로 기본적인 추세와 계절성을 예측
- 발생한 오차(Residual)를 머신러닝 모델이 학습하여 예측
- 최종 예측값 = 통계 모델 예측값 + 머신러닝이 예측한 오차값
- 성과: 단일 모델들보다 오차(MSE, MAE)가 낮고 설명력()이 높아 가장 우수한 성능을 보임
E. 딥러닝 모델
- 방법: LSTM(Long Short-Term Memory) 활용
- 특징: 시계열의 흐름 학습에 강력하지만, 과적합 방지와 하이퍼파라미터 튜닝이 까다로움
3.4. 결론 및 요약
-
데이터 이해 필수
- 시계열 특성(추세, 계절성)과 변수 특성을 파악해 적절한 모델을 선정해야 함
-
Feature Engineering
- 메뉴 선호 지수, 외부 변수(날씨, 휴일) 등 유의미한 파생 변수 생성이 예측 성능에 큰 영향을 미침
-
성능 개선 전략
- 하이퍼파라미터 튜닝 (Grid Search 등)
- 하이브리드 또는 앙상블 모델 도입 (서로 다른 모델의 장점을 결합하여 정확도 향상)