• SCM과 수요 예측
    • 서울대학교 문일경 교수님

1. 공급망 관리(Supply Chain Management, SCM)

1.1. 공급망의 개념

  • 개념

    • 고객의 요구를 충족시키기 위해 직·간접적으로 참여하는 모든 관계자(공급업체, 제조업체, 배송업체, 소매업체, 고객)로 구성된 네트워크이다.
  • 구성

    • 원자재가 흐르는 상류(Upstream)에서
    • 고객에게 도달하는 하류(Downstream)까지의 흐름을 포함한다.
  • 목표

    • 수요와 공급을 일치시키고, 전체 공급망의 수익성(고객 수입 - 총비용)을 극대화하는 것이다.
    • 개별 단계의 이익보다는 전체 공급망의 수익성이 성공의 척도이다.
  • 비용 구조

    • 제조 원가(45%) 외에도 마케팅 비용(25%), 공급망 비용(20%)이 큰 비중을 차지한다.
  • 전략

    • 경쟁 전략(고객 요구 정의)과 공급망 전략(운영 방식 결정)이 일관성을 가져야 하며,
    • 모든 상황에 통용되는 단 하나의 전략은 없다.

1.2. 공급망의 역사

  • 메모

    • 병참(군수)과 공급망
    • 순회 판매원 경로 순회 문제 경진대회 (NP 난해 문제)
    • 수요가 왜곡되는 채찍 효과
    • 공급망 투명성
  • 발전 과정

    • 과거 (2차 대전~1981): 미국 중심의 제조, 대량 생산(Mass Production)
    • 1980~90년대: 비용 절감과 효율성 추구, 닷컴 버블
    • 2000년대: 중국의 WTO 가입, 아웃소싱 확대, 세계화
    • 최근 (2019~현재): 미중 무역분쟁, 코로나19 등으로 인한 공급망 붕괴. 효율성보다는 회복탄력성(Resilience)이 중요해짐
  • 물류의 진화

    • Logistics 1.0(기계화)
    • → 2.0(표준화/컨테이너)
    • → 3.0(시스템화/IT)
    • Logistics 4.0(AI, IoT, 자동화 등 스마트 물류)

1.3. 공급망 구성 요소

공급망 성과는 **효율성(Efficiency)**과 대응성(Responsiveness) 사이의 트레이드오프(Trade-off)를 조절하는 6가지 요인에 의해 결정된다.

효율성공급망 구조대응성
설비재고수송
정보외주결정가격결정
  1. 설비 (Facilities): 제품 생산/보관 장소 (실제 물리적인 위치)

    • 중앙 집중(효율성) vs 분산(대응성)
    • 크로스 도킹
  2. 재고 (Inventory): 원자재, 재공품, 완제품

    • 많은 재고(대응성↑, 비용↑) vs 적은 재고(효율성↑, 결품 위험)
    • 종류: 주기 재고, 안전 재고(불확실성 대비), 계절 재고
  3. 수송 (Transportation): 재고의 이동

    • 수단: 항공(빠름/비쌈), 선박/철도(느림/저렴) 등
    • 혁신 사례: 1956년 말콤 맥린(Malcolm McLean)의 컨테이너 발명으로 물류 혁명 발생
    • 수송 네트워크
  4. 정보 (Information): (가장 중요한 요인) 재고, 운송, 고객에 대한 데이터와 분석정보로 구성

    • 좋은 정보는 효율성과 대응성을 동시에 개선할 수 있음 (Trade-off 불필요)
    • 예: 월마트(Wal-Mart)의 정보 공유 시스템
    • 수요 예측, 크로스 도킹 정보
  5. 외주 결정 (Sourcing): 공급사슬 활동을 누가 수행할 것인지 (직접 vs 외주)

    • 예: 시스코(Cisco) - 저가 제품은 중국 생산(효율성), 고가 제품은 미국 내 생산(대응성)으로 전략 차별화
  6. 가격 결정 (Pricing): 공급망 내의 가용 상품과 서비스에 얼마를 지불한 것인지를 결정

    • 규모의 경제, 가격 정책(High-low vs 고정 가격) 등

1.4. 공급망 관리 평가

  • Gartner 선정 공급망 순위: 매년 전 세계 기업의 SCM 역량을 평가하여 순위를 발표합니다.
    • 평가 기준: 전문가 의견, 재고자산 회전율, 수익 상승률, ESG 지표 등을 종합한 Composite Score 사용.
    • 주요 상위 기업: Cisco Systems, Schneider Electric, Colgate-Palmolive 등 (2021~2024년 순위 자료 제시).

1.5. 공급망 관리 혁신 사례

  • 접이식 컨테이너 (Foldable Containers):
    • 배경: 국가 간 무역 불균형(아시아→미주/유럽 수출량 > 수입량)으로 인해 빈 컨테이너 회수 및 보관 비용 문제 발생.
    • 해결: 빈 컨테이너를 1/4 크기로 접을 수 있는 기술 개발.
    • 효과: 물류 비용 절감, 보관 공간 효율화.

1.6. 공급망 관리와 재난

  • 앰뷸런스 드론: 심정지 환자의 골든타임 확보를 위해 앰뷸런스보다 먼저 도착하여 제세동기(AED)를 전달, 생존율을 획기적으로 높임.
  • 긴급 네트워크 복구: 통신 시설이 파괴된 재난 지역(예: KT 아현지사 화재)에 드론을 띄워 임시 통신 네트워크를 구축하고 구조 활동 지원. (관련 특허 및 최적 배치 연구 소개)

1.7. 공급망 컨트롤 타워

국가 차원과 기업 차원의 컨트롤 타워는 관리 대상과 목적이 다릅니다.

  • 국가급 공급망 컨트롤 타워

    • 목표: 국가 안보 및 산업 보호.
    • 대상: 주요 원자재 (전략 품목 선정).
    • 기능: 대외 의존도 모니터링, 조기 경보 시스템, 공급선 다변화, 부처 간(국정원, 산업부, 외교부 등) 협업 조정.
  • 기업급 공급망 컨트롤 타워

    • 목표: 이익 창출 및 공급 안정성.
    • 대상: 완제품 및 부품.
    • 방법: ABC 분석 (매출/수익 기여도에 따라 A/B/C 등급으로 나누어 차별화된 관리).
      • A군: 집중 관리 (매출의 50% 차지).
      • C군: 최소한의 관리.

2. 수요 예측 이론

2.1. 수요 예측 개요

Forecasts are always wrong. Yet, forecasting is still essential.

  • 수요 예측의 필요성

    • 재고 최적화: 과잉 재고 비용 방지 및 결품으로 인한 매출 손실 방지
    • 생산 및 운영 계획 수립: 설비, 인력, 원자재의 사전 확보 및 리드 타임 안정화
    • 고객 만족도 향상: 원하는 시점에 제품 제공, 개인화된 경험 제공
  • 수요 예측 필수 요소

    • 협업 기반 예측 (Collaborative Forecasting)
    • 다양한 계층에서의 예측 (Multi-level Forecasting)
    • 예측 정확도 측정 (Forecast Accuracy Measurement)
    • 이벤트 기반 수요 반영 (Event Planning Integration)
    • 시나리오 기반 계획 (Scenario-Based Planning)
  • 성공 및 실패 사례

    • 성공 (Zara): 매장별 실시간 데이터와 정성적 피드백 반영, 2주 내 디자인~물류 완결 구조로 재고 리스크 최소화
    • 실패 (Target Canada): 현지화 부족, 데이터 시스템 미비, 피드백 부재로 인해 2년 만에 철수(20억 달러 손실)

2.2. 전통적 통계 기반 예측 기법

A. 회귀 분석

  • 회귀분석 (Regression Analysis)

    • 독립변수(X)와 종속변수(Y) 간의 관계를 함수로 정의 (예: 광고비 매출)
    • 최소제곱법: 오차의 제곱합을 최소화하는 선을 찾아 예측
    • 기본 가정: 선형성, 독립성, 등분산성, 정규성 등
  • 단순 선형회귀 (Simple linear regression)

    • 독립변수가 하나일 때, 독립변수와 종속변수의 관계를 1차 함수(직선)로 모델링하는 회귀분석 기법
    • 최소제곱법: 오차의 제곱합을 최소화하는 계수 추정치를 구하는 방법
  • 다중 선형회귀 (Multiple linear regression)

    • 독립변수가 두 개 이상일 때, 독립변수와 종속변수의 관계를 1차 함수로 모델링하는 회귀분석 기법

B. 시계열 분석

  • 시계열 분석 (Time Series Analysis)
    • 회귀분석과 달리 독립변수를 사용하지 않고, 과거 데이터 중 종속변수만을 고려하여 종속변수의 패턴을 분석하고 이를 바탕으로 미래의 값을 예측하는 통계적 기법

    • 기본 가정: 종속변수의 과거의 행태가 미래에도 유사하게 지속된다.

    • 과거의 패턴이 미래에도 반복된다는 가정하에 시간의 흐름에 따른 데이터를 분석

    • 변동 요인: 추세(Trend), 계절성(Seasonality), 순환성(Cycle), 불규칙성(Random)

  1. 이동평균법 (Moving Average)

    • 과거의 일정 구간 데이터를 평균 내어 미래를 예측하는 방식
    • 단순하고 직관적이며, 노이즈 제거와 패턴 파악에 유용함
    • 급격한 데이터 변화에 대해 반응이 느림
    • 뚜렷한 추세 혹은 계절성이 존재할 때 부적합
    • 단순 이동평균과 최근 데이터에 더 큰 가중치를 두는 가중(weighted) 이동평균이 있음
  2. 지수평활법 (Exponential Smoothing)

    • 과거 데이터에 지수적으로 감소하는 가중치를 적용하여 예측
    • 최근 데이터에 더 큰 비중을 두어 변화에 민감하게 반응
    • 단순 지수 평활(simple exponential smoothing): 이동평균법과 유사하게 추세 및 계절성이 없는 데이터에 사용하기 적합
  3. 홀트 선형 평활법(Holt’s linear exponential smoothing)

    • 추세가 있는 시계열 데이터에 적합
    • 추세가 반영되어 장기 예측이 가능
    • 계절성까지는 다루지 못함
  4. 홀트-윈터스 평활법(Holt-Winters exponential smoothing)

    • 추세와 계절성을 모두 고려하는 지수평활법
    • 가법형(additive) 방식과 승법형(multiplicative) 방식이 있음

2.3. ARIMA 계열 예측 기법

  • ARIMA(Autoregressive Integrated Moving Average)

    • 과거(p), 추세(d), 오차(q)를 종합적으로 고려하는 시계열 모델
  • 구성 요소

    • AR (AutoRegressive): 과거 관측치의 선형 결합
    • I (Integrated): 차분을 통해 데이터의 정상성 확보
    • MA (Moving Average): 과거 오차를 이용해 잡음 제거
  • ARIMA 주요 특징

    • 파라미터형 모델: 파라미터(p, d, q)만 지정하면 적용 가능
    • 해석이 용이함
    • 선형성 기반
    • 확장성: 계절성(SARIMA)이나 외생 변수(ARIMAX)로 확장 가능
  • 절차: 식별 → 추정 → 진단 → 예측의 4단계 반복

2.4. 머신러닝 예측 기법

  • 수요 예측에 활발히 쓰이는 머신러닝

    • 엄청난 데이터 양 + 빠른 컴퓨터 → 수요 예측에 머신러닝 기법 활용
    • 간단한 패턴, 공식 기반의 전통적 기법 → 컴퓨터가 자동으로 패턴을 찾아 예측
  • 개요: 방대한 데이터를 통해 컴퓨터가 자동으로 복잡한 패턴(비선형 등)을 학습

  • 장점: 요일, 계절, 이벤트 등 다양한 변수 추가 용이, 비선형 관계 파악 가능

  • 단점: 충분한 데이터 양과 컴퓨팅 자원 필요

  • 주요 모델

    • Prophet
      • Meta(구 페이스북)에서 개발
      • 시계열(추세, 계절성, 휴일 등) 예측에 특화, 사용이 쉬움
    • 의사결정나무 (Decision Tree)
      • 스무고개처럼 질문을 반복하며 예측
    • 랜덤 포레스트 (Random Forest)
      • 여러 개의 의사결정나무를 모아 투표하는 방식(집단 지성)으로 예측 정확도를 높임

2.5. 하이브리드 예측 기법

  • 개념: **[통계 모델 + 머신러닝 모델]**의 결합

  • 작동 원리:

    1. **통계 모델(예: Holt-Winters)**로 기본적인 시계열 패턴(추세, 계절성)을 1차 예측.
    2. 여기서 발생한 **오차(Residual)**를 **머신러닝(예: Random Forest)**이 학습하여 보정. (이벤트, 프로모션 등 비선형적 요소 반영)
    3. ==최종 예측 값 = 통계 모델 예측치 + 머신러닝이 예측한 오차 보정치==
  • 사례 (아이스크림 수요 예측):

    • 기온, 할인율, 프로모션 여부 등의 변수가 있을 때, 단일 모델(Holt-Winters나 Random Forest)보다 하이브리드 모델이 오차(MSE, MAE, MAPE)가 가장 낮아 성능이 우수함을 입증.
  • 결론: 통계적 기본 패턴과 머신러닝의 변수 학습 능력을 결합하면 기업의 의사결정에 더 큰 도움을 줄 수 있음.

3. 수요 예측 실습 및 사례 분석

3.1. 실습 개요

  • 목표

    • 2016년 2월 ~ 2021년 1월 데이터를 학습하여,
    • 2019년 10월 17일 이후 300일간의 구내식당 식수 인원(수요)을 예측하는 것
  • 데이터

    • 일자, 요일별 조/중/석식 메뉴, 식수 인원, 본사 정원 수, 휴가/출장/재택근무자 수 등
  • 데이터 이해를 기반으로 모델 선정

    • 시계열 데이터인지, 범주형 변수 포함 여부 등에 따라 적절한 알고리즘 선택
  • 유의미한 요인선택 및 추가

    • 계절성, 요일, 휴일, 날씨 등 예측에 영향을 줄 수 있는 변수 반영
    • 도메인 지식을 바탕으로 feature engineering 수행
  • 하이퍼파라미터 튜닝을 통한 성능 개선

    • Grid Search, Random Search, Optuna 라이브러리 등 활용
  • 하이브리드 또는 앙상블 모델 고려

    • 서로 다른 예측 모델의 결과를 조합하여 예측 정확도 향상
    • 최근 우수한 성능을 지속적으로 입증

3.2. 데이터 분석 (EDA) 및 전처리

  • 예측 전 데이터 이해의 중요성

    • 예측 모델 적용 전, 시계열 데이터의 기본 구조와 특성 파악이 필수
    • 예측하고자 하는 시계열 데이터에 다음 요소가 있는지 확인: 추세 / 계절성 / 불규칙성
  • 데이터 이해가 모델 성능 결정

    • 데이터의 구조를 모르고 모델을 적용하면 오적합/과소적합 발생 가능
    • 정확한 모델 선택과 튜닝을 위하여, 데이터 특성에 대한 이해로부터 적절한 전처리 수행 및 변수 추가 필요
  • Target Value 설정

    • 단순 식수 인원이 아닌 식사 비율(식수 인원 / 총 잠재 식사 가능 인원)을 예측 목표로 설정
  • 데이터 특성 파악

    • 추세(Trend)
      • 2019년까지 감소하다가 이후 증가하는 경향
    • 계절성(Seasonality)
      • 월별: 연초(1,2월)에 많고 연말(11,12월)에 적음
      • 요일별: 월요일이 가장 많고 금요일로 갈수록 감소
    • 메뉴 지수(선호도) 산출
      • 육류 선호도가 높고 채소/해산물 선호도가 낮음
      • 메뉴 텍스트 분석을 통해 선호 지수 파생 변수 생성 (방법 A: 카테고리 분류, 방법 B: 과거 식사 비율 평균)
  • 파생 변수 생성

    • 날짜 분해(연/월/일/요일)
    • 메뉴 토큰화 및 선호 지수 계산
    • 외부 변수(날씨, 공휴일 등)

3.3. 예측 모델별 실습 및 특징

A. 회귀분석 (Regression Analysis)

  • 방법: statsmodels 라이브러리의 OLS(최소제곱법) 사용
  • 변수: 연도, 월, 요일, 메뉴 선호 지수, 전일 식수 인원 등
  • 결과: P-value를 통해 유의미한 변수 확인 ( 값 등을 통해 설명력 확인). 기본적인 추세는 파악하나 복잡한 패턴 예측에는 한계가 있음

B. 시계열 예측 모델 (SARIMA)

  • 방법: 과거 데이터(AR), 차분(I), 이동평균(MA)에 계절성(S)을 추가한 SARIMA 모델 사용
  • 최적화: Grid Search 또는 pmdarima 라이브러리를 통해 최적의 파라미터(AIC 기준) 탐색
  • 한계: 주간 패턴은 반영하지만, 예측값이 일정한 형태로 반복되어 실제 데이터의 비선형적 변동성을 충분히 반영하지 못함

C. 머신러닝 모델 (Random Forest)

  • 방법: 다수의 의사결정나무를 결합한 앙상블 모델
  • 특징: 비선형적 관계를 잘 학습하며, 하이퍼파라미터(n_estimators, max_depth 등) 튜닝이 중요
  • 결과: 시계열 모델보다 데이터의 불규칙한 변동성을 더 잘 포착함

D. 하이브리드 모델 (Hybrid Model)

  • 개념: 통계 모델(Holt-Winters) + 머신러닝 모델(Random Forest) 결합
  • 작동 원리
    1. 통계 모델로 기본적인 추세와 계절성을 예측
    2. 발생한 오차(Residual)를 머신러닝 모델이 학습하여 예측
    3. 최종 예측값 = 통계 모델 예측값 + 머신러닝이 예측한 오차값
  • 성과: 단일 모델들보다 오차(MSE, MAE)가 낮고 설명력()이 높아 가장 우수한 성능을 보임

E. 딥러닝 모델

  • 방법: LSTM(Long Short-Term Memory) 활용
  • 특징: 시계열의 흐름 학습에 강력하지만, 과적합 방지와 하이퍼파라미터 튜닝이 까다로움

3.4. 결론 및 요약

  • 데이터 이해 필수

    • 시계열 특성(추세, 계절성)과 변수 특성을 파악해 적절한 모델을 선정해야 함
  • Feature Engineering

    • 메뉴 선호 지수, 외부 변수(날씨, 휴일) 등 유의미한 파생 변수 생성이 예측 성능에 큰 영향을 미침
  • 성능 개선 전략

    • 하이퍼파라미터 튜닝 (Grid Search 등)
    • 하이브리드 또는 앙상블 모델 도입 (서로 다른 모델의 장점을 결합하여 정확도 향상)