Commit 4068a9fe authored by Barthelet Thibault's avatar Barthelet Thibault
Browse files

rapports français

parent c082f537
Loading
Loading
Loading
Loading
(132 KiB)

File moved.

rapport/source/medium_report.md

deleted100644 → 0
+0 −150
Original line number Diff line number Diff line
# Zero-Shot Time Series Forecasting for Educational Supply Chain Simulation

## Abstract

A supply chain simulation system was developed for educational purposes, combining customer behavior-driven demand generation with an interactive forecasting web application. Multiple forecasting strategies were evaluated, including traditional statistical methods and the TiRex zero-shot neural model. Results demonstrate that foundation models can outperform classical approaches on limited synthetic data without requiring retraining.

---

## 1. Context

### 1.1 Overview

Teaching supply chain forecasting requires realistic datasets, but commercial data is often restricted. Synthetic data generation is commonly employed, though producing authentic demand patterns with trend, seasonality, and natural variance remains challenging.

An additional concern in educational settings is the integration of machine learning models. Traditional approaches require retraining when simulation parameters change, creating friction in classroom environments where data may be regenerated frequently.

This work presents a simulation system with three components: a bottom-up demand generator, a student-facing web application for forecasting exercises, and an evaluation framework comparing multiple forecasting strategies including zero-shot neural methods.

### 1.2 Simulation

A customer-level simulation approach was implemented rather than top-down time series generation. Aggregate demand emerges from individual purchase decisions, producing more naturalistic patterns.

**Customer Segments:**

| Segment | Size | Purchase Frequency | Peak Months |
|---------|------|-------------------|-------------|
| Luxury Buyers | 30,000 | 18 months | Nov-Jan (holidays) |
| Sport Enthusiasts | 50,000 | 14 months | Apr-Jul (summer) |
| Casual Shoppers | 80,000 | 10 months | Sep-Oct (back-to-school) |

**Behavioral Parameters:**
- Brand affinity: Beta-distributed preference scores per product
- Price sensitivity: Affects watch selection probability
- Seasonality: Month-specific purchase probability multipliers

**Growth Dynamics:**
- Customer base: +0.2% growth monthly
- Purchase probability: +0.2% monthly increase
- Combined effect: 15-25% year-over-year demand growth

This approach ensures that trend, seasonality, and variance emerge organically from behavioral parameters rather than being mathematically imposed.

---

## 2. Experimentation

### 2.1 Dataset

The simulation generated 11 years of monthly sales data for three watch models:
- **Training set:** Years 1-10 (120 observations per product)
- **Test set:** Year 11 (12 observations per product)

### 2.2 Forecasting Strategies

Six strategies were evaluated:

| Strategy | Description |
|----------|-------------|
| **Naive** | Year 10 demand used as-is (baseline) |
| **Trend** | Year 10 + average monthly year-over-year growth |
| **AR(12)** | Autoregressive model with 12 lags |
| **Prophet** | Facebook's forecasting model with automatic seasonality |
| **TiRex** | Zero-shot xLSTM-based model (35M parameters, pre-trained on 47.5M series) |
| **Ensemble** | Simple average of all five methods |

The naive baseline was included as a reference point; any useful forecasting method should substantially outperform it.

### 2.3 Evaluation Metrics

- **MAE:** Mean Absolute Error (units)
- **RMSE:** Root Mean Square Error (penalizes large errors)
- **MAPE:** Mean Absolute Percentage Error (scale-independent)

---

## 3. Implementation

The simulation system was implemented in Python using NumPy for stochastic customer behavior modeling. The web application was built with Flask and provides students with historical data visualization, prediction input forms, and immediate feedback on forecasting accuracy and financial impact.

TiRex integration was achieved through the `tirex-ts` library with PyTorch backend. The model accepts historical context as a tensor and produces 12-month-ahead predictions without fine-tuning:

```python
context = torch.tensor(demands, dtype=torch.float32).unsqueeze(0)
quantiles, mean = model.forecast(context=context, prediction_length=12)
```

Prophet and AR models were fitted using standard implementations from `prophet` and `statsmodels` respectively.

---

## 4. Results

### 4.1 Overall Performance

| Strategy | MAE | RMSE | MAPE % |
|----------|-----|------|--------|
| **TiRex** | **24.89** | 33.39 | **3.05** |
| Prophet | 25.58 | **32.30** | 3.35 |
| Ensemble | 26.78 | 36.36 | 3.30 |
| AR(12) | 27.67 | 37.52 | 3.51 |
| Trend | 30.78 | 39.34 | 4.06 |
| Naive | 42.67 | 55.21 | 5.24 |

![Forecast Strategy Comparison](./forecast_comparison.png)

### 4.2 Per-Product Performance

**Luxury Classic:**
- TiRex achieved lowest errors across all metrics (MAPE: 3.0%)
- Prophet second-best (MAPE: 4.15%)

**Sport Pro:**
- AR(12) slightly outperformed TiRex on RMSE
- All advanced methods achieved 100% accuracy within 10% threshold

**Casual Style:**
- Prophet performed best (MAPE: 3.0%)
- TiRex second-best (MAPE: 3.11%)

### 4.3 Summary

TiRex won or tied on 2 of 4 overall metrics, with Prophet winning the remaining 2. Both substantially outperformed traditional methods. The naive baseline was outperformed by all strategies, confirming the presence of learnable patterns in the simulated data.

---

## 5. Discussion

### 5.1 Performance Analysis

The results demonstrate that TiRex, a zero-shot foundation model, outperformed Prophet and traditional statistical methods on overall MAE and MAPE despite having no exposure to this specific dataset during training. This finding is notable given that Prophet was specifically designed for business time series forecasting.

The strong performance of TiRex on only 120 training observations per product suggests effective transfer learning from its pre-training corpus of 47.5 million time series. The model successfully captured both seasonal patterns and trend components without explicit configuration.

### 5.2 Educational Applicability

The zero-shot nature of TiRex presents significant advantages for educational applications:

1. **No retraining required:** When simulation parameters are modified or new datasets are generated, TiRex can be applied immediately without computational overhead.

2. **Consistent baseline:** Students can compare their predictions against a fixed AI benchmark that does not change between simulation runs.

3. **Simplified deployment:** The absence of training pipelines reduces technical complexity in classroom environments.

4. **Reproducibility:** Results are deterministic given the same input context, facilitating grading and discussion.

---

## 6. Conclusion

A supply chain simulation system was developed and evaluated for educational forecasting exercises. The TiRex zero-shot foundation model demonstrated competitive or superior performance compared to traditional methods and Prophet, while requiring no training or fine-tuning. These characteristics make foundation models particularly suitable for educational and simulation contexts where data may change frequently and retraining is impractical.
 No newline at end of file
+173 −0
Original line number Diff line number Diff line
# Prévision Zero-Shot de Séries Temporelles pour une Simulation de Chaîne d’Approvisionnement Éducative

## Résumé

Un système de simulation de chaîne d’approvisionnement a été développé à des fins éducatives, combinant une génération de la demande basée sur le comportement des clients avec une application web interactive de prévision. Plusieurs stratégies de prévision ont été évaluées, incluant des méthodes statistiques traditionnelles et le modèle neuronal zero-shot **TiRex**. Les résultats démontrent que les modèles foundation peuvent surpasser les approches classiques sur des données synthétiques limitées sans nécessiter de réentraînement.

---

<div class="page"/>

## 1. Contexte

### 1.1 Vue d’ensemble

L’enseignement de la prévision en chaîne d’approvisionnement nécessite des jeux de données réalistes, mais les données commerciales sont souvent restreintes. La génération de données synthétiques est couramment employée, bien que la production de schémas de demande authentiques — avec tendance, saisonnalité et variance naturelle — demeure difficile.

Une préoccupation supplémentaire dans les contextes éducatifs concerne l’intégration de modèles d'apprentissage automatique. Les approches traditionnelles nécessitent un réentraînement lorsque les paramètres de simulation changent, ce qui crée des frictions dans les environnements pédagogiques où les données peuvent être régénérées fréquemment.

Ce travail présente un système de simulation composé de trois éléments : un générateur de demande ascendant, une application web destinée aux étudiants pour les exercices de prévision, et un cadre d’évaluation comparant plusieurs stratégies de prévision, y compris des méthodes neuronales zero-shot.

### 1.2 Simulation

Une approche de simulation au niveau client a été implémentée plutôt qu’une génération descendante de séries temporelles. La demande agrégée émerge des décisions d’achat individuelles, produisant des schémas plus naturalistes.

**Segments de clientèle :**

| Segment                | Taille | Fréquence d’achat | Mois de pic                |
| ---------------------- | ------ | ----------------- | -------------------------- |
| Acheteurs de luxe      | 30 000 | 18 mois           | Nov-Jan (fêtes)            |
| Passionnés de sport    | 50 000 | 14 mois           | Avr-Juil (été)             |
| Acheteurs occasionnels | 80 000 | 10 mois           | Sep-Oct (rentrée scolaire) |

**Paramètres comportementaux :**

* Affinité de marque : scores de préférence distribués selon Beta par produit
* Sensibilité au prix : affecte la probabilité de sélection d’une montre
* Saisonnalité : multiplicateurs mensuels de probabilité d’achat

**Dynamiques de croissance :**

* Base clients : +0,2 % par mois
* Probabilité d’achat : +0,2 % par mois
* Effet combiné : 15–25 % de croissance annuelle de la demande

Cette approche garantit que les tendances, la saisonnalité et la variance émergent de façon organique à partir des paramètres comportementaux plutôt que d’être imposées mathématiquement.

---

<div class="page"/>

## 2. Expérimentation

### 2.1 Jeu de données

La simulation a généré 11 années de données mensuelles de ventes pour trois modèles de montres :

* **Entraînement :** Années 1–10 (120 observations par produit)
* **Test :** Année 11 (12 observations par produit)

### 2.2 Stratégies de prévision

Six stratégies ont été évaluées :

| Stratégie    | Description                                                                             |
| ------------ | --------------------------------------------------------------------------------------- |
| **Naive**    | La demande de l’année 10 est utilisée telle quelle (référence)                          |
| **Trend**    | Année 10 + croissance moyenne mensuelle d’une année sur l’autre                         |
| **AR(12)**   | Modèle autorégressif à 12 retards                                                       |
| **Prophet**  | Modèle de prévision de Facebook avec saisonnalité automatique                           |
| **TiRex**    | Modèle zero-shot basé sur xLSTM (35 M de paramètres, pré-entraîné sur 47,5 M de séries) |
| **Ensemble** | Moyenne simple des cinq méthodes                                                        |

La base naïve a été incluse comme point de référence ; toute méthode utile devrait la surpasser nettement.

### 2.3 Métriques d’évaluation

* **MAE :** Erreur absolue moyenne (unités)
* **RMSE :** Racine de l’erreur quadratique moyenne (pénalise les grandes erreurs)
* **MAPE :** Erreur absolue moyenne en pourcentage (indépendante de l’échelle)

---

<div class="page"/>

## 3. Implémentation

Le système de simulation a été implémenté en Python en utilisant NumPy pour la modélisation stochastique du comportement client. L’application web, construite avec Flask, fournit aux étudiants une visualisation des données historiques, des formulaires de saisie de prévision et un retour immédiat sur la précision et l’impact financier des prévisions.

L’intégration de TiRex a été réalisée via la bibliothèque `tirex-ts` avec un backend PyTorch. Le modèle accepte le contexte historique sous forme de tenseur et produit des prévisions à 12 mois sans ajustement :

```python
context = torch.tensor(demands, dtype=torch.float32).unsqueeze(0)
quantiles, mean = model.forecast(context=context, prediction_length=12)
```

Les modèles Prophet et AR ont été ajustés en utilisant les implémentations standard des bibliothèques `prophet` et `statsmodels`.

---

<div class="page"/>

## 4. Résultats

### 4.1 Performance globale

| Stratégie | MAE       | RMSE      | MAPE %   |
| --------- | --------- | --------- | -------- |
| **TiRex** | **24,89** | 33,39     | **3,05** |
| Prophet   | 25,58     | **32,30** | 3,35     |
| Ensemble  | 26,78     | 36,36     | 3,30     |
| AR(12)    | 27,67     | 37,52     | 3,51     |
| Trend     | 30,78     | 39,34     | 4,06     |
| Naive     | 42,67     | 55,21     | 5,24     |

![Forecast Strategy Comparison](./forecast_comparison.png)
<div class="page"/>

### 4.2 Performance par produit
**Luxury Classic**

| Metric | Naive | Trend | AR(12) | Prophet | TiRex | Ensemble | Winner |
|--------|-------|--------|---------|---------|--------|-----------|---------|
| RMSE | 28.11 | 28.06 | 23.52 | 20.45 | 16.98 | 19.46 | TiRex |
| MAE  | 22.25 | 22.42 | 16.83 | 17.75 | 13.17 | 14.33 | TiRex |
| MAPE | 5.12  | 5.13  | 3.93  | 4.15  | 3.00  | 3.30  | TiRex |

**Sport Pro**

| Metric | Naive | Trend | AR(12) | Prophet | TiRex | Ensemble | Winner |
|--------|-------|--------|---------|---------|--------|-----------|---------|
| RMSE | 55.39 | 35.97 | 33.78 | 35.67 | 36.74 | 35.75 | AR |
| MAE  | 46.17 | 29.08 | 25.75 | 27.33 | 28.42 | 29.08 | AR |
| MAPE | 5.03  | 3.21  | 2.79  | 2.89  | 3.03  | 3.13  | AR |

**Casual Style**

| Metric | Naive | Trend | AR(12) | Prophet | TiRex | Ensemble | Winner |
|--------|-------|--------|---------|---------|--------|-----------|---------|
| RMSE | 72.71 | 50.60 | 50.29 | 37.93 | 41.31 | 48.07 | Prophet |
| MAE  | 59.58 | 40.83 | 40.42 | 31.67 | 33.08 | 36.92 | Prophet |
| MAPE | 5.55  | 3.83  | 3.80  | 3.00  | 3.11  | 3.46  | Prophet |


### 4.3 Synthèse

TiRex a gagné ou égalé 2 des 4 métriques globales, Prophet remportant les 2 restantes. Les deux ont nettement surpassé les méthodes traditionnelles. La base naïve a été dépassée par toutes les stratégies, confirmant la présence de motifs apprenables dans les données simulées.

---

<div class="page"/>

## 5. Discussion

### 5.1 Analyse des performances

Les résultats montrent que TiRex, un modèle foundation zero-shot, a surpassé Prophet et les méthodes statistiques traditionnelles en MAE et MAPE globaux malgré l’absence totale d’exposition à ce jeu de données pendant l’entraînement. Ce constat est notable, étant donné que Prophet a été spécifiquement conçu pour les séries temporelles métier.

La forte performance de TiRex avec seulement 120 observations d’entraînement par produit suggère un transfert efficace issu de son corpus de pré-entraînement de 47,5 millions de séries temporelles. Le modèle a capturé avec succès les composantes saisonnières et tendancielles sans configuration explicite.

### 5.2 Applicabilité pédagogique

La nature zero-shot de TiRex présente des avantages significatifs pour les usages éducatifs :

1. **Aucun réentraînement requis :** Lorsque les paramètres de simulation sont modifiés ou que de nouveaux jeux de données sont générés, TiRex peut être appliqué immédiatement sans coût computationnel.
2. **Référence constante :** Les étudiants peuvent comparer leurs prévisions à une référence IA stable ne changeant pas entre les exécutions de simulation.
3. **Déploiement simplifié :** L’absence de pipelines d’entraînement réduit la complexité technique dans les environnements pédagogiques.
4. **Reproductibilité :** Les résultats sont déterministes pour un même contexte d’entrée, facilitant l’évaluation et la discussion.

---

## 6. Conclusion

Un système de simulation de chaîne d’approvisionnement a été développé et évalué pour des exercices pédagogiques de prévision. Le modèle foundation zero-shot TiRex a démontré des performances compétitives ou supérieures par rapport aux méthodes traditionnelles et à Prophet, tout en ne nécessitant ni entraînement ni ajustement. Ces caractéristiques rendent les modèles foundation particulièrement adaptés aux contextes éducatifs et de simulation où les données peuvent évoluer fréquemment et où le réentraînement est peu pratique.
 No newline at end of file
+672 KiB

File added.

No diff preview for this file type.

Loading