Section : Exemples
Précédent : Coefficient de détermination.
Suivant : Transport aérien

Mortalité accidentelle

Pendant six années, on a relevé mensuellement la mortalité accidentelle aux États-Unis :


$\displaystyle {\cal T}$ $\displaystyle =$ $\displaystyle \{01/1973,02/1973,\ldots,12/1978\}$  
$\displaystyle \char93 {\cal T}$ $\displaystyle =$ $\displaystyle 72$  
$\displaystyle x_t$ $\displaystyle =$ nombre de décès accidentels durant le mois $\displaystyle t$  

\includegraphics[scale=.6]{Dessins/USAccDeaths03-1.epsi}

On observe à l'évidence un comportement saisonnier de la série, reflet prévisible des variations saisonnières des activités humaines. On se propose donc de construire un modèle de la forme

$\displaystyle \forall t\in{\cal T},\ \ X_t=f_{\tau}(t)+f_{\sigma}(t)+{\varepsilon}_t $
avec $ f_{\sigma}$ saisonnalité de période 12 mois, et $ {\varepsilon}$ bruit blanc faible. Pour estimer la tendance $ f_{\tau}$, on peut utiliser encore la méthode des moyennes mobiles, mais en faisant la remarque suivante : comme $ f_{\sigma}$ est une saisonnalité de période $ 12$, alors
$\displaystyle \forall t,\ \ f_{\sigma}(t)+\cdots+f_{\sigma}(t+11)=0 $
ce qui implique
$\displaystyle \forall t,\ \ \frac{1}{12}\left(\frac{1}{2}f_{\sigma}(t-6)+f_{\sigma}(t-5)+\cdots+f_{\sigma}(t+5)+\frac{1}{2}f_{\sigma}(t+6)\right)=0. $
On en déduit que
$\displaystyle \hat f_{\tau}(t)$ $\displaystyle =$ $\displaystyle MM_{12}(X)_t=\frac{1}{12}\left(\frac{1}{2}X_{t-6}+X_{t-5}+\cdots+X_{t+5}+\frac{1}{2}X_{t+6}\right)$  
  $\displaystyle =$ $\displaystyle \frac{1}{12}\left(\frac{1}{2}f_{{\tau}}(t-6)+f_{{\tau}}(t-5)+\cdots+f_{{\tau}}(t+5)+\frac{1}{2}f_{{\tau}}(t+6)\right)$  
    $\displaystyle +\frac{1}{12}\left(\frac{1}{2}{\varepsilon}_{t-6}+{\varepsilon}_{t-5}+\cdots+{\varepsilon}_{t+5}+\frac{1}{2}{\varepsilon}_{t+6}\right)$  

On élimine ainsi la partie saisonnière de la tendance, et l'on est ramené aux situations précédentes. Cette astuce peut évidemment s'adapter à toute saisonnalité, quelle que soit sa période, en distinguant entre période paire et impaire.

\includegraphics[scale=.6]{Dessins/USAccDeaths03-2.epsi}

Au vu de cette estimation de $ f_{\tau}$, on fait l'hypothèse d'un comportement parabolique. On est ainsi ramené au modèle linéaire suivant

$\displaystyle \forall t\in{\cal T},\ \ X_t={\alpha}+{\beta}t+{\gamma}t^2+{\delta}_{m(t)}+{\varepsilon}_t $
avec $ m(t)$ le mois correspondant à la date $ t$. Il s'agit donc d'un modèle qui mêle régression à deux facteurs et analyse de la variance à un facteur. On parle alors de modèle d'analyse de la covariance. Les valeurs prises par les estimateurs des moindres carrés, après application numérique, sont :
\begin{displaymath} \begin{array}{rcccrcccrcc} \hat{\alpha}&=&4,66.10^8 &&\hat{\... ...\delta}_{11}&=&-257 &&\hat {\delta}_{12}&=&-236 \ \end{array}\end{displaymath}
Remarquons que pour chacun de ces coefficients on peut effectuer un test de nullité, et ôter du modèle ceux qui ne sont pas significativement différents de zéro. Il va de soi que l'on préfère avoir le moins de paramètres possible.

\includegraphics[scale=.6]{Dessins/USAccDeaths03-3.epsi}

\includegraphics[scale=.6]{Dessins/USAccDeaths03-4.epsi}

Ce modèle permet d'estimer les variations saisonnières, et d'en déduire, par soustraction, la série corrigée des variations saisonnières :

$\displaystyle \forall t\in{\cal T},\ \ x^{cvs}_t=x_t-f_{\sigma}(t) $

\includegraphics[scale=.6]{Dessins/USAccDeaths03-5.epsi}

\includegraphics[scale=.6]{Dessins/USAccDeaths03-6.epsi}

La qualité du modèle est évidente, tant les valeurs prises par $ \left(\hat X_t,t\in{\cal T}\right)$ sont proches de la série initiale. Cela est confirmé par le coefficient de détermination $ R^2=0,92$.



Section : Exemples
Précédent : Coefficient de détermination.
Suivant : Transport aérien

Thierry Cabanal-Duvillard