Section : Modèles linéaires
Précédent : Exercice 5.
Suivant : Test des extrema locaux

Validation du modèle

On sait comment comparer deux modèles linéaires, et l'on a défini le coefficient de détermination $ R^2$ qui n'est qu'une mesure de la pertinence ou de l'intérêt du modèle. On ne s'est pas encore préoccupé de tester si les hypothèses du modèle linéaire sont vérifiées, précisement celles qui portent sur $ {\varepsilon}$ (est-ce un bruit blanc ? un bruit blanc gaussien ?). Une fois les valeurs aberrantes retirées, la question reste en effet pendante de savoir si le modèle linéaire modélise effectivement les valeurs restantes.

On pose comme hypothèse $ H_0$ : $ \forall t\in{\cal T}$ $ X_t=f(t,{\beta})+{\varepsilon}_t$ avec $ {\varepsilon}$ bruit blanc de variance $ {\sigma}^2$ (on suppose $ {\cal T}$ débarrassé des valeurs aberrantes). Sous $ H_0$, et si $ {\beta}$ était connu, alors on pourrait déterminer $ {\varepsilon}=({\varepsilon}_t=X_t-f(t,{\beta}),t\in{\cal T})$ et vérifier par différents tests qu'il s'agit bien d'un bruit blanc. A défaut, on détermine le vecteur des résidus $ \hat{\varepsilon}=(\hat{\varepsilon}_t=X_t-f(t,\hat{\beta}),t\in{\cal T})$ . Même sous $ H_0$, il ne s'agit pas d'un bruit blanc car sa matrice de covariance n'est pas égale à un multiple de l'identité. C'est néanmoins une bonne approximation de $ {\varepsilon}$. On peut en effet donner l'argument (lui-même très approximatif !) suivant : la matrice de covariance de $ \frac{1}{\sigma}({\varepsilon}-\hat{\varepsilon})$ est l'opérateur de projection orthogonale sur l'espace vectoriel de dimension $ p$ engendré par $ {\mathbb{E}}_{{\beta}{\sigma}^2}[X]$ ; sa trace est donc égale à $ p$ ; elle est aussi égale par définition à $ \frac{1}{\sigma^2}\sum_{t\in{\cal T}}\mathop{\hbox{\upshape {var}}}\nolimits ({\varepsilon}_t-\hat{\varepsilon}_t)$ ; à supposer que toutes ces variances soient du même ordre de grandeur, il s'ensuit que $ \mathop{\hbox{\upshape {var}}}\nolimits ({\varepsilon}_t-\hat{\varepsilon}_t)$ est de l'ordre de $ \frac{p}{n}{\sigma}^2=\frac{p}{n}\mathop{\hbox{\upshape {var}}}\nolimits ({\varepsilon}_t)$ , avec $ n=\char93 {\cal T}$ ; autrement dit, $ {\varepsilon}_t=\hat{\varepsilon}_t+{\cal O}(1/\sqrt n)$. Dans la pratique des tests qui sont décrits ci-dessous, on remplacera donc les v.a. $ {\varepsilon}_t$ par leurs approximations $ \hat{\varepsilon}_t$.



Sous-sections

Section : Modèles linéaires
Précédent : Exercice 5.
Suivant : Test des extrema locaux

Thierry Cabanal-Duvillard