$\textstyle \parbox{10cm}{\scriptsize Universit\'e de Paris 5 -- Ren\'e Descart... ...matiques et Informatique}\ 45, rue des Saints-P\\lq eres 75270 Paris cedex 06 }$ \includegraphics[width=22mm]{/home/tcd/icones/p5_petit.ps}




Statistique des Processus - Maîtrise MASS


Corrigé de l'examen du 10 juin 2003


9h - 12h



Ex 1.

  1. Vrai. Si $ X$ et $ Y$ sont deux processus faiblement stationnaires indépendants de fonctions d'autocovariance $ {\gamma}_X$ et $ {\gamma}_Y$, alors $ X+Y$ est aussi un processus faiblement stationnaire de fonction d'autocovariance $ {\gamma}_{X+Y}={\gamma}_X+{\gamma}_Y$. Si $ X$ et $ Y$ sont de plus des processus MA, alors $ {\gamma}_X$ et $ {\gamma}_Y$ s'annulent à partir d'un certain rang ; il en est donc de même pour $ {\gamma}_{X+Y}$. Or cela est caractéristique d'un processus MA.
  2. Vrai. Si $ X$ et $ Y$ sont deux processus faiblement stationnaires indépendants tels que $ {\phi}(B)(X)={\varepsilon}$ et $ Y={\theta}(B)({\varepsilon}')$, alors $ X+Y$ est aussi un processus faiblement stationnaire tel que $ {\phi}(B)(X+Y)={\varepsilon}+{\phi}(B)\circ{\theta}(B)({\varepsilon}')$ . Or le processus $ {\varepsilon}+{\phi}(B)\circ{\theta}(B)({\varepsilon}')$ est un processus MA comme somme de deux processus MA indépendants (cf question précédente). Ce qui montre que $ X+Y$ est un ARMA.
  3. Faux (sauf cas particulier). Exemple : $ X={\varepsilon}$ et $ Y$ faiblement stationnaire tel que $ (I-0,5B)(Y)={\varepsilon}'$ avec $ {\varepsilon}$ et $ {\varepsilon}'$ indépendants. Alors $ X+Y$ vérifie $ (I-0,5B)(X+Y)=(I-0,5B)({\varepsilon})+{\varepsilon}'$. La fonction d'autocovariance de $ (I-0,5B)({\varepsilon})+{\varepsilon}'$ ne s'annule pas en $ 1$, mais s'annule à partir du rang $ 2$ : il s'agit donc d'une MA($ 1$). Autrement dit, $ X+Y$ est un ARMA($ 1,1$).
  4. Vrai. Un processus faiblement stationnaire dont la fonction d'autocorrélation s'annule à partir du rang $ 1$ inclus est un bruit blanc faible ; sa fonction d'autocorrélation partielle s'annule donc aussi à partir du rang $ 1$ inclus.
  5. Faux. Il existe une représentation de Wold pour tout processus faiblement stationnaire.
  6. Vrai si le processus ARMA possède une représentation inversible. En effet, si $ X$ est un processus ARMA tel que $ {\phi}(B)(X)={\theta}(B)({\varepsilon})$, alors la densité spectrale vaut
    $\displaystyle f_X({\theta})=\frac{1}{2{\pi}}\left\vert \frac{{\theta}(e^{i{\theta}})}{{\phi}(e^{i{\theta}})}\right\vert^2 $
    Elle s'annule si et seulement s'il existe $ {\theta}_0$ tel que $ {\theta}(e^{i{\theta_0}})=0$, autrement dit si la transformée en $ z$ de $ {\theta}(B)$ s'annule sur le cercle unité.
  7. Faux, si la période est connue. Par exemple, un modèle du type $ Y_t={\alpha}\cos(t{\omega})+{\beta}\sin({\omega}t)+X_t$ avec $ {\alpha},{\beta}$ paramètres et $ X$ bruit corrélé modélise une tendance périodique.
  8. Vrai. Un bruit corrélé n'est autre que l'image par une transformation linéaire inversible d'un bruit blanc ordinaire qu'on peut dès lors tester.
  9. Faux. Un processus ARIMA($ p,d,q$) n'est pas faiblement stationnaire dès lors que $ d\geq 1$.
  10. Faux. L'histoire ne se répète pas... Un processus d'innovation est une famille de variables décorrélées, et ne peut être périodique que s'il est nul.


Ex 2.

  1. $ X$ est un processus AR($ 2$), $ Y$ un ARMA($ 1,1$) et $ Z$ un MA($ 2$).
  2. Calculons les densités spectrales :


Ex 3.

    1. Soit $ \hat{\rho}_X$ l'estimateur empirique de la fonction d'autocorrélation de $ X$ :
      $\displaystyle \forall t=0,\ldots,N-1,\ \hat{\rho}_X(t)=\frac{\frac{1}{N-t}\s... ...^{N-t}(X_u-\bar X_N)(X_{u+t}-\bar X)}{\frac{1}{N}\sum_{u=1}^N(X_u-\bar X_N)^2} $
      qu'on peut remplacer ici par
      $\displaystyle \forall t=0,\ldots,N-1,\ \hat{\rho}_X(t)=\frac{\frac{1}{N-t}\sum_{u=1}^{N-t}X_uX_{u+t}}{\frac{1}{N}\sum_{u=1}^NX_u^2} $
      dans la mesure où l'on sait que le processus $ X$ est centré. Si $ X$ est un processus AR($ p$), tel que $ X_t+{\varphi}_1X_{t-1}+\cdots+{\varphi}_pX_{t-p}={\varepsilon}_t$ , alors l'estimateur préliminaire de $ ({\varphi}_1,\ldots,{\varphi}_p)$ vérifie les équations de Yule-Walker
      $\displaystyle \left( \begin{array}{cccc} 1&\hat{\rho}_X(1)&\ldots&\hat{\rho}_X(... ...{\rho}_X(1)\ \hat{\rho}_X(2)\ \vdots\ \hat{\rho}_X(p) \end{array}\right) $
      Ici $ p=1$, et on en déduit
      $\displaystyle \hat{\varphi}=\hat{\rho}_X(1)=\frac{N}{N-1}\frac{\sum_{t=2}^NX_tX_{t-1}}{\sum_{t=1}^NX_t^2}. $
    2. Par définition, $ \tilde{\varepsilon}_1=X_1$. Pour $ t\geq2$,
      $\displaystyle \tilde{\varepsilon}_t$ $\displaystyle =$ $\displaystyle X_t-P^\bot_{V^2(1,X_1,\ldots,X_{t-1})}\left(X_t\right)$  
        $\displaystyle =$ $\displaystyle X_t-P^\bot_{V^2(1,X_1,\ldots,X_{t-1})}\left({\varepsilon}_t\right)-{\varphi}P^\bot_{V^2(1,X_1,\ldots,X_{t-1})}\left(X_{t-1}\right)$  
        $\displaystyle =$ $\displaystyle X_t-0-{\varphi}X_{t-1}={\varepsilon}_t$  

      car $ {\varepsilon}_t\bot V^2(1,X_1,\ldots,X_{t-1})$ : en effet, $ {\varepsilon}$ est le bruit blanc d'innovation associé à $ X$ car on a supposé $ \left\vert {\varphi}\right\vert<1$, ce qui implique que la représentation ARMA est causale et inversible.
    3. Notons $ {\delta}_t=\mathop{\hbox{\upshape {var}}}\nolimits (\tilde{\varepsilon}_t)/{\sigma}^2$ . L'estimateur des moindres carrés ordinaires de $ {\varphi}$ est la valeur $ \hat{\varphi}_{mco}$ qui minimise
      $\displaystyle {\varphi}\mapsto\frac{1}{N}\sum_{t=1}^N\frac{\tilde{\varepsilon}_t^2}{{\delta}_t} $
      $ \tilde {\varepsilon}_t$ est vu comme fonction de $ {\varphi}$, $ X_1,\ldots,X_t$. Or $ \tilde{\varepsilon}_1=X_1$, $ {\delta}_1=\mathop{\hbox{\upshape {var}}}\nolimits (X_1)/{\sigma}^2=1/(1-{\varphi}^2)$ selon un calcul habituel, $ \tilde{\varepsilon}_t=X_t-{\varphi}X_{t-1}$ et $ {\delta}_t=1$ quel que soit $ t>1$. On en déduit que
      $\displaystyle \sum_{t=1}^N\frac{\tilde{\varepsilon}_t^2}{{\delta}_t}=(1-{\varph... ...{t=1}^NX_t^2-2{\varphi}\sum_{t=2}^NX_tX_{t-1}+{\varphi}^2\sum_{t=2}^{N-1}X_t^2 $
      Il s'agit donc d'un polynôme du second degré en $ {\varphi}$, qui atteint son minimum en
      $\displaystyle \hat{\varphi}_{mco}=\frac{\sum_{t=2}^NX_tX_{t-1}}{\sum_{t=2}^{N-1}X_t^2} $
      On en déduit l'estimateur de $ {\sigma}^2$ :
      $\displaystyle \hat{\sigma}^2_{mco}$ $\displaystyle =$ $\displaystyle \frac{1}{N}\sum_{t=1}^N\frac{\tilde{\varepsilon}_t^2}{{\delta}_t}\Big\vert_{{\varphi}=\hat{\varphi}_{mco}}$  
        $\displaystyle =$ $\displaystyle \frac{1}{N}\left(\sum_{t=1}^NX_t^2-\frac{\left(\sum_{t=2}^NX_tX_{t-1}\right)^2}{\sum_{t=2}^{N-1}X_t^2}\right)$  

    4. L'estimateur des moindres carrés conditionnels de $ {\varphi}$ est la valeur $ \hat{\varphi}_{mcc}$ qui minimise
      $\displaystyle {\varphi}\mapsto\frac{1}{N}\sum_{t=1}^N{\varepsilon}_t^2 $
      avec $ {\varepsilon}_t=X_t-{\varphi}X_{t-1}$, et en supposant $ X_u=0$ quel que soit $ u\leq 0$. D'où
      $\displaystyle \sum_{t=1}^N{\varepsilon}_t^2=X_1^2+\sum_{t=2}^N(X_t-{\varphi}X_{... ...{t=1}^NX_t^2-2{\varphi}\sum_{t=2}^NX_tX_{t-1}+{\varphi}^2\sum_{t=1}^{N-1}X_t^2 $
      Il s'agit d'un polynôme en $ {\varphi}$ qui atteint son minimum en
      $\displaystyle \hat{\varphi}_{mcc}=\frac{\sum_{t=2}^NX_tX_{t-1}}{\sum_{t=1}^{N-1}X_t^2} $
      Comparaison de $ \hat{\varphi}_{mco}$ et de $ \hat{\varphi}_{mcc}$ :
      $\displaystyle \hat{\varphi}_{mco}-\hat{\varphi}_{mcc}=\sum_{t=2}^NX_tX_{t-1}\fr... ..._1^2}{N^2{\gamma}_X(0)^2}=\frac{X_1^2}{N}\frac{{\gamma}_X(1)}{{\gamma}_X(0)^2} $
      L'écart est donc d'ordre $ 1/N$.
    5. L'estimateur du maximum de vraisemblance de $ {\varphi}$ dans le cas gaussien est la valeur $ \hat{\varphi}_{mv}$ qui minimise
      $\displaystyle {\varphi}\mapsto\frac{1}{N}\sum_{t=1}^N\frac{\tilde{\varepsilon}_... ...t=2}^NX_tX_{t-1}+{\varphi}^2\sum_{t=2}^{N-1}X_t^2+(1-{\varphi}^2)^{1/N}\right) $
      Le point où la fonction précédente s'annule correspond à la valeur $ \hat{\varphi}_{mv}$. Pour comparer $ \hat{\varphi}_{mco}$ et $ \hat{\varphi}_{mv}$, on utilise les inégalités suivantes :
          $\displaystyle \hskip-1cm\frac{1}{N}\left(\sum_{t=1}^NX_t^2-2\hat{\varphi}_{mco}\sum_{t=2}^NX_tX_{t-1}+\hat{\varphi}_{mco}^2\sum_{t=2}^{N-1}X_t^2\right)$  
        $\displaystyle \leq$ $\displaystyle \frac{1}{N}\left(\sum_{t=1}^NX_t^2-2\hat{\varphi}_{mv}\sum_{t=2}^NX_tX_{t-1}+{\varphi}^2_{mv}\sum_{t=2}^{N-1}X_t^2\right)$ $\displaystyle \mbox{ car $\hat{\varphi}_{mco}$\ est minimisant}$  
        $\displaystyle <$ $\displaystyle \frac{1}{N}\left(\sum_{t=1}^NX_t^2-2{\varphi}\sum_{t=2}^NX_tX_{t-1}+{\varphi}^2\sum_{t=2}^{N-1}X_t^2+(1-{\varphi}^2)^{1/N}\right)$ car $\displaystyle 0<(1-{\varphi}^2)^{1/N}$  
        $\displaystyle <$ $\displaystyle \frac{1}{N}\left(\sum_{t=1}^NX_t^2-2{\varphi}\sum_{t=2}^NX_tX_{t-1}+{\varphi}^2\sum_{t=2}^{N-1}X_t^2+1\right)$ car $\displaystyle (1-{\varphi}^2)^{1/N}<1$  

      En mettant ces polynômes du second degré sous forme canonique, et en utilisant le fait que $ \hat{\varphi}_{mco}=\frac{\sum_{t=2}^NX_tX_{t-1}}{\sum_{t=2}^{N-1}X_t^2}$ , on en déduit
      $\displaystyle 0<\left(\hat{\varphi}_{mv}-\hat{\varphi}_{mco}\right)^2<\frac{1}{\sum_{t=2}^{N-1}X_t^2} $
      D'où le résultat attendu
      $\displaystyle \left\vert \hat{\varphi}_{mv}-\hat{\varphi}_{mco}\right\vert <\frac{1}{\sqrt{\sum_{t=2}^{N-1}X_t^2}} $
      Notons que ce majorant est de l'ordre de $ 1/\sqrt{N{\gamma}_X(0)}$.
  1. Établissons une équation de récurrence, ou fonction de prévision : quel que soit $ h>0$,
    $\displaystyle \check X_{N+h}$ $\displaystyle =$ $\displaystyle P^\bot_{V^2(X_1,\ldots,X_N)}(X_{N+h})$  
      $\displaystyle =$ $\displaystyle P^\bot_{V^2(X_1,\ldots,X_N)}({\sigma}_{N+h}+{\varphi}X_{N+h-1})$  
      $\displaystyle =$ $\displaystyle 0+{\varphi}P^\bot_{V^2(X_1,\ldots,X_N)}(X_{N+h-1})$  

    car $ {\varepsilon}_{N+h}\bot V^2(X_1,\ldots,X_N)$ car $ {\varepsilon}$ est le bruit blanc d'innovation.. D'où, par récurrence,
    $\displaystyle \check X_{N+h}={\varphi}^hP^\bot_{V^2(X_1,\ldots,X_N)}(X_{N})={\varphi}^hX_N $
    Ici, $ X_N$ est l'unique valeur pivôtale. Pour calculer l'erreur de prédiction, on utilise la représentation MA($ \infty$) de $ X$ :
    $\displaystyle X_t=\sum_{u=0}^{+\infty}{\varphi}^u{\varepsilon}_{t-u} $
    D'où
    $\displaystyle X_{N+h}-\check X_{N+h}=\sum_{u=0}^{+\infty}{\varphi}^u{\varepsilo... ...arphi}^u{\varepsilon}_{N+h-u}=\sum_{u=0}^{h-1}{\varphi}^u{\varepsilon}_{N+h-u} $
    On en déduit
    $\displaystyle \mathop{\hbox{\upshape {var}}}\nolimits \left(X_{N+h}-\check X_{N... ...um_{u=0}^{h-1}{\varphi}^{2u}={\sigma}^2\frac{{\varphi}^{2h}-1}{{\varphi}^2-1}. $
    1. Quels que soient $ s$ et $ t$,
      $\displaystyle {\mathbb{E}}\left[Y_t\right]$ $\displaystyle =$ $\displaystyle {\mathbb{E}}\left[X_{-t}\right]=0$  
      $\displaystyle {\gamma}_Y(s,t)$ $\displaystyle =$ $\displaystyle \mathop{\hbox{\upshape {cov}}}\nolimits (Y_s,Y_t)=\mathop{\hbox{\... ...t)={\gamma}_X\left(\left\vert t-s\right\vert \right)={\gamma}_X\left(s,t\right)$  

      En particulier, quel que soit $ h$, $ {\gamma}_Y(s+h,t+h)={\gamma}_X(s+h,t+h)={\gamma}_X(s,t)={\gamma}_Y(s,t)$ . Le processus $ Y$ est donc de moyenne constante, et de fonction d'autocovariance invariante par translation temporelle : c'est donc un processus faiblement stationnaire.
    2. Le processus $ Y$ ayant mêmes caractéristiques du second ordre que $ X$, il est de même nature que $ X$ (au sens faible) : c'est donc un processus AR($ 1$) vérifiant $ Y_t={\varepsilon}'_t+{\varphi}Y_{t-1}$, avec $ {\varepsilon}'_t$ bruit blanc faible d'innovation de variance $ {\sigma}^2$. D'où
      $\displaystyle {\varepsilon}'_t$ $\displaystyle =$ $\displaystyle Y_t-{\varphi}Y_{t-1}=X_{-t}-{\varphi}X_{-t+1}$  
        $\displaystyle =$ $\displaystyle -{\varphi}{\varepsilon}_{-t+1}+(1+{\varphi}^2)X_{-t}=-{\varphi}{\varepsilon}_{-t+1}+(1+{\varphi}^2)\sum_{u\geq0}{\varphi}^u{\varepsilon}_{-t-u}$  


    3. $\displaystyle {\mathbb{E}}\left[{\varepsilon}_t\right]$ $\displaystyle =$ $\displaystyle 1\P\left({\varepsilon}_t=1\right)-1\P\left({\varepsilon}_t=-1\right)=0$  
      $\displaystyle \mathop{\hbox{\upshape {var}}}\nolimits \left({\varepsilon}_t\right)$ $\displaystyle =$ $\displaystyle {\mathbb{E}}\left[{\varepsilon}_t^2\right]=1^2\P\left({\varepsilon}_t=1\right)+(-1)^2\P\left({\varepsilon}_t=-1\right)=1$  

    4. Les calculs faits précédemment pour $ X$ sont valables pour $ Y$, puisque ces deux processus ont mêmes caractéristiques du second ordre. L'erreur de prédiction au pas $ h$ vaut donc
      $\displaystyle \mathop{\hbox{\upshape {var}}}\nolimits \left(Y_{N+h}-\check Y_{N+h}\right)=\frac{1-\frac{1}{3^h}}{1-\frac{1}{3}} $
    5. On a
      $\displaystyle X_t=\sum_{u\geq 0}\frac{1}{3^u}{\varepsilon}_{t-u} $
      avec $ {\varepsilon}_s$ ne prenant que $ 1$ et $ -1$ comme valeurs. On en déduit que la partie entière de
      $\displaystyle 3^{h-1}Y_{N}=3^{h-1}X_{-N}=3^{h-1}\sum_{u\geq 0}\frac{1}{3^u}{\varepsilon}_{-N-u}=\sum_{u\geq-h+1}\frac{1}{3^u}{\varepsilon}_{-N-h-u+1} $
      vaut $ \sum_{u=-h+1}^0\frac{1}{3^u}{\varepsilon}_{-N-h-u+1}$, et que la partie fractionnaire restante vaut
      $\displaystyle \sum_{u\geq+1}\frac{1}{3^u}{\varepsilon}_{-N-h-u+1}=\frac{1}{3}\s... ...eq0}\frac{1}{3^u}{\varepsilon}_{-N-h-u}=\frac{1}{3}X_{-N-h}=\frac{1}{3}Y_{N+h} $
      Cela montre que $ Y_{N+h}$ est fonction de $ Y_N$.
    6. Du résultat qui précède, on peut évidemment déduire que le meilleur prédicteur de $ Y_{N+h}$ sachant $ Y_1,\ldots,Y_N$ au sens des moindres carrés vaut
      $\displaystyle {\mathbb{E}}\left[Y_{N+h}\vert Y_1,\ldots,Y_N\right]=Y_{N+h} $
      puisque $ Y_{N+h}$ est fonction de $ Y_1,\ldots,Y_N$. L'erreur de prédiction est alors nulle. Il n'y a pas de contradiction avec les résultats précédents, car $ \check Y_{N+h}$ est le meilleur prédicteur de $ Y_{N+h}$ sachant $ Y_1,\ldots,Y_N$ au sens des moindres carrés parmi les combinaisons linéaires de $ Y_1,\ldots,Y_N$. Or $ Y_{N+h}$ est certes fonction de $ Y_1,\ldots,Y_N$, mais n'en est pas une fonction linéaire.



Thierry Cabanal-Duvillard