$\textstyle \parbox{10cm}{\scriptsize Universit\'e de Paris 5 -- Ren\'e Descart... ...matiques et Informatique}\ 45, rue des Saints-P\\lq eres 75270 Paris cedex 06 }$




Statistique des Processus - Maîtrise MASS


Corrigé de l'examen du 21 mai 2004




Ex 1.


  1. $\displaystyle C^{(k)}\left(X_1+{\mu},X_2,\ldots,X_k\right)$ $\displaystyle =$ $\displaystyle C^{(k)}\left(X_1,X_2,\ldots,X_k\right)+C^{(k)}\left({\mu},X_2,\ldots,X_k\right)$  
        $\displaystyle \hskip1cm$d'après la première des propriétés élémentaires  
      $\displaystyle =$ $\displaystyle C^{(k)}\left(X_1,X_2,\ldots,X_k\right)+0$  
        $\displaystyle \hskip1cm$d'après la seconde des propriétés élémentaires,  
        $\displaystyle \hskip1cm$$\displaystyle \mbox{car ${\mu}$\ - constante - est ind\'ependante de $X_2,\ldots,X_k$}$  

  2. L'ensemble $ {\cal P}\left(3\right)$ est composé des partitions de $ \left\{1,2,3\right\}$ suivantes
    \begin{displaymath} \begin{array}{l} \left\{1,2,3\right\}\ \left\{1,2\right\},... ... \left\{1\right\},\left\{2\right\},\left\{3\right\} \end{array}\end{displaymath}
    $ C^{(3)}(X_1,X_2,X_3)$ est composé de somme de produits du type
    $\displaystyle (-1)^11!{\mathbb{E}}\left[\prod_{j\in\left\{1,3\right\}}X_j\right... ...right\}}X_j\right]={\mathbb{E}}\left[X_1X_3\right]{\mathbb{E}}\left[X_2\right] $
    Si $ X_1$, $ X_2$ et $ X_3$ sont centrés, dès qu'une partition contient un singleton, le produit correspondant sera nul. Dès lors ne restera dans $ C^{(3)}$ que le seul terme correspondant à la seule partition de $ \left\{1,2,3\right\}$ sans singleton ; i.e.
    $\displaystyle C^{(3)}(X_1,X_2,X_3)=(-1)^00!{\mathbb{E}}\left[\prod_{j\in\left\{1,2,3\right\}}X_j\right]={\mathbb{E}}\left[X_1X_2X_3\right] $
    Si on ne suppose plus $ X_1,X_2$ et $ X_3$ centrés, alors
    $\displaystyle C^{(3)}(X_1,X_2,X_3)$ $\displaystyle =$ $\displaystyle C^{(3)}(X_1-{\mathbb{E}}\left[X_1\right],X_2-{\mathbb{E}}\left[X_2\right],X_3-{\mathbb{E}}\left[X_3\right])$ d'après la question 1  
      $\displaystyle =$ $\displaystyle {\mathbb{E}}\left[\left(X_1-{\mathbb{E}}\left[X_1\right]\right)\l... ...{E}}\left[X_2\right]\right)\left(X_3-{\mathbb{E}}\left[X_3\right]\right)\right]$ $\displaystyle \mbox{ car $X_i-{\mathbb{E}}\left[X_i\right]$\ est centr\'e}$  

    Remarque : à partir de $ k=4$, l'expression du cumulant devient un peu plus compliqué.
  3. Soit $ \left\{U_1,\ldots,U_p\right\}\in {\cal P}(3)$. Alors $ {\mathbb{E}}\left[\prod_{j\in U_i}X_{t_j+h}\right]={\mathbb{E}}\left[\prod_{j\in U_i}X_{t_j}\right]$ car $ X$ est un processus stationnaire : rappelons que cela implique que $ (X_{t_j},j\in U_i)$ est égal en loi à $ (X_{t_j+h},j\in U_i)$ pour tout $ h\in{\mathbb{Z}}$. L'égalité des espérances en découle. On en déduit
        $\displaystyle C^{(3)}_X(t_1+h,t_2+h,t_3+h)$  
      $\displaystyle =$ $\displaystyle \sum_{p=1}^3\left(-1\right)^p\left(p-1\right)!\sum_{\left\{U_1,\l... ...in U_1}X_{t_j+h}\right]\cdots{\mathbb{E}}\left[\prod_{j\in U_p}X_{t_j+h}\right]$  
      $\displaystyle =$ $\displaystyle \sum_{p=1}^3\left(-1\right)^p\left(p-1\right)!\sum_{\left\{U_1,\l... ..._{j\in U_1}X_{t_j}\right]\cdots{\mathbb{E}}\left[\prod_{j\in U_p}X_{t_j}\right]$  
      $\displaystyle =$ $\displaystyle C^{(3)}_X(t_1,t_2,t_3)$  

  4. On peut construire l'estimateur par les méthodes habituelles de substitution. Comme on a
    $\displaystyle C_X^{(3)}(s,t)={\mathbb{E}}\left[\left(X_0-{\mu}_X\right)\left(X_s-{\mu}_X\right)\left(X_t-{\mu}_X\right)\right], $
    on peut proposer l'estimateur
    $\displaystyle \hat C_X^{(3)}(s,t)=\frac{1}{N-t}\sum_{u=1}^{N-t}\left(X_u-\bar X_N\right)\left(X_{u+s}-\bar X_N\right)\left(X_{u+t}-\bar X_N\right) $
    avec $ \bar X_N=\frac{1}{N}\sum_{u=1}^NX_u$.


Ex 2.

  1. Notons d'abord que le filtre linéaire $ \left(I-{\alpha}B\right)^{-1}$ existe bien car $ \vert{\alpha}\vert\not=1$. Comme $ X$ est un processus faiblement stationnaire, et $ {\psi}(B)$ est bien un filtre linéaire, il s'ensuit que $ Y$ est aussi faiblement stationnaire.

    On a $ \left(I-{\alpha}B\right)(Y)=\left(I-{\alpha}B\right)\circ{\psi}(B)(X)=\left(I-\frac{1}{\alpha}B\right)(X)$ ; i.e.

    $\displaystyle \forall t\in{\mathbb{Z}},\ \ Y_t-{\alpha}Y_{t-1}=X_t-\frac{1}{\alpha}X_{t-1}. $
    Soit $ t\in{\mathbb{Z}}$ quelconque. On déduit de ce qui précède
    $\displaystyle \mathop{\hbox{\upshape {cov}}}\nolimits (Y_t-{\alpha}Y_{t-1},Y_1-... ...pshape {cov}}}\nolimits (X_t-\frac{1}{\alpha}X_{t-1},X_1-\frac{1}{\alpha}X_0); $
    autrement dit,
    $\displaystyle -{\alpha}{\gamma}_Y(t)+(1+{\alpha}^2){\gamma}_Y(t-1)-{\alpha}{\ga... ...a}_X(t)+(1+\frac{1}{\alpha^2}){\gamma}_X(t-1)-\frac{1}{\alpha}{\gamma}_X(t-2). $
    En soustrayant le membre de droite de l'égalité ci-dessus au membre de gauche, puis en multipliant par $ {\alpha}$, on obtient
    $\displaystyle {\varphi}(t)-\frac{1+{\alpha}^2}{\alpha}{\varphi}(t-1)+{\varphi}(t-2)=0, $
    avec $ {\varphi}(t)={\gamma}_X(t)-{\alpha}^2{\gamma}_Y(t)$.
  2. Il s'agit d'une équation de récurrence linéaire. On cherche les solutions de la forme $ r^t$. Ce qui conduit à l'équation
    $\displaystyle r^t-\frac{1+{\alpha}^2}{\alpha}r^{t-1}+r^{t-2}=0 $
    ou encore
    $\displaystyle r^2-\frac{1+{\alpha}^2}{\alpha}r+1=0. $
    Les racines sont $ {\alpha}$ et $ \frac{1}{{\alpha}}$. La fonction $ {\varphi}$ est donc de la forme
    $\displaystyle \forall t\in{\mathbb{Z}},\ \ {\varphi}(t)=A{\alpha}^t+B\frac{1}{\alpha^t}, $
    avec $ A$ et $ B$ constantes.

    Les fonctions d'autocovariance de $ X$ et $ Y$ sont bornées, car $ X$ et $ Y$ sont des processus faiblement stationnaires - on a $ \vert {\gamma}_X(t)\vert\leq{\gamma}_X(0)$ et idem pour $ Y$. La fonction $ {\varphi}$ est donc bornée. Faisons tendre $ t$ vers $ +\infty$. Si $ \vert{\alpha}\vert>1$, alors $ \vert{\alpha}^t\vert$ tend vers $ +\infty$, et il faut donc que $ A$ soit nulle pour que $ {\varphi}$ reste bornée. Si $ \vert{\alpha}\vert<1$, on en déduit plutôt $ B=0$. On raisonne de même en faisant tendre $ t$ vers $ -\infty$, ce qui permet de montrer que l'autre constante doit être aussi nulle. On a donc $ {\varphi}(t)=0$ quel que soit $ t$.

  3. Si $ X$ est un bruit blanc, alors $ {\gamma}_X(t)=0$ si $ t\not=0$. D'après ce qui précède, on a aussi $ {\gamma}_Y(t)={\alpha}^2{\gamma}_X(t)=0$ si $ t\not=0$. Les variables $ Y_s,s\in{\mathbb{Z}}$, sont donc décorrélées, centrées (car $ X$ est centré), et de même variance (car $ Y$ est faiblement stationnaire) : $ Y$ est donc un bruit blanc de variance $ {\gamma}_Y(0)={\gamma}_X(0)/{\alpha}^2$.


Ex 3.

  1. Nombre de chambres d'hôtel occupées : on remarque un comportement saisonnier de période 12 sur une tendance affine croissante. On peut donc proposer un modèle SARIMA du type $ (I-B^{12})(X)={\mu}+Y$ avec $ Y$ processus ARMA centré et $ {\mu}$ constante. En effet, le filtre $ I-B^{12}$ supprime les saisonnalités de période 12, et transforme les tendances affines en tendances constantes.

    On peut remarquer aussi une croissance plus ou moins affine de l'amplitude des fluctuations. Pour modéliser ce phénomène, on peut effectuer une transformation logarithmique préalable - d'où le modèle $ (I-B^{12})(\ln X)={\mu}+Y$ avec $ \ln X=(\ln X_t,t\in{\mathbb{Z}})$ -, ou filtrer une deuxième fois par $ I-B^{12}$ - d'où le modèle $ (I-B^{12})^2(X)=Y$.

  2. Épaisseur de la couche d'ozone : on remarque un comportement saisonnier de période 12, mais pas de tendance croissante ou décroissante. On peut donc proposer un modèle SARIMA du type $ (I-B^{12})(X)=Y$ avec $ Y$ processus ARMA centré - on peut en effet supposer la moyenne nulle car une tendance constante est annulée par le filtre $ I-B^{12}$.
  3. Nombre d'internautes en ligne : l'allure de la série ne présente aucun caractère de stationnarité ni de tendance régulière. On peut penser à une marche aléatoire. On peut donc proposer un modèle ARIMA du type $ (I-B)(X)={\mu}+Y$ avec $ Y$ processus ARMA centré et $ {\mu}$ constante, voire un modèle $ (I-B)^2(X)={\mu}+Y$ si nécessaire.
  4. Ventes de shampooing : on remarque une tendance croissante, affine ou parabolique. Un phénomène saisonnier est difficilement distinguable. On peut donc proposer un modèle ARIMA du type $ (I-B)(X)={\mu}+Y$ ou $ (I-B)^2(X)={\mu}+Y$ avec $ Y$ processus ARMA centré et $ {\mu}$ constante. En effet, le filtre $ I-B$ transforme une tendance affine en tendance constante, et le filtre $ (I-B)^2$ fait de même avec une tendance parabolique.


Ex 4.Soit $ X=\left(X_t,t\in{\mathbb{Z}}\right)$ un processus AR(2) vérifiant

$\displaystyle \forall t\in{\mathbb{Z}},\ \ X_t-0,1X_{t-1}-0,3X_{t-2}={\varepsilon}_t $
avec $ {\varepsilon}$ bruit blanc de variance $ {\sigma}^2$.
  1. Pour montrer que $ {\varepsilon}$ est le bruit blanc d'innovation associé à $ X$, il suffit de vérifier que la représentation $ (I-0,1B-0,3B^2)(X)={\varepsilon}$ est causale et inversible. Or elle est inversible comme pour toute les représentations AR. Reste à s''assurer qu'elle est aussi causale. Notons $ {\varphi}(B)=I-0,1B-0,3B^2$, et $ {\varphi}(z)=1-0,1z-0,3z^2=(1-0,6z)(1+0,5z)$ la transformée en $ z$ de $ {\varphi}(B)$. Les zéros de $ {\varphi}(z)$ sont $ 1/0,6$ et $ -1/0,5$, de modules strictement supérieurs à $ 1$ : la représentation est donc causale.
  2. On a $ X={\varphi}(B)^{-1}({\varepsilon})$. Pour déterminer la représentation M($ \infty$), il suffit d'expliciter $ {\varphi}(B)^{-1}$. Or sa transformée $ z$ vaut
    $\displaystyle \frac{1}{{\varphi}(z)}=\frac{1}{1,1}\left(\frac{0,6}{1-0,6z}+\fra... ...,1}\sum_{u\geq1}\left(\left(0,6\right)^{u+1}-\left(-0,5\right)^{u+1}\right)z^u $
    On a bien
    $\displaystyle 1+\frac{1}{1,1}\sum_{u\geq1}\left\vert\left(0,6\right)^{u+1}-\left(-0,5\right)^{u+1}\right\vert<+\infty $
    On en déduit
    $\displaystyle {\varphi}(B)^{-1}=I+\frac{1}{1,1}\sum_{u\geq1}\left(\left(0,6\right)^{u+1}-\left(-0,5\right)^{u+1}\right)B^u $
    et pour tout $ t\in{\mathbb{Z}}$
    $\displaystyle X_t={\varphi}(B)^{-1}\left({\varepsilon}\right)_t={\varepsilon}_t... ...left(\left(0,6\right)^{u+1}-\left(-0,5\right)^{u+1}\right){\varepsilon}_{t-u}. $


Ex 5.

  1. Notons $ {\varphi}(B)=I-2,5B$ et $ {\theta}(B)=I-0,04B^2$. Le processus ARMA $ Y$ vérifie $ {\varphi}(B)(Y)={\theta}(B)({\varepsilon})$. Le bruit blanc est le processus d'innovation associé à $ Y$ si la représentation est causale et inversible : Notons $ {\varphi}'(B)=I-\frac{1}{2,5}B=I-0,4B$. On a
    $\displaystyle {\varphi}'(B)(Y)={\varphi}'(B)\circ{\varphi}(B)^{-1}\circ{\theta}(B)({\varepsilon})={\theta}(B)({\varepsilon}') $
    avec
    $\displaystyle {\varepsilon}'={\varphi}'(B)\circ{\varphi}(B)^{-1}({\varepsilon})... ...-\frac{1}{2,5}B\right)\circ\left(I-2,5B\right)^{-1}\left({\varepsilon}\right). $
    Le processus $ {\varepsilon}'$ est un bruit blanc de variance $ {\sigma}^2/(2,5)^2$ (cf exercice 2). Et il est facile de vérifier que la représentation $ {\varphi}'(B)(Y)={\theta}(B)({\varepsilon}')$ est désormais toujours inversible, mais en plus causale. On en déduit que $ {\varepsilon}'$ est le bruit blanc d'innovation de $ Y$.
  2. Soit $ h\geq 3$. Alors on a
    $\displaystyle \check Y_{N}(h)-0,4\check Y_N(h-1)$ $\displaystyle =$ $\displaystyle P^\bot_{V^2\left(Y_s,s\leq N\right)}(Y_{N+h}-0,4Y_{N+h-1})$  
      $\displaystyle =$ $\displaystyle P^\bot_{V^2\left(Y_s,s\leq N\right)}\left({\varepsilon}'_{N+h}-0,04{\varepsilon}'_{N+h-2}\right)=0$  

    car $ {\varepsilon}'$ est le bruit blanc d'innovation, ce qui implique $ {\varepsilon}'_{N+h},{\varepsilon}'_{N+h-2}\bot V^2\left(Y_s,s\leq N\right)$ lorsqu'on a $ N+h-2 >N$.

    Il s'agit d'une équation de récurrence linéaire du premier ordre, dont la solution est entièrement déterminée par la donnée de $ \check Y_N(2)$, qui constitue donc l'unique valeur pivôtale. Le calcul est immédiat :

    $\displaystyle \forall h \geq3,\ \ \check Y_N(h)=(0,4)^{h-2}\check Y_N(2) $
  3. Explicitons le filtre $ (I-0,4B)^{-1}\circ{\theta}(B)$ :
    $\displaystyle \frac{1-0,04z^2}{1-0,4z}=\frac{0,75}{1-0,4z}+0,25+0,1z=1+0,4z+0,75\sum_{u\geq2}(0,4)^uz^u $
    On a bien
    $\displaystyle 1+0,4+0,75\sum_{u\geq2}(0,4)^u<+\infty. $
    On en déduit
    $\displaystyle (I-0,4B)^{-1}\circ{\theta}(B)=I+0,4B+0,75\sum_{u\geq2}(0,4)^uB^u $
    et
    $\displaystyle Y_{N+h}={\varepsilon}'_{N+h}+0,4{\varepsilon}'_{N+h-1}+0,75\sum_{u\geq2}(0,4)^u{\varepsilon}'_{N+h-u}. $
    Comme on a $ {\varepsilon}'_s\in V^2\left(Y_s,s\leq N\right)$ si $ s\leq N$ et $ {\varepsilon}'_s\bot V^2\left(Y_s,s\leq N\right)$ si $ s> N$, on en déduit
    $\displaystyle \check Y_N(1)$ $\displaystyle =$ $\displaystyle 0,4{\varepsilon}'_{N}+0,75\sum_{u\geq2}(0,4)^u{\varepsilon}'_{N+1-u}$  
    $\displaystyle \check Y_N(h)$ $\displaystyle =$ $\displaystyle 0,75\sum_{u\geq2}(0,4)^u{\varepsilon}'_{N+h-u}$ si $\displaystyle h\geq 2.$  

    D'où finalement
    $\displaystyle \Vert Y_{N+1}-\check Y_N(1)\Vert_2^2$ $\displaystyle =$ $\displaystyle \Vert {\varepsilon}'_{N+1}\Vert_2^2={\sigma}^2/6,25$  
    $\displaystyle \Vert Y_{N+2}-\check Y_N(2)\Vert_2^2$ $\displaystyle =$ $\displaystyle \Vert {\varepsilon}'_{N+2}+0,4{\varepsilon}'_{N+1}\Vert_2^2={\sigma}^2(1+0,4^2)/6,25$  
    $\displaystyle \Vert Y_{N+h}-\check Y_N(h)\Vert_2^2$ $\displaystyle =$ $\displaystyle \Vert {\varepsilon}'_{N+h}+0,4{\varepsilon}'_{N+h-1}+0,75\sum_{u=2}^{h-1}(0,4)^u{\varepsilon}'_{N+h-u}\Vert_2^2$  
        si $\displaystyle h\geq2$  
      $\displaystyle =$ $\displaystyle \left(1+0,4^2+0,75^2\sum_{u=2}^{h-1}(0,4)^{2u}\right)$  
      $\displaystyle =$ $\displaystyle \left(1+0,4^2+0,3^2\frac{1-0,4^{h-2}}{1-0,4^2}\right){\sigma}^2/6,25$  




Thierry Cabanal-Duvillard