Corrigé succinct de l'examen du 29 mai 2000

Statistique des processus

MST ISASH - Maîtrise MASS

Exercice 1.


Cette série présente à première vue une tendance croissante linéaire, ainsi que des variations saisonnières d'amplitude croissante et de période 12. Pour permettre une modélisation par un processus stationnaire, il faut préalablement supprimer cette tendance et ces variations.

Première approche : on soumet la série au filtre $ (I-B^{12})^2$ car il a pour propriété d'annihiler tendance linéaire et saisonnalité linéairement croissante de période 12. En effet, notons $ (s_t,t\in{\mathbb{Z}})$ une composante périodique de période 12 : $ s_t=s_{t-12}$, quel que soit $ t$ ; $ (a+bt)s_t$ représente alors une saisonnalité croissante. Soit $ (c+dt)$ une tendance linéaire. Alors :

$\displaystyle \aligned
&(I-B^{12})^2\bigl((a+bt)s_t+(c+dt)\bigr)\\
&=(I-B^{12}...
...(I-B^{12})\bigl(12bs_t+12d\bigr)\\
&=12bs_t+12d-12bs_{t-12}-12d=0
\endaligned $

Deuxième approche : on soumet la série à une transformation logarithmique de type Box-Cox. On est ainsi ramené à une série qui possède une tendance croissante, et des variations saisonnières de période 12, mais d'amplitude constante. On peut alors filtrer cette série par $ (I-B^{12})$, qui supprime saisonnalité et tendance ; la série résultante peut alors être modélisée par un ARMA décentré. On peut aussi filtrer par $ (I-B)(I-B^{12})$ qui supprime en plus le décentrage de la série.


Troisième approche : après une transformation de Box-Cox, on désaisonnalise la série par la méthode des moyennes mobiles. (Rappel : cela consiste à supprimer la saisonnalité par le filtre $ \tilde M_6$ ; par différence, puis en moyennant, on obtient une estimation des coefficients saisonniers ; on ôte alors cette saisonnalité à la série, et ne reste plus qu'à estimer puis éliminer la tendance).


Quatrième approche : on pourrait aussi scinder cette série en 12, avec une série pour chaque mois. Pour chacune de ces séries, il faut estimer et ôter la tendance, et on peut alors débuter une modélisation ARMA.


Exercice 2.


Remarquons d'abord que $ \vert {\phi}\vert\not=1$, car sinon le processus $ X$ ne serait pas stationnaire (ce serait un ARIMA). On peut d'autre part supposer que $ \vert{\phi}\vert<1$ ; en effet, si tel n'était pas le cas, on pourrait s'y ramener car $ X$ vérifie aussi l'équation

$\displaystyle X_t={1\over {\phi}}X_{t-1}+{\varepsilon}'_t
$

avec $ {\varepsilon}'$ bruit blanc gaussien défini par $ {\varepsilon}'=(I-{1\over{\phi}}B)(I-{\phi}B)^{-1}({\varepsilon})$.

1) Avec $ \vert{\phi}\vert<1$, le processus $ X$ est un AR(1) centré représenté sous forme causale et inversible, et $ {\varepsilon}$ est son bruit blanc d'innovation. En particulier, cela implique que $ {\varepsilon}_2$ est orthogonal à $ X_1$. D'où :

$\displaystyle \aligned
\mathop{\hbox{ var}}\nolimits (X_1)=\mathop{\hbox{ var}}...
...phi}^2\mathop{\hbox{ var}}\nolimits (X_1)+{\sigma}_{\varepsilon}^2
\endaligned $

D'où $ \mathop{\hbox{ var}}\nolimits (X_1)=\mathop{\hbox{ var}}\nolimits (X_2)={{\sigma}^2_{\varepsilon}\over 1-{\phi}^2}$. En outre,

$\displaystyle \mathop{\hbox{ cov}}\nolimits (X_1,X_2)={\mathbb{E}}[X_1X_2]={\ma...
...2)]={\phi}{\mathbb{E}}[X_1^2]={\phi}{{\sigma}^2_{\varepsilon}\over 1-{\phi}^2}
$

La matrice de covariance de $ (X_1,X_2)$ est donc égale à

$\displaystyle {\Gamma}(X_1,X_2)=\left(\matrix
{1\over 1-{\phi}^2}{\sigma}^2_{\v...
...^2_{\varepsilon}&{1\over 1-{\phi}^2}{\sigma}^2_{\varepsilon}
\endmatrix\right)
$

La densité de la loi du vecteur gaussien $ (X_1,X_2)$ est donc égale à

$\displaystyle f_{{\phi},{\sigma}^2_{\varepsilon}}(x_1,x_2)={1\over 2{\pi}\sqrt{...
...bigl(-(x_1,x_2){\Gamma}(X_1,X_2)^{-1}\left(\matrix x_1\\ x_2\endmatrix\right))
$

Or $ \sqrt{\det(\Gamma(X_1,X_2))}={{\sigma}_{\varepsilon}^2\over\sqrt{1-{\phi}^2}}$, et

$\displaystyle {\Gamma}(X_1,X_2)^{-1}={1\over {\sigma}^2_{\varepsilon}}\left(\matrix
1&-{\phi}\\ -{\phi}&1\endmatrix\right)
$

D'où

$\displaystyle f_{{\phi},{\sigma}^2_{\varepsilon}}(x_1,x_2)={\sqrt{1-{\phi}^2}\o...
...arepsilon}}\exp(-{1\over {\sigma}^2_{\varepsilon}}(x_1^2+x_2^2-2{\phi}x_1x_2))
$

2) Les estimateurs du maximum de vraisemblance $ (\tilde{\phi},\tilde{\sigma}^2_{\varepsilon})$ sont les valeurs qui maximisent la fonction

$\displaystyle ({\phi},{\sigma}^2_{\varepsilon})\mapsto f_{{\phi},{\sigma}^2_{\varepsilon}}(x_1,x_2)
$

Il revient au même de maximiser $ \ln f_{{\phi},{\sigma}^2_{\varepsilon}}(x_1,x_2)$. Au maximum, les dérivées partielles sont nulles. $ (\tilde{\phi},\tilde{\sigma}^2_{\varepsilon})$ doit donc vérifier le système d'équations

$\displaystyle \left\{\aligned
{\partial \ln f_{\tilde{\phi},\tilde{\sigma}^2_{\...
...epsilon}}(x_1,x_2)\over \partial{\sigma}^2_{\varepsilon}}=0
\endaligned\right.
$

Ce système se résoud en

$\displaystyle \tilde{\phi}={2x_1x_2\over x_1^2+x_2^2}$ et $\displaystyle \tilde{\sigma}^2_{\varepsilon}={(x_1^2-x_2^2)^2\over x_1^2+x_2^2}
$


Exercice 3.


a) $ X$ est un processus de type AR(1) ici représenté sous forme causale et inversible, et $ {\varepsilon}$ est le bruit blanc d'innovation qui lui est associé. En particulier, $ X_t$ s'écrit comme combinaison linéaire (infinie) des variables aléatoires $ ({\varepsilon}_s,s\leq t)$ ; comme $ {\varepsilon}'$ est indépendant de $ {\varepsilon}$, il est aussi indépendant de $ X$. Or il est facile de vérifier que la somme de deux processus indépendants tous deux (faiblement) stationnaires est (faiblement) stationnaire. Il en est donc ainsi de $ {\varepsilon}'+1,5X$.

$ Y$ vérifie l'équation

$\displaystyle (I-0,4B)(Y)={\varepsilon}'+1,5X
$

Le filtre $ (I-0,4B)$ est inversible. Comme l'image d'un processus faiblement stationnaire par un filtre linéaire est un processus faiblement stationnaire, le processus $ (I-0,4B)^{-1}({\varepsilon}'+1,5X)$ est faiblement stationnaire. Ce processus est bien solution de l'équation définissant $ Y$.


b) La densité spectrale de la somme de deux processus indépendants est la somme des densités spectrales de chacun des processus. Ainsi, la densité spectrale de $ {\varepsilon}'+1,5X$ est-elle égale à

$\displaystyle \aligned
f_{{\varepsilon}'+1,5X}({\lambda})&=f_{{\varepsilon}'}({...
...its {\lambda}\over1,36-1,2\mathop{\hbox{ cos}}\nolimits {\lambda}}
\endaligned $

D'où l'on déduit la densité spectrale de $ Y$ :

$\displaystyle \aligned
f_Y({\lambda})&=f_{(I-0,4B)^{-1}({\varepsilon}'+1,5X)}({...
...imits {\lambda})(1,36-1,2\mathop{\hbox{ cos}}\nolimits {\lambda})}
\endaligned $

c) Première méthode : soit $ Z$ processus ARMA(2,1) représenté sous forme causale et inversible par l'équation

$\displaystyle (I-{\varphi}B)(I-{\psi}B)(Z)=(I-{\theta}B)({\varepsilon}'')
$

avec $ \vert{\varphi}\vert,\vert{\psi}\vert,\vert{\theta}\vert<1$, et $ {\varepsilon}''$ bruit blanc d'innovation associé à $ Z$. Sa densité spectrale se calcule facilement, à l'instar des calculs précédents :

$\displaystyle f_Z({\lambda})={1\over 2{\pi}}{\sigma}_{{\varepsilon}''}^2{1+{\th...
...olimits {\lambda})(1+{\psi}^2-2{\psi}\mathop{\hbox{ cos}}\nolimits {\lambda})}
$

La seule condition pour que la densité spectrale de $ Y$ puisse se mettre sous cette forme est qu'il existe $ {\sigma}_{{\varepsilon}''}^2$ et $ {\theta}$ tels que

$\displaystyle 0,10276={\sigma}_{{\varepsilon}''}^2(1+{\theta}^2)$ et $\displaystyle 0,0192=2{\sigma}_{{\varepsilon}''}^2{\theta}
$

Il est facile de vérifier, et cela a d'ailleurs été vu en exercice, que cela possède une solution si $ 0,10276\geq0,0192$, ce qui est vrai.

Deuxième méthode : il suffit de montrer que $ (I-0,4B)(I-0,6B)(Y)$ est une MA(1).

$\displaystyle (I-0,6B)(I-0,4B)(Y)=(I-0,6B)({\varepsilon}'+1,5X)
=(I-0,6B)({\varepsilon}')+1,5{\varepsilon}
$

Vérifions maintenant que la fonction d'autocovariance $ {\gamma}_{(I-0,6B)({\varepsilon}')+1,5{\varepsilon}}$ est nulle pour les rangs supérieurs à $ 2$, ce qui montrera l'assertion initiale. La fonction d'autocovariance de la somme de deux processus indépendants est la somme des fonctions d'autocovariance de chacun des processus. D'où

$\displaystyle {\gamma}_{(I-0,6B)({\varepsilon}')+1,5{\varepsilon}}(k)={\gamma}_...
...on}}(k)={\gamma}_{(I-0,6B)({\varepsilon}')}(k)+2,25{\gamma}_{{\varepsilon}}(k)
$

Or, si $ k\geq2$, $ {\gamma}_{{\varepsilon}}(k)=0$ car $ {\varepsilon}$ est un bruit blanc, et $ {\gamma}_{(I-0,6B)({\varepsilon}')}(k)=0$ car $ (I-0,6B)({\varepsilon}')$ est une moyenne mobile d'ordre 1.


d) D'après ce qui précède, il ne reste qu'à déterminer la variance du bruit blanc d'innovation, et le coefficient de la partie moyenne mobile. On reprend pour cela les équations apparues au c) Première méthode. Il s'agit donc de résoudre $ 0,10276={\sigma}_{{\varepsilon}''}^2(1+{\theta}^2)$ et $ 0,0192=2{\sigma}_{{\varepsilon}''}^2{\theta}$ sous la condition $ \vert{\theta}\vert<1$. On en déduit le système

$\displaystyle \left\{\aligned
2{\sigma}_{{\varepsilon}''}^2{\theta}&=0,0192\\
...
...2})\\
&=0,094...\\
{\sigma}_{{\varepsilon}''}^2&=2,454...
\endaligned\right.
$

$ Y$ vérifie donc l'équation

$\displaystyle (I-0,6B)(I-0,4B)(Y)=(I-0,094B)({\varepsilon}'')
$

avec $ {\varepsilon}''$ bruit blanc de variance $ {\sigma}_{{\varepsilon}''}^2=2,454$.

Pour calculer $ {\varepsilon}''$, il faut inverser le filtre $ I-0,094B$ :

$\displaystyle \aligned
{\varepsilon}''&=(I-0,094B)^{-1}(I-0,6B)(I-0,4B)(Y)\\
&...
...lon})+(I+\sum_{n\geq1}(0,094)^{n-1}(0,094-0,6)B^n)({\varepsilon}')
\endaligned $

Ainsi

$\displaystyle {\varepsilon}''_t=1,5\sum_{n\geq0}0,094^n{\varepsilon}_{t-n}+{\varepsilon}'_t-0,506\sum_{n\geq1}0,094^{n-1}{\varepsilon}'_{t-n}
$

Exercice 4.


a) Posons $ Z_t=X_t+A+B\mathop{\hbox{ cos}}\nolimits (t{\pi}/3)+C\mathop{\hbox{ sin}}\nolimits (t{\pi}/3)$ ; il faut vérifier que $ Z_t={\varepsilon}_t+2\mathop{\hbox{ cos}}\nolimits ({\pi}/3)Z_{t-1}-Z_{t-2}$, quel que soit $ t$. Calculons :

$\displaystyle \aligned
&{\varepsilon}_t+2\mathop{\hbox{ cos}}\nolimits ({\pi}/3...
...}\nolimits (t{\pi}/3)+C\mathop{\hbox{ sin}}\nolimits (t{\pi}/3)\\
\endaligned $

où l'on s'est servi d'une part de la relation de récurrence vérifiée par $ X$, d'autre part des formules trigonométriques

$\displaystyle \aligned
\mathop{\hbox{ cos}}\nolimits (t{\pi}/3)+\mathop{\hbox{ ...
...s}}\nolimits ({\pi}/3)\mathop{\hbox{ sin}}\nolimits ((t-1){\pi}/3)
\endaligned $

Il apparaît ainsi que si l'on suppose de plus que $ A=0$, alors $ Z$ vérifie bien la récurrence attendue, et appartient donc à $ S_{\varepsilon}$.


b) $ {\varepsilon}_t$ s'écrit comme combinaison linéaire de $ X_t$, $ X_{t-1}$ et $ X_{t-2}$, quel que soit $ t$. Le sous-espace linéaire $ V^2({\varepsilon}_j, -\infty<j\leq t)$ est donc inclus dans $ V^2(X_j, -\infty<j\leq t)$. Il n'y a pas a priori d'inclusion dans l'autre sens. En effet, étant donné un élément $ X$ de $ S_{\varepsilon}$, soit il existe $ t$ tel que $ V^2(X_j, -\infty<j\leq t)\not\subset V^2({\varepsilon}_j, -\infty<j\leq t)$, auquel cas on dispose déjà d'un contre-exemple. Sinon, il suffit de choisir une variable aléatoire $ B$ indépendante de $ {\varepsilon}$, qui n'appartient donc pas à $ V^2({\varepsilon}_j, j\in{\mathbb{Z}})$ ; alors le processus $ X_t+B\mathop{\hbox{ cos}}\nolimits (t{\pi}/3)$ est le contre-exemple cherché : on peut en effet voir facilement que $ X_1+B\mathop{\hbox{ cos}}\nolimits ({\pi}/3)$ n'est pas combinaison linéaire des $ ({\varepsilon}_j,-\infty<j\leq 1)$.


c) Soit $ h\geq1$; alors

$\displaystyle \aligned
&\bar X_N(h)=P^\bot_{V^2(X_j,1\leq j\leq N)}(X_{N+h})\\ ...
...\mathop{\hbox{ cos}}\nolimits ({\pi}/3)\bar X_N(h-1)-\bar X_N(h-2)
\endaligned $

en notant que $ P^\bot_{V^2(X_j,1\leq j\leq N)}({\varepsilon}_{N+h})$, car $ {\varepsilon}_{N+h}$ est orthogonale à $ V^2({\varepsilon}_j,1\leq j\leq N)$ qui par hypothèse est égal à $ V^2(X_j,1\leq j\leq N)$ ; le projeté d'une variable aléatoire sur un espace auquel elle est orthogonale est bien sûr nul.

Il s'agit donc de résoudre l'équation de récurrence $ \bar X_N(h)=2\mathop{\hbox{ cos}}\nolimits ({\pi}/3)\bar X_N(h-1)-\bar X_N(h-2)$, qu'on initialise avec les valeurs pivotales $ \bar X_N(0)=X_{N}$ et $ \bar X_N(-1)=X_{N-1}$.

L'équation caractéristique en est $ r^2=2\mathop{\hbox{ cos}}\nolimits ({\pi}/3)r-1$, qui admet deux solutions $ -j$ et $ -j^2$. La fonction de prévision est donc de la forme

$\displaystyle \bar X_N(h)={\alpha}(-j)^h+{\beta}(-j^2)^h
$

On peut calculer alors $ {\alpha}$ et $ {\beta}$ en fonction de $ X_{N}$ et $ X_{N-1}$. Plus simplement on remarque que $ (-1)^h\bar X_N(h)$ est périodique de période 3. On sait donc déjà que $ \bar X_N(3p)=(-1)^{3p}\bar X_N(0)=(-1)^pX_N$, et que $ \bar X_N(3p-1)=(-1)^{3p}\bar X_N(-1)=(-1)^pX_{N-1}$, quelque soit $ p\in{\mathbb{N}}$. Reste à calculer

$\displaystyle \bar X_N(3p+1)=(-1)^{3p}\bar X_N(1)=(-1)^p(2\mathop{\hbox{ cos}}\nolimits ({\pi}/3)\bar X_N(0)-\bar X_N(-1))=(-1)^p(X_N-X_{N-1})
$

Déterminons maintenant les erreurs de prévision :

$\displaystyle \aligned
e_N(1)&=X_{N+1}-\bar X_N(1)={\varepsilon}_{N+1}+X_N-X_{N...
...N(1)+\bar X_N(1)\bigr)+X_N={\varepsilon}_{N+3}+{\varepsilon}_{N+2}
\endaligned $

(On pourrait montrer que $ e_N(h)={\varepsilon}_{N+h}+{\varepsilon}_{N+h-1}$ quel que soit $ h\geq 2$). D'où finalement

$\displaystyle \mathop{\hbox{ var}}\nolimits (e_N(1))={\sigma}^2_{\varepsilon}$ et $\displaystyle \mathop{\hbox{ var}}\nolimits (e_N(2))=\mathop{\hbox{ var}}\nolimits (e_N(3))=2{\sigma}^2_{\varepsilon}
$


Exercice 5.


1) Comme à l'exercice 2, on peut supposer que $ \vert{\phi}\vert<1$. $ {\varepsilon}$ est alors le bruit blanc d'innovation de $ X$. Soit $ t\geq 0$ :

$\displaystyle \aligned
{\rho}_X(t+12)&={\mathop{\hbox{ cov}}\nolimits (X_{t+12}...
...,X_0)\over\mathop{\hbox{ var}}\nolimits (X_0)}=0+{\phi}{\rho}_X(t)
\endaligned $

car $ {\varepsilon}_{t+12}$ est orthogonal à $ X_0$. Il suffit donc de calculer les 12 premières valeurs de la fonction d'autocorrélation pour la déterminer entièrement. Naturellement, $ {\rho}_X(0)=1$. Montrons que $ {\rho}_X(j)=0$, quel que soit $ j=1,...,11$. En effet,

$\displaystyle \mathop{\hbox{ cov}}\nolimits (X_j,X_0)=\mathop{\hbox{ cov}}\noli...
...+{\phi}X_{-12})=0+0+0+{\phi}^2\mathop{\hbox{ cov}}\nolimits (X_{j-12},X_{-12})
$

Or comme le processus est stationnaire, $ \mathop{\hbox{ cov}}\nolimits (X_j,X_0)=\mathop{\hbox{ cov}}\nolimits (X_{j-12},X_{-12})$. D'autre part, $ {\phi}^2\not=1$ (sinon le processus n'est pas stationnaire - il s'agirait d'un SARIMA). Ces deux faits impliquent que

$\displaystyle \mathop{\hbox{ cov}}\nolimits (X_j,X_0)=0/(1-{\phi}^2)=0
$

$ X_j$ et $ X_0$ sont donc décorrélées dès que $ j=1,...,11$. D'où finalement la forme de la fonction d'autocorrélation :

$\displaystyle {\rho}_X(12j)={\phi}^j$, $\displaystyle {\rho}_X(h)=0$ sinon.$\displaystyle $

2) Soit $ Y$ un processus MA(1) vérifiant $ Y_t={\varepsilon}'_t+{\theta}{\varepsilon}_{t-1}$, avec $ \vert{\theta}\vert<1$. Il est facile de vérifier que sa fonction d'autocorrélation a la forme suivante :

$\displaystyle {\rho}_Y(0)=1$, $\displaystyle {\rho}_Y(1)={\theta}$, $\displaystyle {\rho}_Y(h)=0$ sinon. $\displaystyle $

Vu que $ \hat{\rho}_x(1)\simeq 0,4$ et que $ \hat{\rho}_x(12j)\simeq(0,7)^j$, on peut suggérer, d'après ce qui précède, la modélisation suivante pour la série $ x$ par le processus $ {\xi}$ :

$\displaystyle {\xi}_t={\varepsilon}_t+0,4{\varepsilon}_{t-1}+0,7{\xi}_{t-12}
$

Reste à calculer effectivement la fonction d'autocorrélation de $ {\xi}$ pour vérifier qu'elle concorde avec $ \hat{\rho}_x$. Les calculs sont similaires aux précédents. On montre d'abord que $ {\rho}_{\xi}(t+12)=0,7{\rho}_{\xi}(t)$, puis que $ {\rho}_{\xi}(1)=0,4$, $ {\rho}_{\xi}(j)=0$, $ j=2,...,10$, et $ {\rho}_{\xi}(11)=0,4\times 0,7$.




Thierry Cabanal-Duvillard
2001-03-21