Université Paris 5 - René Descartes

UFR de Mathématiques et Informatique

, rue des Saints-Pères 75270 Paris cedex 06


Maîtrises Math-Mass 2000-2001

Corrigé de l'examen du 11 septembre 2001



  1. $\displaystyle {\mathbb{E}}_{\theta}\left[\sum_{k=1}^n\vert X_k\vert\right]$ $\displaystyle =$ $\displaystyle n{\mathbb{E}}_{\theta}\left[\vert X_1\vert\right]=n\int_{-\infty}...
...vert x\vert\frac{1}{2{\theta}}\exp\left(-\frac{\vert x\vert}{{\theta}}\right)dx$  
      $\displaystyle =$ $\displaystyle n\int_0^{+\infty}x\frac{1}{\theta}\exp\left(-\frac{ x}{{\theta}}\...
...(-x-{\theta})\exp\left(-\frac{ x}{{\theta}}\right)\right]_0^{+\infty}=n{\theta}$  
           
    $\displaystyle \mathop{\hbox{ var}}\nolimits _{\theta}\left(\sum_{k=1}^n\vert X_k\vert\right)$ $\displaystyle =$ $\displaystyle n\mathop{\hbox{ var}}\nolimits _{\theta}\left(\vert X_1\vert\righ...
...frac{1}{2{\theta}}\exp\left(-\frac{\vert x\vert}{{\theta}}\right)dx-n{\theta}^2$  
      $\displaystyle =$ $\displaystyle n\left[(-x^2-2{\theta}x-2{\theta}^2)\exp\left(-\frac{ x}{{\theta}}\right)\right]_0^{+\infty}-n{\theta}^2=n{\theta}^2$  

  2. Le $ n$-échantillon $ (X_1,\ldots,X_n)$ est à valeurs dans $ {\mathbb{R}}^n$ ; on choisit donc $ {\Omega}={\mathbb{R}}^n$ comme espace des observations, muni de la tribu des boréliens $ {\cal A}={\cal B}({\mathbb{R}}^n)$. Pour tout $ {\theta}\in{\Theta}={\mathbb{R}}^* _+$, la loi $ {\mathbb{P}}_{\theta}$ est celle de $ n$ variables de Laplace indépendantes, et sa densité par rapport à la mesure de Lebesgue sur $ {\mathbb{R}}^n$ vaut
    $\displaystyle \forall (x_1,\ldots,x_n)\in{\Omega}$      
    $\displaystyle \frac{d{\mathbb{P}}_{\theta}}{d{\lambda}_{{\mathbb{R}}^n}}(x_1,\ldots,x_n)$ $\displaystyle =$ $\displaystyle f_{\theta}^{(n)}(x_1,\ldots,x_n)=\prod_{i=1}^nf_{\theta}(x_i)$  
      $\displaystyle =$ $\displaystyle \frac{1}{(2{\theta})^n} \exp\left(-\frac{1}{\theta} \sum_{i=1}^n\vert x_i\vert\right)$  
      $\displaystyle =$ $\displaystyle \exp(Q({\theta})T(x_1,\ldots,x_n)-{\varphi}({\theta})),$  

    avec $ Q({\theta})=-1/{\theta}$, $ T(x_1,\ldots,x_n)=\sum_{i=1}^n\vert x_i\vert$, et $ {\varphi}({\theta})=n\ln(2{\theta})$. Le modèle statistique $ ({\Omega},{\cal A},\{{\mathbb{P}}_{\theta},{\theta}\in{\Theta}\})$ est donc un modèle exponentiel. L'ensemble image $ Q({\Theta})={\mathbb{R}}$ est d'intérieur non vide ; il n'y a pas de relation linéaire non triviale entre les différentes statistiques présentes sous l'exponentielle car il n'y en a qu'une seule ; on en déduit que $ T(X_1,\ldots,X_n)$ est une statistique exhaustive et complète (donc minimale).
  3. La vraisemblance $ L({\theta},x_1,\ldots,x_n)=f_{\theta}^{(n)}(x_1,\ldots,x_n)$ est toujours strictement positive. On peut donc ramener son étude à celle de la log-vraisemblance :
    $\displaystyle \ln L({\theta},x_1,\ldots,x_n)$ $\displaystyle =$ $\displaystyle -\frac{1}{{\theta}}T-n\ln(2{\theta})$  
    $\displaystyle \frac{\partial \ln L}{\partial{\theta}}({\theta},x_1,\ldots,x_n)$ $\displaystyle =$ $\displaystyle \frac{T}{\theta^2}-\frac{n}{\theta}$  

    La dérivée $ \frac{\partial \ln L}{\partial{\theta}}$ est positive pour $ {\theta}\in]0,T/n[$, nulle en $ {\theta}=T/n$, et négative pour $ {\theta}>T/n$. On en déduit que le maximum de $ \ln L$ est atteint en $ {\theta}=T/n$. L'estimateur du maximum de vraisemblance de $ {\theta}$ est donc

    $\displaystyle \hat{\theta}_n=\frac{1}{n}\sum_{i=1}^n\vert X_i\vert
$

    Cet estimateur est sans biais car $ {\mathbb{E}}_{\theta}[\hat{\theta}_n]=\frac{1}{n}{\mathbb{E}}_{\theta}[\sum_{i=1}^n\vert X_i\vert]=\frac{1}{n}n{\theta}={\theta}$, d'après la question $ 1$. Il est fortement consistant d'après la loi forte des grands nombres. En effet, les v.a. $ \vert X_i\vert$ sont identiquement distribuées, indépendantes, et intégrables : $ E_{\theta}[\vert X_i\vert]<+\infty$. On en déduit que leur moyenne $ \frac{1}{n}\sum_{i=1}^n\vert X_i\vert$ converge p.s., sous $ {\mathbb{P}}_{\theta}$, vers leur espérance $ {\mathbb{E}}_{\theta}[\vert X_i\vert]={\theta}$. Autrement dit, $ \hat {\theta}_n$ converge $ {\mathbb{P}}_{\theta}$-p.s. vers $ {\theta}$, ce qui signifie bien qu'il est fortement consistant.
  4. Le modèle est régulier car $ {\Theta}={\mathbb{R}}_+^*$ est un ouvert de $ {\mathbb{R}}$, et $ Q({\theta})=-1/{\theta}$ est une fonction $ C^1$ sur $ {\Theta}$, de dérivée ne s'annulant pas. On en déduit en outre que $ T(X_1,\ldots,X_n)$ est un estimateur régulier, efficace et UVMB de son espérance, qui vaut $ n{\theta}$. Il s'ensuit que $ \hat{\theta}_n=T/n$ est un estimateur régulier, efficace et UVMB de $ {\theta}$. La variance d'un estimateur efficace de $ {\theta}$ vaut donc celle de $ \hat {\theta}_n$ : $ \mathop{\hbox{ var}}\nolimits _{\theta}(\hat{\theta}_n)=\mathop{\hbox{ var}}\nolimits _{\theta}(\sum_{i=1}^n\vert X_i\vert)/n^2={\theta}^2/n$. Or, d'après l'inégalité de Cramer-Rao, on sait que si $ S$ est un estimateur efficace de $ g({\theta})$, alors $ I_n({\theta})=(g'({\theta}))^2/\mathop{\hbox{ var}}\nolimits _{\theta}(S)$, avec $ I_n({\theta})$ l'information de Fisher du modèle. On en déduit $ I_n({\theta})=1/\mathop{\hbox{ var}}\nolimits _{\theta}(\hat{\theta}_n)=n/{\theta}^2$.
  5. Les v.a. $ \vert X_i\vert$ sont de même loi, indépendantes, et de carré intégrable : $ {\mathbb{E}}_{\theta}[\vert X_i\vert^2]<+\infty$. On déduit alors du théorème de limite centrale que sous $ {\mathbb{P}}_{\theta}$

    $\displaystyle \frac{\frac{1}{n}\sum_{i=1}^n\vert X_i\vert-{\mathbb{E}}_{\theta}...
...{i=1}^n\vert X_i\vert\right)}}=\frac{\sqrt n}{\theta}(\hat{\theta}_n-{\theta})
$

    converge en loi quand $ n$ tend vers $ +\infty$ vers $ Z$, une gaussienne centrée réduite. Par approximation, pour $ n$ grand, on égalise donc $ \frac{\sqrt n}{\theta}(\hat{\theta}_n-{\theta})$ et $ Z$. D'où

    $\displaystyle \hat{\theta}_n\simeq{\theta}+\frac{\theta}{\sqrt n}Z$ de loi $\displaystyle {\cal N}({\theta},{\theta}^2/n)
$

    On pose $ m({\theta})={\theta}$ et $ {\sigma}^2({\theta})={\theta}^2/n$.
  6. En reprenant les notations de la question précédente, on a $ {\mathbb{P}}(-1,96\leq Z\leq 1,96)=0,95$. Par approximation, il en résulte

    $\displaystyle {\mathbb{P}}_{\theta}\left( -1,96\leq\frac{\sqrt n}{\theta}(\hat{\theta}_n-{\theta})\leq 1,96\right)\simeq0,95
$

    D'où finalement

    $\displaystyle {\mathbb{P}}_{\theta}\left({\theta}\in\left[\frac{\hat{\theta}_n}...
...sqrt n}},\frac{\hat{\theta}_n}{1-\frac{1,96}{\sqrt n}}\right]\right)\simeq0,95
$

  7. Il s'agit d'un problème de test unilatère. Comme $ Q({\theta})$ est strictement croissante, la famille des densités est à rapport de vraisemblance croissant en la statistique $ T$, comme en la statistique $ \hat {\theta}_n$. On sait que dans ce cas on peut construire un test UPP de niveau $ {\alpha}$ dont la fonction critique a la forme suivante :

    $\displaystyle {\phi}(x_1,\ldots,x_n)=\left\{
\begin{array}{cl}
1&\mbox{ si }\ha...
... si }\hat{\theta}_n=c\\
0&\mbox{ si }\hat{\theta}_n<c\\
\end{array}\right.
$

    Comme $ {\mathbb{P}}_{\theta}(\hat{\theta}_n=c)=0$ quels que soient $ {\theta}$ et $ c$, on peut plus simplement se ramener à un test de la forme

    $\displaystyle {\phi}(x_1,\ldots,x_n)=\left\{
\begin{array}{cl}
1&\mbox{ si }\hat{\theta}_n> c\\
0&\mbox{ si }\hat{\theta}_n\leq c\\
\end{array}\right.
$

    avec $ c$ déterminé par la condition $ {\mathbb{E}}_{{\theta}_0}[{\phi}]={\alpha}$. On peut déduire de l'approximation gaussienne une approximation de $ c$. En effet,
    $\displaystyle {\mathbb{E}}_{{\theta}_0}[{\phi}]$ $\displaystyle =$ $\displaystyle {\mathbb{P}}_{\theta_0}(\hat{\theta}_n>c)$  
      $\displaystyle =$ $\displaystyle {\mathbb{P}}_{\theta_0}\left(\frac{\sqrt n}{\theta_0}(\hat{\theta}_n-{\theta_0})>\frac{\sqrt n}{\theta_0}(c-{\theta_0})\right)$  
      $\displaystyle \simeq$ $\displaystyle {\mathbb{P}}\left(Z>\frac{\sqrt n}{\theta_0}(c-{\theta_0})\right)$  

    Or $ {\mathbb{P}}(Z>1,96)={\mathbb{P}}(\vert Z\vert>1,96)/2=0,05/2=0,025$. On en déduit que le test sera de niveau $ {\alpha}=0,025$ si, approximativement,

    $\displaystyle 1,96\simeq\frac{\sqrt n}{\theta_0}(c-{\theta_0})
$

    Il en résulte que $ c\simeq {\theta}_0(1+1,96/\sqrt n)=1,196$, avec $ {\theta}_0=1$ et $ n=100$.

    Remarque : la valeur exacte de $ c$ est $ 1,205$, qu'on peut calculer en notant que $ \sum_{i=1}^n\vert X_i\vert$ suit une loi $ {\Gamma}(n,1/{\theta})$ sous $ {\mathbb{P}}_{\theta}$.

  8. L'estimateur bayésien de $ {\theta}$ relativement à la loi a priori $ {\nu}(d{\theta})=q({\theta})d{\theta}$ est donné par la formule

    $\displaystyle S(x_1,\ldots,x_n)=\frac{\int_{\Theta}{\theta}f_{\theta}^{(n)}(x_1...
...u}(d{\theta})} {\int_{\Theta}f_{\theta}^{(n)}(x_1,\ldots,x_n){\nu}(d{\theta})}
$

    Or,
        $\displaystyle \int_{\Theta}{\theta}f_{\theta}^{(n)}(x_1,\ldots,x_n){\nu}(d{\the...
...ght)\frac{{\alpha}}{\theta^2}\exp\left(-\frac{{\alpha}}{\theta}\right)d{\theta}$  
      $\displaystyle =$ $\displaystyle \frac{\alpha}{2^n}\int_0^{+\infty}\frac{1}{\theta^{n+1}}\exp\left(-\frac{{\alpha}+n\hat{\theta}_n}{\theta}\right)d{\theta}$  
      $\displaystyle =$ $\displaystyle \frac{\alpha}{2^n}\left[-\frac{1}{n\theta^{n}}\exp\left(-\frac{{\...
...\theta^{n+2}}\exp\left(-\frac{{\alpha}+n\hat{\theta}_n}{\theta}\right)d{\theta}$  
      $\displaystyle =$ $\displaystyle 0+\frac{{\alpha}+n\hat{\theta}_n}{n}\int_{\Theta}f_{\theta}^{(n)}(x_1,\ldots,x_n){\nu}(d{\theta})$  

    où l'on s'est servi de ce que $ \lim_{{\theta}\rightarrow 0}-\frac{1}{n\theta^{n}}\exp\left(-\frac{{\alpha}+n\hat{\theta}_n}{\theta}\right)=\lim_{{\theta}\rightarrow +\infty}\ldots=0$.

    Il s'ensuit que l'estimateur bayésien $ S$ vaut $ \hat{\theta}_n+\frac{\alpha}{n}$.




Thierry Cabanal-Duvillard
2002-02-18