Suivant : Remarque.


$\textstyle \parbox{10cm}{\scriptsize Universit\'e de Paris 5 -- Ren\'e Descarte... ...ematiques et Informatique}\ 45, rue des Saints-P\\lq eres 75270 Paris cedex 06 }$ \includegraphics[width=22mm]{/home/tcd/p5_petit.ps}




Maîtrises Maths-MASS - Statistiques générales


Corrigé du partiel du 21 novembre 2003



Ex 1.

  1. Les observations sont réelles et positives. Le paramètre $ {\theta}$ est réel et strictement positif. On considère donc le modèle statistique suivant
    $\displaystyle \left({\Omega}={\mathbb{R}}_+^n,\AA ={\cal B}\left({\mathbb{R}}_+^n\right),\left\{\P _{\theta},{\theta}\in{\Theta}={\mathbb{R}}_+^*\right\}\right) $
    avec $ \P _{\theta}$ mesure de probabilité absolument continue par rapport à la mesure de Lebesgue sur $ {\mathbb{R}}_+^n$, de densité le produit des densités des lois marginales, car les $ X_i$ sont indépendants entre eux :
    $\displaystyle \forall x\in{\mathbb{R}}_+^n,\ \ \frac{d\P _{\theta}}{d{\lambda}_{{\mathbb{R}}_+^n}}\left(x\right)$ $\displaystyle =$ $\displaystyle \prod_{i=1}^nf_{\theta}(x_i)$  
      $\displaystyle =$ $\displaystyle \frac{\prod_{i=1}^nx_i}{{\theta}^n}\exp\left(-\frac{1}{2{\theta}}\sum_{i=1}^nx_i^2\right)$  
      $\displaystyle =$ $\displaystyle \exp\left(Q\left({\theta}\right)T\left(x\right)-{\varphi}\left({\theta}\right)\right)h(x)$  

    avec
    $\displaystyle Q\left({\theta}\right)=-\frac{1}{2{\theta}},\ \ T\left(x\right)=\... ...varphi}\left({\theta}\right)=n\ln{\theta},\ \ h\left(x\right)=\prod_{i=1}^nx_i $
    Il s'agit donc d'un modèle exponentiel. On en déduit aussitôt que $ T(X)$ est une statistique exhaustive. Comme $ Q\left({\Theta}\right)={\mathbb{R}}_-^*$ contient une boule ouverte non vide, on en conclut que $ T(X)$ est aussi une statistique complète, donc minimale. Enfin, $ {\Theta}$ est un ouvert, et $ Q$ est une fonction dérivable, de dérivée $ Q'({\theta})=1/2{\theta}^2$ continue ne s'annulant pas ; il s'ensuit que le modèle est régulier, et que $ T(X)$ est un estimateur UVMB, régulier et efficace de son espérance.

  2. $\displaystyle {\mathbb{E}}_{\theta}\left[X_i^2\right]$ $\displaystyle =$ $\displaystyle \int_0^{+\infty}x^2\frac{x}{\theta}e^{-x^2/(2{\theta})}dx$  
      $\displaystyle =$ $\displaystyle \int_0^{+\infty}t\frac{1}{2{\theta}}e^{-t/(2{\theta})}dt$ $\displaystyle \mbox{ avec le ch${}^{\mbox{t}}$. de variables }$$\displaystyle t=x^2$  
      $\displaystyle =$ $\displaystyle \left[-te^{-t/(2{\theta})}\right]_0^{+\infty}+\int_0^{+\infty}e^{-t/(2{\theta})}dt$ par IPP  
      $\displaystyle =$ $\displaystyle 0+\left[-2{\theta}e^{-t/(2{\theta})}\right]_0^{+\infty}=2{\theta}$  

    (On remarque dans ce calcul que $ X_i^2$ suit une loi exponentielle de moyenne $ 2{\theta}$.) On en déduit que $ \hat{\theta}_n=\frac{1}{2n}\sum_{i=1}^nX_i^2$ est un estimateur sans biais de $ {\theta}$. Comme il est fonction de la statistique exhaustive et complète $ T(X)$, il est UVMB d'après le corollaire du lemme de Lehmann-Scheffé. D'autre part, comme il ne diffère de $ T(X)$ que par une constante multiplicative, c'est aussi un estimateur régulier et efficace de son espérance. Il y a donc égalité dans l'inégalité de Cramer-Rao, c'est-à-dire
    $\displaystyle I_n\left({\theta}\right)$ $\displaystyle =$ $\displaystyle \frac{g'({\theta})^2}{\mathop{\hbox{\upshape {var}}}\nolimits _{\theta}\left(\hat{\theta}_n\right)}$ avec $\displaystyle g({\theta})={\mathbb{E}}_{\theta}\left[\hat{\theta}_n\right]$  
      $\displaystyle =$ $\displaystyle \frac{1}{\mathop{\hbox{\upshape {var}}}\nolimits _{\theta}\left(\hat{\theta}_n\right)}$  

    $ I_n\left({\theta}\right)$ dénote l'information de Fisher du modèle statistique. Or
    $\displaystyle \mathop{\hbox{\upshape {var}}}\nolimits _{\theta}\left(\hat{\thet... ...frac{1}{4n}\mathop{\hbox{\upshape {var}}}\nolimits _{\theta}\left(X_1^2\right) $
    car les $ X_i^2$ sont indépendants et de même loi. Comme $ X_1^2$ suit une loi exponentielle de moyenne $ 2{\theta}$, sa variance est égale à $ 4{\theta}^2$. À défaut de cette remarque, un calcul analogue à celui de l'espérance redonne ce résultat. D'où
    $\displaystyle I_n\left({\theta}\right)=\frac{n}{{\theta}^2} $
    On pouvait aussi calculer l'information de Fisher à l'aide des formules $ I_n\left({\theta}\right)=\mathop{\hbox{\upshape {var}}}\nolimits _{\theta}\lef... ...E}}_{\theta}\left[\frac{\partial^2}{\partial{\theta}^2}\ln f_{\theta}(X)\right]$ . Mais on ne pouvait utiliser $ I_n\left({\theta}\right)={\varphi}''({\theta})$, cette égalité n'étant a priori vraie que dans le cas d'un modèle exponentiel canonique (même si bizarrement elle donne ici le bon résultat).
  3. Les variables aléatoires $ X_i^2/2$ sont indépendantes, de même loi, et intégrables : $ {\mathbb{E}}_{\theta}\left[\vert X_i^2/2\vert\right]={\theta}<+\infty$ . D'après la loi forte des grands nombres, il en résulte que
    $\displaystyle \frac{1}{2n}\sum_{i=1}^nX_i^2\longrightarrow_{n\rightarrow+\infty}{\mathbb{E}}_{\theta}\left[X_1^2/2\right]={\theta}\ \ \P _{\theta}$ -p.s.
    Autrement dit, $ (\hat{\theta}_n,n\geq1)$ est une suite d'estimateurs de $ {\theta}$ fortement consistante. Comme on a de plus $ {\mathbb{E}}_{\theta}\left[\left(X_i^2/2\right)^2\right]=2{\theta}^2<+\infty$ , on peut appliquer aussi le théorème de limite central. D'où sous $ \P _{\theta}$
    $\displaystyle \frac{\frac{1}{2n}\sum_{i=1}^nX_i^2-{\mathbb{E}}_{\theta}\left[\f... ..._n-{\theta}\right)\longrightarrow_{n\rightarrow+\infty}{\cal N}\left(0,1\right)$ en loi
    Ainsi $ \hat{\theta}_n$ converge-t-il en loi vers $ {\theta}$ à une vitesse d'ordre $ \sqrt n$.
  4. Le risque est somme de la variance et du carré du biais, une formule presque unanimement oubliée, ce qui peut expliquer que personne n'ait su résoudre cette question.
    $\displaystyle R\left({\theta},T_n\right)$ $\displaystyle =$ $\displaystyle {\mathbb{E}}_{\theta}\left[\left(T_n-{\theta}\right)^2\right]$  
      $\displaystyle =$ $\displaystyle \mathop{\hbox{\upshape {var}}}\nolimits _{\theta}\left(T_n\right)+{\mathbb{E}}_{\theta}\left[T_n-{\theta}\right]^2$  
      $\displaystyle =$ $\displaystyle c_n^2\mathop{\hbox{\upshape {var}}}\nolimits _{\theta}\left(\hat{... ...ht)+\left(c_n{\mathbb{E}}_{\theta}\left[\hat{\theta}_n\right]-{\theta}\right)^2$  
      $\displaystyle =$ $\displaystyle c_n^2\frac{4{\theta}^2}{n}+{\theta}^2\left(c_n-1\right)^2={\theta}^2P(c_n)$  

    avec $ P(x)=\frac{4x^2}{n}+(x-1)^2$. Le risque de $ \hat{\theta}_n$ est donc bien proportionnel à $ {\theta}^2$. Cherchons la valeur qui minimise $ P$ :
    $\displaystyle P(x)=x^2\left(1+\frac{4}{n}\right)-2x+1=\left(1+\frac{4}{n}\right)\left(x-\frac{1}{1+\frac{4}{n}}\right)^2+$ cte
    Le minimum de $ P$ est donc atteint en $ c_n=\frac{1}{1+\frac{4}{n}}\not=1$. D'où
    $\displaystyle \forall{\theta}>0,\ \ R\left({\theta},\frac{1}{1+\frac{4}{n}}\hat... ...{1}{1+\frac{4}{n}}\right)<{\theta}^2P(1)=R\left({\theta},\hat{\theta}_n\right) $
    Il appert ainsi que $ \hat{\theta}_n$, quoiqu'estimateur UVMB et efficace de $ {\theta}$, n'est pas admissible.


Ex 2.

  1. Les observations sont réelles. Le paramètre $ {\theta}$ est réel. On considère donc le modèle statistique suivant
    $\displaystyle \left({\Omega}={\mathbb{R}}^n,\AA ={\cal B}\left({\mathbb{R}}^n\right),\left\{\P _{\theta},{\theta}\in{\Theta}={\mathbb{R}}\right\}\right) $
    avec $ \P _{\theta}$ mesure de probabilité absolument continue par rapport à la mesure de Lebesgue sur $ {\mathbb{R}}^n$, de densité le produit des densités des lois marginales, car les $ X_i$ sont indépendants entre eux :
    $\displaystyle \forall x\in{\mathbb{R}}^n,\ \ \frac{d\P _{\theta}}{d{\lambda}_{{\mathbb{R}}^n}}\left(x\right)$ $\displaystyle =$ $\displaystyle \prod_{i=1}^nf_{\theta}(x_i)$  
      $\displaystyle =$ $\displaystyle e^{-\sum_{i=1}^nx_i+n{\theta}}\prod_{i=1}^n1_{[{\theta},+\infty[}(x_i)$  
      $\displaystyle =$ $\displaystyle e^{-\sum_{i=1}^nx_i+n{\theta}}1_{[{\theta},+\infty[}(x_{(1)})$  

    avec $ x_{(1)}=\min(x_1,\ldots,x_{n})$. Cette densité est de la forme $ g_{\theta}(x_{(1)})h(x)$, avec $ g_{\theta}(u)=e^{n{\theta}}1_{[{\theta},+\infty[}(u)$ et $ h(x)=e^{-\sum_{i=1}^nx_i}$. D'après le théorème de factorisation, la statistique $ X_{(1)}=\min(X_1,\ldots,X_{n})$ est exhaustive.

    Déterminons sa loi :

    $\displaystyle \P _{\theta}\left(X_{(1)}>u\right)$ $\displaystyle =$ $\displaystyle \P _{\theta}\left(X_1>u,\ldots,X_n>u\right)$  
      $\displaystyle =$ $\displaystyle \prod_{i=1}^n\P _{\theta}\left(X_i>u\right)$$\displaystyle \mbox{ car les $X_i$\ sont ind\'ependants}$  
      $\displaystyle =$ $\displaystyle \P _{{\theta}}\left(X_1>u\right)^n$ car ils ont même loi.  

    Or
    $\displaystyle \P _{{\theta}}\left(X_1>u\right)=\left\{ \begin{array}{ll} 1&\mbo... ...i }u\leq{\theta}\ e^{{\theta}-u}&\mbox{ si }u\geq{\theta} \end{array}\right. $
    D'où
    $\displaystyle \P _{{\theta}}\left(X_{(1)}>u\right)=\left\{ \begin{array}{ll} 1&... ...}u\leq{\theta}\ e^{n{\theta}-nu}&\mbox{ si }u\geq{\theta} \end{array}\right. $
    On en déduit que la loi de $ X_{(1)}$ est absolument continue par rapport à la mesure de Lebesgue sur $ {\mathbb{R}}$, de densité
    $\displaystyle \forall u\in{\mathbb{R}},\ \ f^{(1)}_{\theta}(u)=\left\{ \begin{a... ... }u\geq{\theta} \end{array}\right\}=ne^{n{\theta}-nu}1_{[{\theta},+\infty[}(u) $
    Montrons que $ X_{(1)}$ est une statistique complète. Soit $ f$ une fonction borélienne quelconque, telle que pour tout $ {\theta}\in{\mathbb{R}}$, $ f(X_{(1)})$ soit intégrable sous $ \P _{\theta}$, et $ {\mathbb{E}}_{\theta}\left[f(X_{(1)})\right]=0$. Or
    $\displaystyle \forall{\theta}\in{\mathbb{R}},\ \ {\mathbb{E}}_{\theta}\left[f(X_{(1)})\right]=0$ $\displaystyle \Longleftrightarrow$ $\displaystyle \forall{\theta}\in{\mathbb{R}},\ \ \int_{\theta}^{+\infty}f(u)ne^{n{\theta}-nu}du=0$  
      $\displaystyle \Longleftrightarrow$ $\displaystyle \forall{\theta}\in{\mathbb{R}},\ \ \int_{\theta}^{+\infty}f(u)e^{-nu}du=0$  

    Cette dernière assertion implique que $ f(u)e^{-nu}$ est Lebesgue-presque partout nulle.

    Rappelons l'argument : on montre facilement que cela implique que pour tout intervalle puis tout borélien borné $ A$, $ \int_{-\infty}^{+\infty}1_A(u)f(u)e^{-nu}du=0$ ; on applique ce résultat à $ A=\left\{u/f(u)\geq0\right\}\cap[-N,N]$, et on en déduit que $ f$ est Lebesgue-presque partout négative sur $ [-N,N]$, donc sur $ {\mathbb{R}}$ ; pour une raison symétrique, on en conclut que $ f$ est Lebesgue-presque partout nulle sur $ {\mathbb{R}}$. Mais on pouvait aussi supposer $ f$ continue et dériver l'intégrale.

    Il s'ensuit que $ f(u)$ est Lebesgue-presque partout nulle, donc que $ f\left(X_{(1)}\right)$ est nulle $ \P _{\theta}$-p.s. Ce qui prouve que $ X_{(1)}$ est bien une statistique complète.

    Comme elle est aussi exhaustive, on en déduit qu'elle est minimale.

    Le modèle n'est pas régulier pour plusieurs raisons : notons simplement que le domaine où $ \frac{d\P _{\theta}}{d{\lambda}_{{\mathbb{R}}^n}}\left(x\right)>0$ dépend de $ {\theta}$, et que cette densité n'est pas dérivable par rapport à $ {\theta}$ sur tout $ {\mathbb{R}}$.

  2. Soit $ x\in{\mathbb{R}}^n$. On note la vraisemblance
    $\displaystyle L\left({\theta},x\right)=\frac{d\P _{\theta}}{d{\lambda}_{{\mathb... ...}}\left(x\right)=e^{-\sum_{i=1}^nx_i+n{\theta}}1_{[{\theta},+\infty[}(x_{(1)}) $
    On cherche $ \hat{\theta}_n(x)$ tel que $ L(\hat{\theta}_n,x)=\sup_{{\theta}\in{\mathbb{R}}}L({\theta},x)$ . Or la fonction $ {\theta}\mapsto L({\theta},x)$ est nulle sur $ ]x_{(1)},+\infty[$, et à l'évidence croissante sur $ ]-\infty,x_{(1)}]$. Son maximum est donc atteint en $ {\theta}=x_{(1)}$. On a donc $ L(x_{(1)},x)=\sup_{{\theta}\in{\mathbb{R}}}L({\theta},x)$, autrement dit $ \hat{\theta}_n=X_{(1)}$.

    Soit $ {\varepsilon}>0$ quelconque. Calculons $ \P _{\theta}\left(\vert\hat{\theta}_n-{\theta}\vert>{\varepsilon}\right)$ :

    $\displaystyle \P _{\theta}\left(\vert\hat{\theta}_n-{\theta}\vert>{\varepsilon}... ...t)=\P _{\theta}\left(X_{(1)}-{\theta}>{\varepsilon}\right)=e^{-n{\varepsilon}} $
    D'où
    $\displaystyle \sum_{n=1}^{+\infty}\P _{\theta}\left(\vert\hat{\theta}_n-{\theta... ...ty}e^{-n{\varepsilon}}=\frac{e^{-{\varepsilon}}}{1-e^{-{\varepsilon}}}<+\infty $
    D'après le lemme de Borel-Cantelli, on en déduit que $ \hat{\theta}_n$ converge $ \P _{\theta}$-p.s. vers $ {\theta}$ quand $ n$ tend vers l'infini, i.e. $ (\hat{\theta}_n,n\geq1)$ est une suite d'estimateurs de $ {\theta}$ fortement consistante.

    De plus, $ \P _{\theta}\left(n(\hat{\theta}_n-{\theta})>u\right)=e^{-u}$ , ce qui signifie que $ n(\hat{\theta}_n-{\theta})$ suit une loi exponentielle de paramètre $ 1$. On en déduit que $ n(\hat{\theta}_n-{\theta})$ converge (!) en loi quand $ n$ tend vers l'infini vers une loi exponentielle de paramètre $ 1$, donc que $ \hat{\theta}_n$ converge en loi vers $ {\theta}$ à une vitesse d'ordre $ n$.

  3. $\displaystyle {\mathbb{E}}_{\theta}\left[\hat{\theta}_n\right]=\int_{\theta}^{+... ...e^{n{\theta}-nu}du={\theta}+\int_{0}^{+\infty}une^{-nu}du={\theta}+\frac{1}{n} $
    Donc $ \hat{\theta}_n-\frac{1}{n}=X_{(1)}-\frac{1}{n}$ est un estimateur sans biais de $ {\theta}$, qui est fonction d'une statistique exhaustive et complète. D'après le corollaire du théorème de Lehmann-Scheffé, c'est l'estimateur UVMB de $ {\theta}$.


Ex 3.

    1. Il y a $ C_{49}^6$ combinaisons possibles de $ 6$ chiffres parmi $ 49$, toutes équiprobables lors du tirage. Une seule donne droit au gros lot. La probabilité de le gagner vaut donc
      $\displaystyle p_6=\frac{1}{C_{49}^6}=\frac{6!}{49\times48\times\cdots\times44}\simeq 7,15.10^{-8} $
    2. Si chaque pari a probabilité $ p_6$ de gagner, et que les paris sont indépendants, alors le nombre de paris gagnants du gros lot est la somme de $ N$ variables aléatoires de Bernouilli de paramètre $ p_6$, et indépendantes. Le nombre de gagnants suit donc une loi binômiale $ {\cal B}(N,p_6)$. Or $ N$ est très grand, et $ Np_6$ est de l'ordre de quelques unités. On est donc dans la situation où la loi binômiale peut être approchée par une loi de Poisson. Rappelons qu'en effet
      $\displaystyle \lim_{N\rightarrow +\infty}{\cal B}(N,p_N)={\cal P}({\theta}) $
      si $ \lim_{N\rightarrow +\infty}Np_N={\theta}$. On modélise donc le nombre de gagnants à chaque tirage par une loi de Poisson $ {\cal P}(Np_6)$.
    3. Les observations sont entières, indépendantes, et suivent des lois de Poisson. Le paramètre $ N$ est entier. On considère donc le modèle statistique suivant
      $\displaystyle \left({\Omega}={\mathbb{N}}^2,\AA ={\cal P}\left({\mathbb{N}}^2\right),\left\{\P _{N},{N}\in{\Theta}={\mathbb{N}}\right\}\right) $
      avec
      $\displaystyle \forall x\in{\mathbb{N}}^2,\ \ \P _N\left(\left\{x\right\}\right)$ $\displaystyle =$ $\displaystyle e^{-Np_6}\frac{(Np_6)^{x_1}}{x_1!}e^{-Np_6}\frac{(Np_6)^{x_2}}{x_2!}$  
        $\displaystyle =$ $\displaystyle \exp\left(Q\left(N\right)T(x)-{\varphi}(N)\right)h(x)$  

      $ Q(N)=\ln(Np_6)$, $ T(x)=x_1+x_2$, $ {\varphi}(N)=2Np_6$ et $ h(x)=(x_1!x_2!)^{-1}$. Il s'agit donc d'un modèle exponentiel, et $ T(X)$ en constitue une statistique exhaustive.

      Que $ N$ fut le paramètre n'a été trouvé par personne...





Suivant : Remarque.

Thierry Cabanal-Duvillard