Université René Descartes
UFR de Mathématiques et Informatique
EXAMEN DE STATISTIQUE
MAITRISE de MATHEMATIQUES et MAITRISE MASS
1ère Session - Année 2002-2003
30 Janvier 2003- 9h-12h
(Le sujet comporte 3 pages. Aucun document autre que le polycopié du cours n'est autorisé)

Exercice 1

Soit $ X_{1}, X_{2}, \cdots , X_{n}$ des variables aléatoires réelles indépendantes telles que, pour $ k = 1, 2 ,\cdots , n$, la loi de $ X_{k}$ est la loi normale $ {\mathcal{N}}(k \theta,1)$ o $ \theta$ est un paramètre réel inconnu.

On pose $ a_{n} = \sum_{k=1}^{n} k^{2}$ et on rappelle que $ a_{n} = \displaystyle \frac{n(n+1)(2n+1)}{6}$.

  1. Montrer que le modèle statistique associé à $ X= (X_{1}, X_{2}, \cdots , X_{n})$ est exponentiel et régulier.

    Justifier que $ T_{n} = \displaystyle \frac{1}{a_{n}} \sum_{k=1}^{n} k X_{k}$ est une statistique exhaustive complète et minimale.

  2. On veut estimer le paramètre $ \theta$.

    1. Déterminer l'estimateur du maximum de vraisemblance $ \widehat{\theta}_{n}$ de $ \theta$; donner sa loi et sa fonction de risque.

      Justifier que $ \widehat{\theta}_{n}$ est une statistique régulière et un estimateur UVMB, efficace et faiblement consistant de $ \theta$.

    2. Soit $ m \in \mathbb{R}$ donné. Quelle est la loi a posteriori du paramètre $ \theta$ sachant que $ X_{1}= x_{1}, X_{2}= x_{2}, \cdots , X_{n}= x_{n}$ si la loi a priori est la loi normale $ {\cal{N}}(m, 1)$ ? En déduire l'estimateur bayésien $ \theta^{\star}_{n}$ associé ; donner sa loi et sa fonction de risque.
    3. Calculer les valeurs des fonctions de risque de $ \widehat{\theta}_{n}$ et $ \theta^{\star}_{n}$ en $ \theta = m$. L'estimateur $ \widehat{\theta}_{n}$ est-il optimal ?
  3. On veut tester $ H_{0}: \theta = \theta_{0}$ contre $ H_{1}: \theta \not= \theta_{0}$ o $ \theta_{0} \in \mathbb{R}$ est donné.

    Exprimer, à l'aide de la fonction de répartition de la loi $ {\cal{N}}(0, 1)$, la fonction puissance du test déterministe $ \varphi$ de région critique $ [ \vert \widehat{\theta}_{n} - \theta_{0} \vert > c ]$ , $ c \in \mathbb{R}_{+}^{\star}$. Montrer que ce test est UPPB à son niveau.

    Donner la valeur $ c_{\alpha}$ de $ c$ pour que ce test soit de niveau $ \alpha$ ( on exprimera $ c_{\alpha}$ à l'aide de la fonction réciproque de la fonction de répartition de la loi $ {\cal{N}}(0, 1)$ ).

    Justifier que $ ] \widehat{\theta}_{n} - c_{\alpha} , \widehat{\theta}_{n} + c_{\alpha} [$ est un intervalle de confiance au niveau $ 1 - \alpha$ pour $ \theta$.

    Dans le cas où $ n=10$, donner la valeur de $ c_{\alpha}$ pour $ \alpha = 0,05$ ( on donne $ \sqrt{385} = 19,62$).

Exercice 2

Soit $ Y = (Y_{1}, Y_{2}, \cdots, Y_{n})$ un vecteur aléatoire gaussien de matrice de covariance égale à $ \sigma^{2} I_{n}$, $ \sigma^{2} > 0$ étant inconnu.

On suppose que, pour $ k = 1, 2 ,\cdots , n$, $ Y_{k} = a + b x_{k} + c x_{k}^{2} + \epsilon_{k}$ , o $ a$, $ b$ et $ c$ sont des paramètres réels inconnus, $ x_{1}, x_{2}, \cdots, x_{n}$ des réels donnés tous distincts tels que $ \sum_{k=1}^{n} x_{k} = 0$ et $ \sum_{k=1}^{n} x_{k}^{3} = 0$ et $ (\epsilon_{1}, \epsilon_{2}, \cdots, \epsilon_{n})$ un n-échantillon de la loi $ {\cal{N}}(0, \sigma^{2})$.

On pose $ t = \displaystyle \frac{1}{n} \sum_{k=1}^{n} x_{k}^{2}$ et $ v = \displaystyle \frac{1}{n} \sum_{k=1}^{n} (x_{k}^{2} - t)^{2}$ .

  1. On pose $ \lambda = a + c \ t$ et $ \beta = (\lambda, b, c)$.

    Montrer que l'on peut écrire, matriciellement, $ E(Y) = X \beta$$ X$ est une matrice que l'on déterminera.

    Calculer $ ^{t}X X$ et en déduire les estimateurs des moindres carrés de $ \lambda$, $ a$, $ b$ et $ c$.

    Donner l'estimateur de $ \sigma^{2}$, noté $ \widehat{\sigma}^{2}$, optimal dans la classe des estimateurs sans biais.

    Donner les lois des estimateurs précédents ( on donnera des expressions où les valeurs de $ x_{1}, x_{2}, \cdots, x_{n}$ n'interviennent que par celles de $ t$ et $ v$).

  2. On suppose, dans cette question, $ c=0$. Déterminer les estimateurs des moindres carrés de $ a$ et $ b$.
  3. Justifier que, pour le test de l'hypothèse $ H_{0} : c=0$ contre l'hypothèse $ H_{1} : c\not= 0$, la statistique du test de Fisher est égale à $ \displaystyle \frac{( \sum_{k=1}^{n} ( x_{k}^{2} - t ) \ Y_{k} )^{2}}{n \ v \ \widehat{\sigma}^{2}}$ .

    Sous l'hypothèse $ H_{0}$, donner la loi de cette statistique.




Madeleine Roy