Université René Descartes
UFR de Mathématiques et Informatique
EXAMEN DE STATISTIQUE
MAITRISE de MATHEMATIQUES et MAITRISE MASS
2ème Session - Année 2002-2003
10 septembre 2003- 14h-17h
Le sujet comporte 3 pages.
Aucun document autre que le polycopié du cours ou les tables statistiques n'est autorisé.

Exercice 1

Soit $ X_{1}, X_{2}, \ldots, X_{n}, Y_{1}, Y_{2}, \ldots, Y_{n}$ des variables aléatoires indépendantes de loi normale de même variance égale à 1. On suppose que leurs espérances vérifient $ E(X_{i}) = \lambda$ et $ E(Y_{i})= \mu$ , pour $ i=1,2,\ldots,n $, $ \lambda$ et $ \mu$ étant deux réels inconnus.

On note $ \overline{X_{n}}= \displaystyle \frac{1}{n}\sum_{k=1}^{n}X_{k}$ et $ \overline{Y_{n}}=\displaystyle \frac{1}{n}\sum_{k=1}^{n}Y_{k}$.

  1. Donner la densité de la loi de $ ( X_{1}, X_{2}, \ldots, X_{n}, Y_{1}, Y_{2}, \ldots, Y_{n} )$ par rapport à la mesure de Lebesgue sur $ \mathbb{R}^{2n}$.
  2. Déterminer les estimateurs du maximun de vraisemblance de $ \lambda$ et $ \mu$.
  3. Déterminer le test optimun de l'hypothèse $ H_{0}$: $ \lambda = 2$ et $ \mu = 4$ contre l'hypothèse $ H_{1}$: $ \lambda = \mu = 3$ , au seuil $ \alpha$.

    Dans le cas o $ \alpha = 0,05$, donner la région critique et la puissance de ce test.

  4. Déterminer le test du maximun de vraisemblance de l'hypothèse $ H_{0}$: $ \lambda = 2$ et $ \mu = 4$ contre l'hypothèse $ H_{1}$: $ \lambda \not= 2$ ou $ \mu \not= 4$ , au seuil $ \alpha$.

    Vérifier que la région critique s'exprime en fonction de la variable aléatoire

    $\displaystyle T_{n} = n (\overline{X_{n}} - 2)^{2} + n (\overline{Y_{n}} - 4)^{2} $
    Quelle est la loi de cette variable aléatoire sous l'hypothèse $ H_{0}$ ?

    Que conclut-on, au seuil $ \alpha = 0,05$, si la valeur observée de $ T_{n}$ est égale à 10 ?

Exercice 2

Soit $ (U_{1}, U_{2}, \cdots, U_{n},V_{1}, V_{2}, \cdots, V_{n})$ un vecteur gaussien tel que $ (U_{1}, U_{2}, \cdots, U_{n})$ soit un n-échantillon de la loi $ {\cal{N}}(\beta_{1}, \sigma^{2})$ et $ (V_{1}, V_{2}, \cdots, V_{n})$ un n-échantillon de la loi $ {\cal{N}}(\beta_{2}, \sigma^{2})$ et que, pour $ i=1,2,\ldots,n $, $ Cov (U_{i} , V_{i}) = \rho$.

$ \beta_{1}$ , $ \beta_{2}$ et $ \sigma^{2}$ sont inconnus, $ \rho$ est connu et appartient à $ ]-1,1[$.

Pour $ i=1,2,\ldots,n $, on pose :

$\displaystyle X_{i} = \frac{U_{i} - V_{i}}{\sqrt {2(1-\rho)}} \quad , \quad Y_{i} = \frac{U_{i} + V_{i}}{\sqrt {2(1+\rho)}}$
  1. Donner les lois de $ X_{i}$ et $ Y_{i}$, $ i=1,2,\ldots,n $. Vérifier que $ X_{1}, X_{2}, \ldots, X_{n}, Y_{1}, Y_{2}, \ldots, Y_{n}$ sont des variables aléatoires indépendantes.
  2. Justifier que le modèle statistique lié à l'observation de $ Z = ( X_{1}, X_{2}, \ldots, X_{n}, Y_{1}, Y_{2}, \ldots, Y_{n} )$ est linéaire et le décrire sous la forme matricielle habituelle $ Z = A \beta + \epsilon$ en indiquant ce que sont ici $ A$ , $ \beta$ et $ \epsilon$.

    Le modèle est-il régulier ?

Exercice 3

Soit $ (X_{1}, X_{2}, \cdots, X_{n})$ un n-échantillon de la loi binomiale $ B(r, \theta)$, $ r \in \mathbb{N}^{*}$ étant connu, $ \theta$ étant un paramètre inconnu appartenant à $ ]0,1[$ :

$\displaystyle \forall i \in \{1,2,\ldots,n \} \ , \ \forall k \in \{0,1,\ldots,... ..., \mathbb{P}_{\theta} (X_{i} = k) = C_{r}^{k} \ \theta^{k} (1-\theta )^{r-k}$

On note $ \overline{X_{n}}=\displaystyle \frac{1}{n}\sum_{i=1}^{n}X_{i}$.

  1. Préciser le modèle statistique associé à $ (X_{1}, X_{2}, \cdots, X_{n})$. Est-il exponentiel ?

    Justifier que $ \overline{X_{n}}$ est une statistique exhaustive, complète et minimale.

  2. Déterminer l'estimateur du maximun de vraisemblance de $ \theta$. On le note $ S_{n}$. Montrer que c'est un estimateur du paramètre $ \theta$ uniformément de variance minimum parmi les estimateurs sans biais (UVMB), efficace, fortement consistant et asymptotiquement normal.
  3. Soit $ a \geq 0$ et $ b \geq 0$. On considère l'estimateur $ T_{a,b,n} = \displaystyle \frac{\overline{X_{n}} + \frac{a}{n}}{r + \frac{b}{n}}$ .

    Calculer les fonctions de risque, pour l'estimation de $ \theta$, de $ T_{a,b,n}$ et $ S_{n}$.

    Vérifier que, pour $ a_{0}= \displaystyle \frac{\sqrt{nr}}{2}$ et $ b_{0}= \sqrt{nr}$, la fonction de risque de $ T_{a_{0},b_{0},n}$ est constante.

    $ S_{n}$ est-il meilleur que $ T_{a_{0},b_{0},n}$?




Madeleine Roy