Université Paris 5 - René
Descartes
UFR de Mathématiques et
Informatique
45, rue des Saints-Pères 75270 Paris cedex
06
Maîtrises Math-Mass
2000-2001
Corrigé du partiel du 7
décembre 2000
-
- La densité de la loi de
se met sous la
forme
avec
,
,
et
. Il s'agit donc d'un modèle exponentiel.
L'espace canonique est l'ensemble des paramètres
tels que
Or il s'agit d'une série géométrique dont la
somme est bien connue :
L'espace canonique des paramètres est donc
. C'est un pavé ouvert de
. D'autre part, il n'y a pas de
relation affine entre les différents paramètres
canoniques, puisqu'il n'y en a qu'un. Même chose pour
. Le modèle est donc de rang plein.
car
sous les
hypothèses de l'énoncé. Il s'agit d'une
série entière de rayon de convergence
, qui est
en
. D'où
- D'après la première question, le modèle
est de rang plein, et
est une fonction
continuement dérivable sur
, dont la
dérivée ne s'annule pas. Le modèle est donc
régulier, ce qui signifie en particulier que l'information
de Fisher est bien définie.
-
- Notons encore
la densité de la loi de
par rapport à la
mesure de comptage sur
.
avec
. Comme
à la première question, il s'agit d'un modèle
exponentiel de rang plein, l'espace canonique des paramètres
étant inchangé. On en déduit que
est une statistique
exhaustive, complète et minimale. Les définitions
générales des ces termes ont été vues
en cours. Dans le cas présent, cela signifie respectivement
(attention aux quantificateurs !)
- quel que soit
, il existe une
version de
indépendante de
;
- quelle que soit
application de
dans
, on a l'implication
,
;
- quelle que soit
exhaustive, il existe
borélienne telle que
.
Comme
est continuement dérivable
sur son ensemble de définition, de dérivée ne
s'annulant pas, on en déduit aussi que
est une statistique régulière, et que c'est un
estimateur UVMB et efficace de son espérance. Or
.
- L'information de Fisher
associée à un
-échantillon de variables aléatoires
(indépendantes) est égale à
fois l'information de Fisher
associée à l'une
d'entre elles. On a donc
- Quel que soit
, on a
Or, pour tout
,
D'où le développement de
:
En comparant
et
, et du fait de
l'unicité d'un développement en série
entière, on en déduit le résultat
demandé, i.e.
-
- La vraisemblance du modèle au point
est
. Comme elle ne s'annule pas, on peut considérer
plutôt la log-vraisemblance
. Il s'agit d'en trouver le maximum, en ayant
variant dans
. Si
, alors le maximum serait
atteint pour
, qui n'est pas une valeur de
l'ensemble des paramètres. On peut alors dire qu'il n'y a
pas d'estimateur du maximum de vraisemblance, ou plutôt
rajouter à l'ensemble des lois possibles la masse de Dirac
en 0 en posant
; notons qu'on n'a
plus alors un modèle exponentiel. Si
, alors la
log-vraisemblance tend vers
quand
tend vers 0 ou vers
. Le maximum
est donc à rechercher dans un intervalle compact du type
où la
log-vraisemblance est continue. Elle y atteint donc son maximum.
Comme elle est y aussi dérivable, ce maximum correspond
à un point critique. L'estimateur du maximum de
vraisemblance
doit donc vérifier
l'équation de vraisemblance
Or
Ainsi n'y a-t-il qu'une seule valeur de
qui
vérifie l'équation de vraisemblance. C'est donc le
maximum de vraisemblance :
Notons que cette formule reste valable pour le cas
sous l'hypothèse
qu'on a rajouté
à l'ensemble des
paramètres.
Cet estimateur est fortement consistant si
converge
presque sûrement vers
quand la
taille de l'échantillon tend vers l'infini. Or les variables
aléatoires
sont
indépendantes, de même loi et possèdent un
premier moment (attention aux hypothèses !). D'après
la loi forte des grands nombres, on en déduit que
converge presque sûrement vers
. Cela implique
la convergence presque sûre de
vers
.
Autrement dit, on vient de montrer que
est fortement
consistant.
Comme les variables aléatoires
possèdent aussi un deuxième moment (attention aux
hypothèses (bis) !), on sait décrire les fluctuations
de leur moyenne empirique autour de leur moyenne grâce au
théorème central limite : la variable
aléatoire
converge en loi vers une gaussienne centrée de variance
. Or
avec
. On en déduit
que
converge en loi vers une gaussienne centrée de variance
Or
est un estimateur asymptotiquement
efficace de
si
converge en loi
vers une gaussienne centrée de variance
. Ceci
montre que
est un
estimateur asymptotiquement efficace de
.
- D'après la première question, on sait que
On en déduit, en remplaçant les moments de
par les moments empiriques, un estimateur de
(dont on peut vérifier qu'il est
fortement consistant d'après la loi des grands nombres)
:
On peut construire par cette méthode d'autres estimateurs de
.
- D'après la deuxième question,
est une statistique exhaustive et complète. D'après
le théorème de Lehmann-Scheffé, la variable
aléatoire
est un estimateur UVMB de
. Or pour tout 
![$\displaystyle {\mathbb{E}}_{\theta}[1_{X_1=0}\vert T_n=k]$](img126.gif) |
|
|
|
| |
|
|
|
| |
|
|
|
| |
|
|
|
| |
|

|
|
| |
|
|
|
| |
|
|
|
| |
|

|
|
| |
|
|
|
| |
|
d'après la question 2.(c) |
|
| |
|
 |
|
Autrement dit,
est un estimateur UVMB de
.
- Déterminons un intervalle de confiance pour
au seuil
. D'après la question 2.(a),
l'espérance de
vaut
. On en déduit, en
utilisant l'inégalité de Bienaymé-Tchebycheff,
que pour tout
on a
D'où l'inégalité suivante :
La fonction
est
un fonction croissante. Si
, alors
Autrement dit,
L'intervalle aléatoire
est
donc un intervalle de confiance pour
au seuil
. Pour que ce seuil soit
égal à
, il suffit de
prendre
. Comme de
plus
on en déduit finalement que
On a ainsi bien déterminé un intervalle de confiance
pour
au seuil
,
sachant
.
-
- Le modèle statistique est un modèle exponentiel
à rapport de vraisemblance croissant en
; en effet,
d'après la question 2.(a), la densité de la loi
par
rapport à le mesure de comptage sur
s'écrit
et la fonction
est bien
strictement croissante sur
(contrairement
à l'avis général...). Or on sait que pour les
modèles statistiques à rapport de vraisemblance
croissant en une statistique donnée, il existe pour un
problème de test d'hypothèses unilatères un
test uniformément plus puissant parmi les tests de seuil
fixé. Dans le cas
présent, sa fonction critique est de la forme :
avec
déterminés
par
.
- On commence par simplifier la fonction critique en supposant
, ce qui revient à supposer
que l'événement
est de
probabilité suffisamment petite pour n'intervenir que de
façon négligeable dans le calcul du niveau du test.
Ce niveau est donc égal à
Pour évaluer cette probabilité, on utilise une
approximation gaussienne obtenue grâce au
théorème central limite. En effet,
est la moyenne d'une somme de
variables aléatoires indépendantes, de même loi
et de carré intégrable. D'après le
théorème central limite, la variable aléatoire
converge en loi vers
gaussienne centrée
réduite, quand
tend vers l'infini. Ici,
étant égal à 100, on
considère que l'on peut approcher la loi de l'un par la loi
de l'autre. D'après la table des quantiles de la loi
, on sait que
. On
en déduit que
La zone de rejet pour un test de niveau
est donc
de la forme
.
- Soit
un estimateur de
. Le risque bayésien de
est donné par
Comme
est une statistique exhaustive, on
déduit du théorème de Rao-Blackwell que
est un
estimateur de risque bayésien plus faible : en effet, la
fonction de coût quadratique est bien convexe, donc le risque
quadratique associé à
est plus
faible que celui associé à
pour
tout
; d'où l'assertion.
étant une fonction de
(plus exactement
il en existe une version qui soit telle), on peut donc se contenter
de rechercher les estimateurs qui minimisent le risque
bayésien, autrement dit les estimateurs bayésiens,
parmi les fonctions de
.
Soit donc
une fonction de
dans
. Calculons le risque
bayésien associé à
.
où l'on a pu intervertir l'ordre de la sommation et de
l'intégration dans la mesure où tous les termes
étaient positifs. Minimiser le risque bayésien
revient donc à minimiser pour chaque
l'intégrale
Ce polynôme du deuxième degré en
trouve est minimal pour
où l'on utilise le fait que
et
.
On a ainsi montré que
est un estimateur
bayésien de
.
Thierry Cabanal-Duvillard
2001-07-04