Inférence statistique à travers les échelles

Orateur: Céline DUVAL
Type: Thèse
Directeur: Marc HOFFMANN
Site: UGE
Salle: 4B08R
Date de début: 07/12/2012 - 14:00
Date de fin: 07/12/2012 - 14:00

Cette thèse porte sur le problème d’estimation à travers les échelles pour un processus stochastique. Nous étudions comment le choix du pas d’échantillonnage impacte les procédures statistiques. Nous nous intéressons à l’estimation de processus à sauts à partir de l’observation d’une trajectoire discrétisée sur $[0, T ]$. Lorsque la longueur de l’intervalle d’observation $T$ va à l’infini, le pas d’échantillonnage tend soit vers $0$ (échelle microscopique), soit vers une constante positive (échelle intermédiaire) soit encore vers l’infini (échelle macroscopique). Dans chacun de ces régimes nous supposons que le nombre d’observations tend vers l’infini.

Dans un premier temps le cas particulier d’un processus de Poisson composé d’intensité inconnue avec des sauts symétriques $\{−1, 1\}$ est étudié. Le Chapitre 2 illustre la notion d’estimation statistique dans les trois échelles définies ci-dessus. Dans ce modèle, on s’intéresse aux propriétés des expériences statistiques. On montre la propriété de Normalité Asymptotique Locale dans les trois échelles microscopique, intermédiaire et macroscopique. L’information de Fisher est alors connue pour chacun de ces régimes. Ensuite nous analysons comment se comporte une procédure d’estimation de l’intensité qui est efficace (de variance minimale) à une échelle donnée lorsqu’on l’applique à des observations venant d’une échelle différente. On regarde l’estimateur de la variation quadratique empirique, qui est efficace dans le régime macroscopique, et on l’utilise sur des données provenant des régimes intermédiaire ou microscopique. Cet estimateur reste efficace dans les échelles microscopiques, mais montre une perte substantielle d’information aux échelles intermédiaires. Une procédure unifiée d’estimation est proposée, efficace dans tous les régimes.

Les Chapitres 3 et 4 étudient l’estimation nonparamétrique de la densité de saut d’un processus de renouvellement composé dans les régimes microscopiques, lorsque le pas d’échantillonnage tend vers $0$. Un estimateur de cette densité utilisant des méthodes d’ondelettes est construit. Il est adaptatif et minimax pour des pas d’échantillonnage qui décroissent en $T^{-\alpha}$, pour $\alpha > 0$. La procédure d’estimation repose sur l’inversion de l’opérateur de composition donnant la loi des incréments comme une transformation non linéaire de la loi des sauts que l’on cherche à estimer. L’opérateur inverse est explicite dans le cas du processus de Poisson composé (Chapitre 3), mais n’a pas d’expression analytique pour les processus de renouvellement composés (Chapitre 4). Dans ce dernier cas, il est approchée via une technique de point fixe.

Le Chapitre 5 étudie le problème de perte d’identifiabilité dans les régimes macroscopiques. Si un processus à sauts est observé avec un pas d'échantillonnage grand, certaines approximations limites, telles que l’approximation gaussienne, deviennent valides. Ceci peut entraîner une perte d’identifiabilité de la loi ayant généré le processus, dès lors que sa structure est plus complexe que celle étudiée dans le Chapitre 2. Dans un premier temps un modèle jouet à deux paramètres est considéré. Deux régimes différents émergent de l’étude : un régime où le paramètre n’est plus identifiable et un où il reste identifiable mais où les estimateurs optimaux convergent avec des vitesses plus lentes que les vitesses paramétriques habituelles. De l’étude de cas particulier, nous dérivons des bornes inférieures montrant qu’il n’existe pas d’estimateur convergent pour les processus de Lévy de saut pur ou pour les processus de renouvellement composés dans les régimes macroscopiques tels que le pas d’échantillonnage croît plus vite que racine de $T$ . Enfin nous identifions des régimes macroscopiques où les incréments d’un processus de Poisson composé ne sont pas distinguables de variables aléatoires gaussiennes, et des régimes où il n’existe pas d’estimateur convergent pour les processus de Poisson composés dépendant de trop de paramètres.

télécharger