Sélection de variables dans les modèles additifs avec des estimateurs en plusieurs étapes - SAM Accéder directement au contenu
Rapport (Rapport Technique) Année : 2015

Sélection de variables dans les modèles additifs avec des estimateurs en plusieurs étapes

Résumé

In this document, we present some multi-step nonparametric estimators used for additive models, whose components are approximated by their series developments in B-splines. We assume that the number of covariates can be larger than the number of observations, but that the number of influent covariates is less than the number of observations. In our work, the fact that a covariate has a significant effect does not mean that the norm of the corresponding component is bounded below by a constant positive bound as it is usually assumed in this context, since we only request that norms of significant components to be bounded below by a bound that may decrease to zero at an appropriate speed. We focus on selection and estimation of sparse additive models in this asymptotic context. Our multi-step estimators combine least squares or P-Splines estimators with Group LASSO. We discuss several model selection criteria (AIC, GCV or BIC) and we establish the proofs of selection and estimation consistency of one of our estimators. The behaviour of the resulting estimators is illustrated via simulations.
Dans ce document, nous présentons des méthodes d'estimation non paramétrique en plusieurs étapes de modèles additifs dont les composantes sont approchées par leurs développements dans des bases de B-splines. Nous nous plaçons dans un contexte asymptotique dans lequel le nombre d'observations tend vers l'infini et le nombre de covariables candidates pour expliquer le modèle peut éventuellement être plus élevé que le nombre d'observations disponibles, mais pour lequel on suppose qu'il y a moins de covariables "influentes" que d'observations. Pour notre travail, la notion d'effet significatif d'une variable ne se traduit pas, comme il est habituel dans ce contexte, par une norme de la variable bornée inférieurement par une constante strictement positive, car nous supposons que la norme de chaque composante significative est minorée par une suite décroissante dépendant du nombre d'observations et pouvant tendre vers 0 asymptotiquement. Nous étudions ainsi les problèmes de sélection et d'estimation de modèles additifs creux. Nous combinons les techniques des moindres carrés ordinaires (MCO) ou les P-Splines avec le Group LASSO. Nous discutons aussi du choix du critère de sélection de modèle (AIC, GCV ou BIC). Nous établissons la la consistance en sélection et en estimation d'un de nos estimateurs, puis illustrons le bien fondé des méthodes développées par des simulations.
Fichier principal
Vignette du fichier
FichierHal8n.pdf (601.4 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01116100 , version 1 (12-02-2015)

Identifiants

  • HAL Id : hal-01116100 , version 1

Citer

Anestis Antoniadis, Yannig Goude, Jean-Michel Poggi, Vincent Thouvenot. Sélection de variables dans les modèles additifs avec des estimateurs en plusieurs étapes. [Rapport Technique] Université d'Orsay; EDF R&D; Université Joseph Fourier; Université Cap Town; Université Paris Descartes. 2015. ⟨hal-01116100⟩
360 Consultations
717 Téléchargements

Partager

Gmail Facebook X LinkedIn More