Comparaison entre l'analyse canonique généralisée régularisée et l'algorithme PLS pour l'analyse des tableaux multiples

Résumé : L'analyse canonique généralisée régularisée (RGCCA pour Regularized Generalized Canonical Correlation Analysis) a été récemment proposée par Tenenhaus et Tenenhaus (2011) pour l'analyse des tableaux multiples. RGCCA unifie des méthodes d'analyse de tableaux multiples basées sur la maximisation d'un critère de corrélation et/ou de covariance entre les composantes résumant chaque tableau. Citons des cas particuliers de RGCCA : analyse canonique régularisée, analyse canonique généralisée (SUMCOR de Horst, SSQCOR de Kettenring, SABSCOR de Mathes et Hanafi), régression PLS généralisée (MAXDIFF de Van de Geer, MAXDIFF B de Hanafi et Kiers, SABSCOV de Krämer), régression PLS hiérarchique, analyse canonique hiérarchique, analyse des redondances hiérarchique, analyse de concordance de Hanafi et Lafosse, analyse de co-inertie multiple de Chessel et Hanafi, analyse de co-inertie multiple orthogonale généralisée de Vivien et Sabatier, approche PLS de Wold (PLS-PM pour PLS path modeling) avec l'option mode B. PLSPM est souvent utilisé avec l'option mode A (Wold (1985), Tenenhaus et al. (2005)). Cet algorithme fonctionne très bien dans la pratique, mais il n'existe pas de preuve de sa convergence. L'algorithme RGCCA " nouveau mode A " est proche de l'algorithme PLS-PM mode A, mais a l'avantage de reposer sur un problème d'optimisation dont la résolution est basée sur un algorithme itératif à convergence monotone. La seule différence entre les deux algorithmes réside dans la normalisation de la composante externe : composante externe standardisée pour PLS-PM et vecteur de poids externe normalisé pour RGCCA " nouveau mode A ". On peut donc penser que RGCCA " nouveau mode A " donnera plus d'importance aux tableaux de grande dimension qu'aux tableaux caractérisés par peu de variables. L'objectif de cette communication est de comparer les résultats de RGCCA avec l'option " nouveau mode A " à ceux de PLS-PM mode A. Les premières comparaisons montrent qu'en fait les comportements des deux algorithmes sont très similaires.
Document type :
Conference papers
Complete list of metadatas

https://hal-supelec.archives-ouvertes.fr/hal-00627606
Contributor : Karine El Rassi <>
Submitted on : Thursday, September 29, 2011 - 10:22:04 AM
Last modification on : Thursday, March 29, 2018 - 11:06:04 AM

Identifiers

  • HAL Id : hal-00627606, version 1

Collections

Citation

Arthur Tenenhaus, Michel Tenenhaus. Comparaison entre l'analyse canonique généralisée régularisée et l'algorithme PLS pour l'analyse des tableaux multiples. 43è journées de Statistique (JDS'11), May 2011, Gammarth, Tunisie. pp.221-226. ⟨hal-00627606⟩

Share

Metrics

Record views

259