Comparaison entre l'analyse canonique généralisée régularisée et l'algorithme PLS pour l'analyse des tableaux multiples - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2011

Comparaison entre l'analyse canonique généralisée régularisée et l'algorithme PLS pour l'analyse des tableaux multiples

Arthur Tenenhaus
Michel Tenenhaus
  • Fonction : Auteur

Résumé

L'analyse canonique généralisée régularisée (RGCCA pour Regularized Generalized Canonical Correlation Analysis) a été récemment proposée par Tenenhaus et Tenenhaus (2011) pour l'analyse des tableaux multiples. RGCCA unifie des méthodes d'analyse de tableaux multiples basées sur la maximisation d'un critère de corrélation et/ou de covariance entre les composantes résumant chaque tableau. Citons des cas particuliers de RGCCA : analyse canonique régularisée, analyse canonique généralisée (SUMCOR de Horst, SSQCOR de Kettenring, SABSCOR de Mathes et Hanafi), régression PLS généralisée (MAXDIFF de Van de Geer, MAXDIFF B de Hanafi et Kiers, SABSCOV de Krämer), régression PLS hiérarchique, analyse canonique hiérarchique, analyse des redondances hiérarchique, analyse de concordance de Hanafi et Lafosse, analyse de co-inertie multiple de Chessel et Hanafi, analyse de co-inertie multiple orthogonale généralisée de Vivien et Sabatier, approche PLS de Wold (PLS-PM pour PLS path modeling) avec l'option mode B. PLSPM est souvent utilisé avec l'option mode A (Wold (1985), Tenenhaus et al. (2005)). Cet algorithme fonctionne très bien dans la pratique, mais il n'existe pas de preuve de sa convergence. L'algorithme RGCCA " nouveau mode A " est proche de l'algorithme PLS-PM mode A, mais a l'avantage de reposer sur un problème d'optimisation dont la résolution est basée sur un algorithme itératif à convergence monotone. La seule différence entre les deux algorithmes réside dans la normalisation de la composante externe : composante externe standardisée pour PLS-PM et vecteur de poids externe normalisé pour RGCCA " nouveau mode A ". On peut donc penser que RGCCA " nouveau mode A " donnera plus d'importance aux tableaux de grande dimension qu'aux tableaux caractérisés par peu de variables. L'objectif de cette communication est de comparer les résultats de RGCCA avec l'option " nouveau mode A " à ceux de PLS-PM mode A. Les premières comparaisons montrent qu'en fait les comportements des deux algorithmes sont très similaires.
Fichier non déposé

Dates et versions

hal-00627606 , version 1 (29-09-2011)

Identifiants

  • HAL Id : hal-00627606 , version 1

Citer

Arthur Tenenhaus, Michel Tenenhaus. Comparaison entre l'analyse canonique généralisée régularisée et l'algorithme PLS pour l'analyse des tableaux multiples. 43è journées de Statistique (JDS'11), May 2011, Gammarth, Tunisie. pp.221-226. ⟨hal-00627606⟩
318 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More