Analyse factorielle des correspondances pour l'indexation et la recherche d'information dans une grande base de données d'images - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Thèse Année : 2009

Factorial Correspondence Analysis for Image Indexing and Retrieval in Large Image Databases

Analyse factorielle des correspondances pour l'indexation et la recherche d'information dans une grande base de données d'images

Résumé

With the development of the digital world, the number of images stored in databases has significantly increased. Images indexing and information retrieval in image databases are more complicated than in the case of textual documents. Indexing methods already used in textual data analysis are proposed to process images, To transfer the results of the textual data analysis to images, new features are required: visual words an images are considered as documents. We are interested in the problem of indexing and information retrieval in a large database of images using data analysis methods and, more specifically, using Factorial Correspondence Analysis (FCA). First, we propose to use relevant indicators of FCA to speed up the retrieval step after adapting it to images. Next, we study the large-scale retrieval with FCA. TO this end, we propose an incremental FCA algorithm to deal with large contingency tables and its parallelization on Graphics Processing Units (GPU). We also develop a parallel version of our research algorithm using relevant indicators of FCA on GPUs. After that, we combine the use of FCA with other methods such as the Contextual Dissimilarity Measure and random forests in order to improve the retrieval quality. Finally, we present a visualization environment, CAViz, which allows us to display the results.
Avec le développement du numérique, le nombre d'images stockées dans les bases de données a beaucoup augmenté. L'indexation des images et la recherche d'information dans les bases d'images sont plus compliquées que dans le cas de documents textuels Des méthodes d'indexation déjà utilisées en analyse de données textuelles sont proposées pour traiter des images. Pour transférer les résultats de l'analyse de données textuelles aux images, il est nécessaire d'utiliser de nouvelles caractéristiques : les mots visuels et on considère les images comme documents. Nous nous intéressons au problème d'indexation et de recherche d'information dans des grandes bases de données d'images à l'aide de méthodes d'analyse de données comme l'Analyse Factorielle des Correspondances (AFC). Nous proposons d'abord une utilisation astucieuse des indicateurs de l'AFC pour accélérer la recherche après l'avoir adaptée aux images. Nous nous intéressons ensuite au problème du passage à l'échelle de l'AFC. Pour ce faire, nous proposons un algorithme d'AFC incrémentale pour traiter de grands tableaux de données et la parallélisation de cet algorithme sur processeurs graphiques (GPU). Nous développons aussi une version parallèle de notre algorithme de recherche qui utilise les indicateurs de l'AFC sur GPU. Puis nous associons l'AFC à d'autres méthodes comme la Mesure de Dissimilarité Contextuelle ou les forêts aléatoires pour améliorer la qualité de la recherche. Enfin, nous présentons un environnement de visualisation, CAViz, pour accompagner les traitements précédents.
Fichier principal
Vignette du fichier
these_Nguyen_Khang_Pham.pdf (2.87 Mo) Télécharger le fichier

Dates et versions

tel-00532574 , version 1 (05-11-2010)

Identifiants

  • HAL Id : tel-00532574 , version 1

Citer

Khang-Nguyen Pham. Analyse factorielle des correspondances pour l'indexation et la recherche d'information dans une grande base de données d'images. Interface homme-machine [cs.HC]. Université Rennes 1, 2009. Français. ⟨NNT : ⟩. ⟨tel-00532574⟩
388 Consultations
224 Téléchargements

Partager

Gmail Facebook X LinkedIn More