Indexation

Définition

L'indexation est un processus consistant à reformuler le contenu d'un document sous une forme plus adaptée à son exploitation dans une application donnée (par exemple la recherche).

Dans le contexte du numérique :

  • Les documents sont destinés à être interprétés par des êtres humains.

  • Les index sont des représentations des documents destinés à être manipulés par des ordinateurs.

Principe de l'indexation

Différentes stratégies d'indexation

  • Méta-données documentaires : des propriétés documentaires sont renseignées manuellement

  • Référentiels : les documents sont associés à des entrées de référentiel (taxinomie, thésaurus)

  • Indexation automatique plein-texte : des mots clés sont extraits automatiquement du contenu

  • Ontologies : Le contenu des documents est représenté logiquement

  • Folksonomies : Les documents sont associés à des tags (mots clés) posés par les utilisateurs finaux

  • ...

ExempleMéta-données Dublin Core

Le Dublin Core est une norme ISO proposant un jeu de méta-données très générales pour la description des ressources numériques. Il comporte 15 descripteurs de base (titre, créateur, mots-clés, description, date, langue, ...).

Interface d'indexation Dublin Core (Alfresco)

ExempleRéférentiels

Les valeurs des méta-données peuvent être contrôlées par des référentiels, ici mots-clés et couverture.

Indexation selon des référentiels géographique et thématique (Nuxéo-DM)