Indexation
Définition :
L'indexation est un processus consistant à reformuler le contenu d'un document sous une forme plus adaptée à son exploitation dans une application donnée (par exemple la recherche).
Dans le contexte du numérique :
Les documents sont destinés à être interprétés par des êtres humains.
Les index sont des représentations des documents destinés à être manipulés par des ordinateurs.
![](../res/indexation.png)
Différentes stratégies d'indexation
Méta-données documentaires : des propriétés documentaires sont renseignées manuellement
Référentiels : les documents sont associés à des entrées de référentiel (taxinomie, thésaurus)
Indexation automatique plein-texte : des mots clés sont extraits automatiquement du contenu
Ontologies : Le contenu des documents est représenté logiquement
Folksonomies : Les documents sont associés à des tags (mots clés) posés par les utilisateurs finaux
...
Exemple : Méta-données Dublin Core
Le Dublin Core est une norme ISO proposant un jeu de méta-données très générales pour la description des ressources numériques. Il comporte 15 descripteurs de base (titre, créateur, mots-clés, description, date, langue, ...).
![](../res/indexationAlfresco.png)
Exemple : Référentiels
Les valeurs des méta-données peuvent être contrôlées par des référentiels, ici mots-clés et couverture.
![](../res/indexationNuxeo1.png)