Définition de la TEI
TEI veut dire Text Encoding Initiative, ou groupe d'initiative pour le balisage normalisé des textes.
Fondamental :
La TEI c'est principalement un ensemble de recommandations de mise en forme de l'information dans les textes électroniques.
Lancé au départ avec SGML puis ayant migré sur XML. Il s'agit de baliser les texte afin de faciliter le traitement de ces documents. Ce format est aussi voué à être interdisciplinaire afin de promouvoir le partage de la connaissance et de l'information.
Définition : En quoi cela consiste ?
Les spécifications de la TEI sont divisées en modules contenant les recommandations par rapport à un domaine d'application particulier.
Remarque : Validation
Complément : Chaque module représente un domaine d'activité
Voici une liste exhaustive des 21 modules proposés par la TEI
TEI | Modules TEI de base |
CORE | Éléments de base pour la plupart des documents |
HEADER | Header TEI |
TEXTSTRUCTURE | Module de base pour les textes |
GAIJI | Gestion des caractères, glyphes et mode d'écriture |
VERSE | Poèmes |
DRAMA | Scripts (théâtre, cinéma) |
SPOKEN | Dialogues et autres prestations orales |
DICTIONARIES | Dictionnaires, lexiques |
MSDESCRIPTION | Transcription de manuscrits (parchemins, livre d'époque, etc) |
TRANSCR | Documents scannés et notes sur manuscrits |
TEXTCRIT | Témoignages et critiques de texte |
NAMESDATES | Noms, dates, personnages, lieux |
FIGURES | Tableaux, formules, graphiques et partitions (musique) |
CORPUS | Données linguistiques |
LINKING | Liens et références |
ANALYSIS | Analyses et interprétations |
ISO-FS | Ensemble de caractéristiques |
NETS | Graphes, réseaux et arbres |
CERTAINTY | Certitude, précision et responsabilités |
TAGDOCS | Éléments de documentation |