Documents structurés et documents formatés
Définition : Document formaté
On appelle document formaté un document dont le fichier informatique source décrit la façon de le mettre en forme. C'est la façon la plus courante de traiter avec les documents informatiques, telle qu'elle est mise en œuvre dans les traitements de texte ou sur le Web avec HTML.
Un document formaté nécessite un logiciel capable d'en interpréter le format pour permettre de le lire.
XML est un excellent candidat à la sérialisation[1] de documents formatés.
Exemple : Document formaté (format OpenDocument : extrait simplifié )
<document-content>
<automatic-styles>
<style name="P1" family="paragraph"><text-properties font-name="Times New Roman" fo:font-size="12pt"/></style>
<style name="P2" family="paragraph"><text-properties font-name="Times New Roman" fo:font-size="16pt" fo:font-weight="bold"/></style>
<style name="P3" family="paragraph"><paragraph-properties fo:text-align="center"/><text-properties font-name="Times New Roman" fo:font-size="18pt" fo:font-weight="bold" /></style>
<style name="P4" family="paragraph"><text-properties font-name="Times New Roman" fo:font-size="12pt" fo:font-style="italic"/></style><style name="T1" family="text"><text-properties font-name="Verdana"/></style>
</automatic-styles>
<body>
<text>
<p style-name="P2">As We May Think</p>
<p style-name="P1"><span style-name="T1">By Vannevar Bush</span></p>
<p style-name="P4">As Director of the Office of Scientific Research and Development, Dr. Vannevar Bush ...</p>
<p style-name="P1">This has not been a scientist's war ...</p>
<p style-name="P3">1</p>
<p style-name="P1">Of what lasting benefit has been man's use of science ...</p>
<p style-name="P3">2</p>
<p style-name="P1">A record if it is to be useful to science ...</p>
</text>
</body>
</document-content>
Définition : Notion de documents structurés
On appelle document structuré un document dont la structure logique est décrite plutôt que la mise en forme physique ( Structured documents[2], p.7).
Après SGML qui avait été inventé pour cela, XML est aujourd'hui le candidat quasi-unique pour la réalisation de documents structurés.
Exemple : Document structuré (format DocBook, légèrement simplifiée)
<article xmlns="http://docbook.org/ns/docbook">
<info>
<title>As we may think</title>
<author><personname>Vannevar Bush</personname></author>
</info>
<epigraph><para>As Director of the Office of Scientific Research and Development, Dr. Vannevar Bush ...</para></epigraph>
<para>This has not been a scientist's war ...</para>
<sect1>
<para>Of what lasting benefit has been man's use of science ...</para>
</sect1>
<sect1>
<para>A record if it is to be useful to science ...</para>
</sect1>
</article>
Définition : Transformation des documents structurés
Un document structuré n'est pas destiné à être directement utilisé pour la lecture humaine, il doit être d'abord transformé dans un document formaté pour être utilisé (visualisé, imprimé, ...).
Remarque : Chaîne XML complète
La technologie XML peut en fait être utilisée tout au long de la chaîne :
Langage XML orienté document structuré en amont (DocBook, DITA, TEI, langage local, ...)
Langage XML de programmation pour la transformation (XSL-XSLT)
Langage XML orienté document formaté pour l'aval (OpenDocument, XHTML, ...)
Complément : Voir aussi
Complément : Bibliographie
Technologie de la GED[3] : Structure logique et structure physique (pp58-61)