Documents structurés et documents formatés

DéfinitionDocument formaté

On appelle document formaté un document dont le fichier informatique source décrit la façon de le mettre en forme. C'est la façon la plus courante de traiter avec les documents informatiques, telle qu'elle est mise en œuvre dans les traitements de texte ou sur le Web avec HTML.

Un document formaté nécessite un logiciel capable d'en interpréter le format pour permettre de le lire.

XML est un excellent candidat à la sérialisation[1] de documents formatés.

ExempleDocument formaté (format OpenDocument : extrait simplifié )

1
<document-content>
2
    <automatic-styles>
3
        <style name="P1" family="paragraph">
4
            <text-properties font-name="Times New Roman" fo:font-size="12pt"/>
5
        </style>
6
        <style name="P2" family="paragraph">
7
            <text-properties font-name="Times New Roman" fo:font-size="16pt" fo:font-weight="bold"/>
8
        </style>
9
        <style name="P3" family="paragraph">
10
            <paragraph-properties fo:text-align="center"/>
11
            <text-properties font-name="Times New Roman" fo:font-size="18pt" fo:font-weight="bold"/>
12
        </style>
13
        <style name="P4" family="paragraph">
14
            <text-properties font-name="Times New Roman" fo:font-size="12pt" fo:font-style="italic"
15
            />
16
        </style>
17
        <style name="T1" family="text">
18
            <text-properties font-name="Verdana"/>
19
        </style>
20
    </automatic-styles>
21
    <body>
22
        <text>
23
            <p style-name="P2">As We May Think</p>
24
            <p style-name="P1">
25
                <span style-name="T1">By Vannevar Bush</span>
26
            </p>
27
            <p style-name="P4">As Director of the Office of Scientific Research and Development, Dr.
28
                Vannevar Bush ...</p>
29
            <p style-name="P1">This has not been a scientist's war ...</p>
30
            <p style-name="P3">1</p>
31
            <p style-name="P1">Of what lasting benefit has been man's use of science ...</p>
32
            <p style-name="P3">2</p>
33
            <p style-name="P1">A record if it is to be useful to science ...</p>
34
        </text>
35
    </body>
36
</document-content>
Visualisation dans OpenOffice.org Writer de l'extrait de l'article "As We May Think"

DéfinitionNotion de documents structurés

On appelle document structuré un document dont la structure logique est décrite plutôt que la mise en forme physique ( Structured documents[2], p.7).

Après SGML qui avait été inventé pour cela, XML est aujourd'hui le candidat quasi-unique pour la réalisation de documents structurés.

ExempleDocument structuré (format DocBook, légèrement simplifiée)

1
<article xmlns="http://docbook.org/ns/docbook">
2
    <info>
3
        <title>As we may think</title>
4
        <author>
5
            <personname>Vannevar Bush</personname>
6
        </author>
7
    </info>
8
    <epigraph>
9
        <para>As Director of the Office of Scientific Research and Development, Dr. Vannevar Bush
10
            ...</para>
11
    </epigraph>
12
    <para>This has not been a scientist's war ...</para>
13
    <sect1>
14
        <para>Of what lasting benefit has been man's use of science ...</para>
15
    </sect1>
16
    <sect1>
17
        <para>A record if it is to be useful to science ...</para>
18
    </sect1>
19
</article>

DéfinitionTransformation des documents structurés

Un document structuré n'est pas destiné à être directement utilisé pour la lecture humaine, il doit être d'abord transformé dans un document formaté pour être utilisé (visualisé, imprimé, ...).

Processus de transformation d'un document structuré en document formaté

RemarqueChaîne XML complète

La technologie XML peut en fait être utilisée tout au long de la chaîne :

  • Langage XML orienté document structuré en amont (DocBook, DITA, TEI, langage local, ...)

  • Langage XML de programmation pour la transformation (XSL-XSLT)

  • Langage XML orienté document formaté pour l'aval (OpenDocument, XHTML, ...)

ComplémentBibliographie

Technologie de la GED[3] : Structure logique et structure physique (pp58-61)