Discussion : HTML et XML

FondamentalXML et HTML ne sont pas au même niveau

XML est un méta-langage et HTML est un langage, XML et HTML ne sont donc pas directement comparables. En particulier XHTML est un langage XML, c'est donc du XML !

XML et le Web

Une question pertinente est en revanche de se demander pourquoi HTML ou XHTML ne suffisent pas pour les usages Web, et donc pourquoi XML est utile en dehors de son instanciation via XHTML.

La réponse est que si HTML, et a fortiori XHTML, fournissent une solution de publication efficiente, ils n'offrent pas le même potentiel en terme d'ingénierie documentaire. XML possède donc un potentiel de manipulation plus important (par exemple pour le multi-supports, la rééditorialisation, ...).

ExempleExemple de limites du HTML

Le HTML[1], langage de référence du web qui a su s'imposer par sa simplicité d'écriture, possède également des inconvénients qui ont motivé les recherches du W3C[2] sur le XML[3] :

  • Jeu de balises restreint : HTML est un langage, les balises sont définies a priori , il est impossible de définir ses propres balises et de créer un vocabulaire propre à un domaine spécifique. Ce manque d'extensibilité le rend mal approprié pour l'indexation de documents variés, le multimédia, ...

  • Mélange des descripteurs physiques et logiques : Les balises HTML fournissent des informations relatives à la typographie ou la mise en page d'un texte (CENTER, B, ...) mais également relatives à son rôle dans le document (H1, H2, ...). Cette non séparation stricte entre contenu et présentation nuit à la publication multi-supports et la rééditorialisation par exemple.

  • Liens : En HTML, les liens sont généralement des pointeurs directs vers une autre ressource (A). Cette mise en œuvre limite fortement les possibilités de réutilisation, notamment par le risque de lien cassé.