Quelques bonnes questions sur XML

Réalisé à partir d'une interview de Michaël Tartar dans un chat de LeJournalDuNet en 2001.

http://www.journaldunet.com/chat/retrans/011206_tartar.shtml

Quel est l'avantage de ce langage par rapport au HTML ?

HTML est un langage de mise en forme. XML est beaucoup plus générique. Il permet de définir des langages alors que HTML définit un jeu de balises limitées et donc non-extensibles.

Pourquoi le XML n'a-t-il pas encore remplacé le HTML ?

Le XML n'a pas vocation à remplacer le HTML. XML permet aux architectes de sites de se concentrer sur l'information à fournir à l'internaute, et dans un deuxième temps de la mettre en forme pour des besoins spécifiques : PDF pour des documents à imprimer, HTML pour les navigateurs, ...

Quel est l'intérêt de l'utilisation d'XML sur le web en opposition aux fichiers CSS ?

CSS[1] ne s'applique qu'à la définition de règles graphiques de restitution d'une information, alors que XML permet de structurer les informations. A ce titre, sur le Web, ils sont complémentaires.

Qui est le mieux placé pour monter en puissance sur XML ? Un webmaster ou un développeur ?

Les deux : Le développeur devra mettre à disposition du webmaster une information XML prête à être intégrée au site. Le webmaster sélectionnera les morceaux d'informations qu'il souhaite afficher en fonction du contexte.

Pour le stockage du contenu XML, dans quels cas faut-il s'appuyer sur une base de données et dans quels cas peut-on se satisfaire de conserver les fichier XML à proprement dit ?

C'est le même problème avec n'importe quel type d'information. Qu'elle soit structurée en XML ne change rien : les bases de données apportent des services de confidentialité, d'intégrité, de montée en charge, ... que n'apportent pas les simples systèmes de fichiers.

Comment les outils de recherche vont-ils s'adapter à ce langage ?

XML permet de définir un vocabulaire et donc une sémantique particulière à chaque information. Les outils de recherche devront s'adapter et proposer des méthodes d'accès aux informations complémentaires à la recherche plain-texte (microformats, Web sémantique, ...).

Y a-t-il un lien entre XML et le Web sémantique ?

Le Web sémantique est un Web sur lequel les informations disponibles ont un sens pour les humains et pour les machines. XML a alors une place de choix pour sa mise en œuvre dans la mesure où le principe du balisage mêle justement information pour l'homme et pour la machine. Mais ce n'est pas le seul domaine de développement de XML, dont les usages dépassent largement le domaine du Web.

Les jeux de balises extensibles, c'est bien, mais trop de jeux différents ne risque-t-il pas de nuire à l'universalité que veut véhiculer XML ?

Cette question est centrale concernant XML. Il faut d'abord distinguer les langages XML spécifiques à chaque organisation, ceux que chacun se créé sur mesure pour ses propres besoins, des langages XML standard.

Pour les seconds, il faut bien comprendre que chaque vocabulaire sera spécialisé pour une application particulière. Par exemple SVG pour modéliser les documents vectoriels en 2D, XSL-FO pour modéliser des mises en pages à destination de l'impression papier, etc. Donc, sous réserve que deux langages distincts ne répondent pas aux mêmes besoins, ces langages resteront complémentaires.

Concernant les langages "maison" de chacun, il est évident qu'ils se recoupent les uns les autres et participent d'une certaine « babélisation ». Et c'est une des raisons pour lesquelles les solutions d'EAI[2] sont amenées à se développer, ne serait-ce que pour assurer la transformation des informations à priori identiques. Sur le Web, des services de traduction assurent déjà la réconciliation sémantique de vocabulaires frères. Les technologies comme XSL-XSLT de transformation automatique permettent de concilier une approche spécifique à chaque contexte et des échanges dans via langages standards ou des traductions de dialecte à dialecte.

Via quels outils XML va-t-il se généraliser dans les échanges entre entreprises ?

Clairement, les outils d'EAI[3] prendront une part importante, ne serait-ce que pour traiter les transformations des différents langages frères, ou encore assurer la gestion transactionnelle des échanges.

Quelles relations y a-t-il entre XML et EDI ?

L'EDI[4] propose une infrastructure d'échange d'informations entre entreprises, ce qui comprend le format des données (par exemple EDIFACT) et le réseau à valeur ajoutée, qui assure la sécurité de la communication entre les entreprises. XML ne propose que la structuration. Un support transactionnel reste nécessaire, avec, par exemple, Internet pour le transport et ebXML[5] pour la modélisation des processus d'échange d'informations.

Est-ce que l'évolution de l'Internet mobile va favoriser l'utilisation du XML dans le développement d'applications ?

Certainement : dès que l'information doit être restituée sur plusieurs supports, XML est un choix d'excellence.

Est-ce que les XML Schema sont d'un usage répandu ? Peut-on se concentrer dessus et oublier DTD, ou l'usage de DTD est-il encore trop répandu ?

Clairement, les DTD[6] sont très répandues et sont amenées à le rester pour encore un bon moment, ne serait-ce que par leur adaptation à l'aspect documentaire de XML. Concernant l'aspect données, les limites des DTD sont telles que le passage par les schémas est nécessaire. Le fait que le W3C ait passé les schémas à l'état de recommandation permettra d'assurer un support de cette technique de définition des vocabulaires XML dans les différents produits du marché.

Si XML a l'air de résoudre autant de problèmes, pourquoi ne l'a-t-on pas inventé plus tôt ?

Pouvait-on l'inventer plus tôt ? Les premiers problèmes à résoudre étaient surtout liés à l'interopérabilité des systèmes. XML se place un cran au dessus en permettant de structurer l'information de manière standardisée, et surtout acceptée par tous.

XML est-il LA réponse au stockage structuré de n'importe quel document ?

Les documents graphiques binaires, tels que les photos ou les films, resteront dans des formats binaires, bien que certainement décrits par des fichiers XML (MPEG-7 pour la vidéo par exemple). Quant aux informations amenées à être réutilisées, recherchées, partagées, XML est effectivement la réponse.