Blog

Les règles de syntaxe en XML


Les règles de syntaxe en XML

Les règles de syntaxe de XML sont à la fois simples, logiques et faciles à utiliser. Un document XML est dit bien formé s’il respecte les règles de syntaxe ci-après:

Élément racine (root) d’un document XML

Les documents XML doivent contenir un élément racine (root) qui est la balise parente de toutes les autres balises.

<root>
  <child>
    <subchild>.....</subchild>
  </child>
</root>

Prologue XML

Le prologue XML est optionnel. S’il existe, il doit apparaitre en premier dans le document avant toute autre balise.

Voici une ligne de code qui représente un prologue en XML:

<?xml version="1.0" encoding="UTF-8"?>

Balise fermante en XML

Chaque élément XML doit avoir une balise ouvrante et une balise fermante. Les balises autofermantes (autoclose), quant à elles, n’ont pas besoin d’une balise fermante.

<a> All XML Elements Must Have a Closing Tag </a>
<d id="autoclose_tag" />

XML est sensible la casse

Les balises XML sont sensibles la casse. Ainsi, la balise <produit> est différente de la balise <Produit>.

Imbrication des balises XML

En XML, tous les éléments doivent être correctement imbriqués les uns dans les autres. Il ne faut jamais fermer une balise tant que ses filles sont ouvertes.

<b><i>This text is bold and italic</i></b>

Attribut XML

Les éléments XML peuvent avoir des attributs composés d’un nom et d’une valeur qui décrit l’élément auquel ils appartiennent. Il faut noter que cette valeur doit toujours être entourée de guillemets.

<note date="18/10/2015">
  <to>Idir</to>
  <from>Juva</from>
</note>

Références d’entités de caractères dans XML

Une référence de caractère est une série de caractères qui représente un autre caractère. Il en existe deux types : les références de caractères numériques (décimales ou hexadécimales) et les références d’entités de caractères.
Si vous placez le caractère « < » à l’intérieur d’un élément XML, il va générer une erreur parce que l’analyseur l’interprète comme étant le début d’un nouvel élément. Idem pour le caractère « & ».
Pour éviter cette erreur, il faut remplacer ces caractères par leurs références d’entité comme ceci par exemple:

<prix> &lt; 100€</message>

Voici quelques références d’entités de caractères:

&lt;    pour désigner <
&gt;    pour désigne >
&amp;    pour désigne &
&apos;   pour désigne  ‘
&quot;    pour désigne  »

Les sections CDATA

Avec les sections CDATA, nous n’avons plus besoin d’utiliser les références d’entités de caractères, c’est à dire plus besoin d’échapper les caractères spéciaux XML.
Voici un exemple d’utilisation d’une section CDATA:

<p>
<![CDATA[
   <message> Welcome to seorank </message>
]]>
</p>

Commentaires en XML

Voici la syntaxe à suivre pour écrire des commentaires en XML:

<! - Ceci est un commentaire ->

18 octobre 2015
Commentaires