* Les balises fermantes
* Les balises vides
* Les instructions de traitement
* Les commentaires
* Les sections CDATA (Character DATA)
==== Conventions de nommage des balises ====
* Les noms ne peuvent pas commencer par la chaîne de caractères « xml », dans n'importe quelle combinaison de casse (ou Xml, ou XML…) ;
* les noms sont sensibles à la casse (différentiation minuscules/majuscules) ;
* les noms ne peuvent pas débuter par un nombre ou un signe de ponctuation ;
* les noms ne peuvent pas contenir d'espaces ;
* éviter les caractères accentués et les opérateurs, virgules, point-virgules…
==== Les balises ouvrantes ====
Une balise ouvrante est un élément délimitant une section. La section se termine ensuite par une balise fermante.
Une balise ouvrante est une chaîne composée de chiffres, de lettres et des caractères - et _. Cette chaîne est comprise entre un < et un >.
Exemple :
==== Les balises fermantes ====
Une balise fermante reprend l'identificateur de la balise ouvrante, en le précédent d'un caractère « barre de fraction » ''(slash)''.
Exemple :
==== Les balises vides ====
Une balise « vide » est le résultat de la contraction d'une balise ouvrante et d'une balise fermante ne contenant pas de données.
donne
=== Les attributs ===
Les balises ouvrantes et les balises vides peuvent être enrichies avec des attributs.
- Contenu de l'élément
Dans l'exemple ci-dessus, la balise ouvrante '''item''' est munie de deux attributs, '''id''' et '''date'''. La balise vide '''break''' est munie de l'attribut '''mode'''.
attention|Leurs valeurs doivent obligatoirement être entre guillemets ou apostrophes dactylographiqueshttp://www.w3schools.com/xml/xml_attributes.asp.
=== Les instructions de traitement ===
Une instruction de traitement est destinée à être lue et comprise par un programme spécifique, afin de permettre le traitement du document XML{{lien web | url = http://www.yoyodesign.org/doc/w3c/xml11/index.html#sec-pi | titre = Le point sur les instructions de traitement | site = yoyodesign.org}}.
Une instruction de traitement commence par un point d'interrogation « ? ».
Exemple :
=== Les commentaires ===
Les commentaires sont des balises qui ne sont pas interprétées par l'application qui traite le document XML.
Un commentaire est une balise commençant par '''<!--''' et terminant par '''-->'''.
Exemple :
=== Les entités ===
XML 1.0 définit un petit nombre d'entités utilisables dans le document sans nécessiter de déclaration dans le doctype.
Ces entités sont :
^ Entité ^ Caractère ^ Description ^
| < | < | Symbole « inférieur » |
| > | > | Symbole « supérieur » |
| & | & | Esperluette, « et » commercial |
| ' | ' | guillemet simple |
| " | " | guillemet double |
Toujours sans déclaration de doctype spécial, on peut écrire une entité avec « & », « # », une référence Unicode et un « ; ».
^ Entité ^ Caractère ^ Description ^
| π | π | pi |
| β | β | bêta |
Exemple
Étudions la balise <p> Étudions la balise <p>
===== Structure d'un document XML =====
=== En-tête ===
Les trois constituants de l'en-tête que nous allons décrire ne sont pas obligatoires. Ils sont employés en cas de besoin pour fixer l'encodage, définir le doctype et/ou associer une feuille de style.
==== Version, encodage ====
Il est souhaitable que le document XML commence par l'indication de la version du langage et le jeu de caractères utilisé. C'est souvent utf-8. Il est également souhaitable, si le document est stocké sur disque, que l'encodage du fichier soit le même que celui mentionné par l'attribut ''encoding''…
==== Référence au DTD ====
La deuxième information utile est la mention du doctype. Certains documents XML en ont impérativement besoin, d'autres peuvent s'en passer.
]>
En analysant ce {{wt|doctype}}, l'analyseur syntaxique (le {{wt|parser}}, p.ex. : via [http://www.xmlcooktop.com/ Cooktop] ou encore [http://sourceforge.net/projects/npp-plugins/files/XML%20Tools/ XML tools pour Notepad++]) est en mesure de considérer le document XML comme valide.
==== Mention d'une feuille de style ====
Il est possible d'associer un document XML à une feuille de style CSS ou XSL. Si la fonctionnalité fait réfléchir, au début, il y a fort à parier que vous en abandonnerez la pratique par la suite. En effet, la philosophie XML va à l'opposé.
=== Une seule racine ===
Une balise a un statut spécial, c'est la racine du document XML. C'est à partir de cette balise que se développe l'arborescence du document.
=== Règles de mise en œuvre des balises ===
*Toute balise ouverte doit être fermée.
*Les balises doivent être correctement imbriquées.
*Les balises sont imbriquables hiérarchiquement sans limitation mais il ne doit y avoir qu'un seul élément à la racine.
Le corps d'un document XML est une arborescence d'éléments (balises) imbriqués, avec un élément racine unique.
Quand toutes ces règles sont respectées, on obtient un document XML « '''bien formé''' ». Dans ce cas, un navigateur comme Internet explorer ou Firefox peut l'ouvrir. Dans le cas contraire, le navigateur affiche un message d'erreur.
== Exemple de structure simple ==
- Premier élément
- Autre chose
- Troisième élément
- Quatrième élément
===== Espace de nom =====
== Syntaxe ==
L'exemple ci-dessous contient deux déclarations, la première par défaut et la seconde associant le préfixe « ip » à l'URI des adresses IP, pour les distinguer des adresses postales :
===== Attribut balise xml =====
^ Attribut ^ Description ^ Exemple ^
| xml:lang | décrit la langue du contenue de l'élément, sur deux ou trois lettres | Bonjour
|
| xml:space | permet de faire respecter à une application le traitement des caractères d'espacement; deux valeurs possible: default ou preserve | titre1
titre2
|
| xml:base | Permet de spécifié l'URI (URL+URN) d'un élément |
|
| xml:id | Permet d'attribuer un identificateur à tout élément | |
===== Interprétation du XML =====
Il existe de nombreuses API permettant d'interpréter un document XML. La plupart sont conçues pour un langage particulier :
* Dom4J (Java)
* JDOM (Java)
* SimpleXML (PHP)
* PyXML (Python)[1]
Tous ces interpréteurs peuvent être de deux types normalisés :
* DOM (créé par le W3C) : un arbre de nœuds complet est construit à partir du document XML.
* SAX (créé par David Megginson) : l'interpréteur appelle certaines fonctions de l'application en fonction de chacun des éléments de base rencontrés dans le document XML (ouvertures de balise, fermetures, données, commentaires, ...).
===== XPath =====
== Syntaxe ==
Le XPath est un langage de sélection de différents types d'objets XML, appelés « nœuds »http://www.w3schools.com/dom/dom_nodetype.asp. Un ensemble de nœuds est appelé « contexte ».
Le XPath se présente sous la forme de chemins composés de http://www.w3schools.com/xpath/xpath_syntax.asp
^ Sélecteur ^ Notes ^
| nom du nœud | Sélectionne ce qui est compris dans le nœud nommé |
| / | Sélectionne en partant du nœud racine (chemin absolu). |
| / / | Sélectionne en partant du nœud courant, peu importe le reste de l'emplacement. |
| . | Sélectionne à partir du nœud courant (chemin relatif). = self::node() |
| .. | Sélectionne à partir du parent du nœud courant. = parent::node() |
| @ | Sélectionne les attributs. = attribute:: |
| ancestor| | ancêtre |
|ancestor-or-self| | ancêtre ou soi |
|attribute |@ | attribut, @abc signifie attribute::abc |
|child| | enfant, xyz signifie child::xyz |
|descendant| | |
|descendant-or-self|//|// signifie /descendant-or-self::node()/ |
|following| | | suivant|
|following-sibling| | | frère suivant |
|namespace| | | espace de noms |
|parent | .. |.. signifie parent::node() |
|preceding| | | précédent |
|preceding-sibling| || |
|self|.|soi, . signifie self::node() |
== Tests de nœuds ==
Soit l'[[../Espace de nom/|espace de nom]] ns :
* //ns:* sélectionne tout les éléments du namespace.
* //ns:nom récupère tous les éléments du namespace nommés "nom".
^ Tests ^ Notes ^
| comment() | trouve tous les commentaires (ex : )|
| text() | trouve un nœud texte, (ex : hello world dans hello world )|
| processing-instruction() | trouve les instructions de traitement (ex : //processing-instruction('php') trouve )|
| node() | trouve tous les nœuds.|
== Prédicats ==
Les prédicats sont des fonctions filtrant les nœuds évalués à ''false'', qui se placent à la fin des sélectionshttp://www.w3.org/TR/xpath#corelib :
Par exemple, les quatre requêtes ci-dessous renvoie le même résultat (si la branche 2 est la dernière comme dans l'exemple en bas de cette page) :
*/ /branche[2]
*/ /branche[@nom="branche2"]
*/tronc/branche[last()]
*/tronc/branche[position()=2]
^ Prédicats ^ Notes ^
|last() | renvoie le dernier nœud de la sélection|
|position() | renvoie le nœud situé à la position précisée|
|count(contexte) | renvoie le nombre de nœuds en paramètre|
|starts-with(chaine1, sous-chaine2) | renvoie ''true'' si le premier argument commence avec le second|
|contains(botte_de_foin, aiguille) | renvoie ''true'' si le premier argument contient le second|
|sum(contexte) | renvoie la somme des valeurs numériques des nœuds en paramètre|
|floor(nombre) | renvoie le nombre arrondi à l'entier inférieur|
|ceiling(nombre) | renvoie le nombre arrondi à l'entier supérieur|
|round(nombre) | renvoie le nombre arrondi à l'entier le plus proche|
== Exemples ==
Soit l'arborescence suivante :
=== Abréviations ===
- Sélection 1 : toutes les /tronc/branche/brindille/feuille
- Non abrégé : /child::tronc/child::branche/child::brindille/child::feuille
- Sélection 2 : la /tronc/branche[@nom='branche3']
- Non abrégé : /child::tronc/child::branche[attribute::nom='branche3']
-Sélection 3 : toutes les brindilles ont au moins une feuille.
- //brindille[feuille]
- Sélection 4 : dernière branche du tronc.
- //tronc/branche[last()]
- Sélection 5 : tous les noms des brindilles qui n'ont pas de feuille.
- //brindille[not(feuille)]/@nom
=== PHP ===
Créer le .php suivant à côté du tronc.xml publié ci-dessus.
xpath($xpath)) {
print 'Résultats :';
var_dump($result);
} else {
echo 'Syntaxe invalide.';
}
}
else
exit("Le fichier $file n'existe pas.");
?>