XML -sintaksisreëls
Die sintaksisreëls van XML is baie eenvoudig en logies. Die reëls is maklik om te leer, en maklik om te gebruik.
XML-dokumente moet 'n wortelelement hê
XML-dokumente moet een wortelelement bevat wat die ouer van alle ander elemente is:
<root>
<child>
<subchild>.....</subchild>
</child>
</root>
In hierdie voorbeeld is <note> die wortelelement:
<?xml version="1.0" encoding="UTF-8"?>
<note>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>
Die XML Prolog
Hierdie reël word die XML- prolog genoem :
<?xml version="1.0" encoding="UTF-8"?>
Die XML-prolog is opsioneel. As dit bestaan, moet dit eerste in die dokument kom.
XML-dokumente kan internasionale karakters bevat, soos Noorse øæå of Franse êèé.
Om foute te vermy, moet jy die enkodering wat gebruik word spesifiseer, of jou XML-lêers stoor as UTF-8.
UTF-8 is die verstekkarakterkodering vir XML-dokumente.
Karakterkodering kan bestudeer word in ons Karakterstel-tutoriaal .
UTF-8 is ook die verstekkodering vir HTML5, CSS, JavaScript, PHP en SQL.
Alle XML-elemente moet 'n sluitingsmerker hê
In XML is dit onwettig om die sluitingsmerker weg te laat. Alle elemente moet 'n sluitingsmerker hê:
<p>This is a paragraph.</p>
<br />
Let wel: Die XML-prolog het nie 'n sluitingsmerker nie! Dit is nie 'n fout nie. Die prolog is nie deel van die XML-dokument nie.
XML-etikette is hooflettergevoelig
XML-etikette is hooflettersensitief. Die merker <Brief> verskil van die merker <letter>.
Openings- en afsluitetikette moet met dieselfde hoofletters geskryf word:
<message>This is correct</message>
"Oop- en toemaaketikette" word dikwels na verwys as "Begin- en eindetikette". Gebruik wat jy ook al verkies. Dit is presies dieselfde ding.
XML-elemente moet behoorlik geneste wees
In HTML kan jy dalk onbehoorlik geneste elemente sien:
<b><i>This text is bold and italic</b></i>
In XML moet alle elemente behoorlik in mekaar geneste wees:
<b><i>This text is bold and italic</i></b>
In die voorbeeld hierbo beteken "Behoorlik geneste" eenvoudig dat aangesien die <i>-element binne die <b>-element oopgemaak is, dit binne die <b>-element toegemaak moet word.
XML-kenmerkwaardes moet altyd aangehaal word
XML-elemente kan eienskappe in naam/waarde-pare hê, net soos in HTML.
In XML moet die kenmerkwaardes altyd aangehaal word:
<note date="12/11/2007">
<to>Tove</to>
<from>Jani</from>
</note>
Entiteitsverwysings
Sommige karakters het 'n spesiale betekenis in XML.
As jy 'n karakter soos "<" binne 'n XML-element plaas, sal dit 'n fout genereer omdat die ontleder dit interpreteer as die begin van 'n nuwe element.
Dit sal 'n XML-fout genereer:
<message>salary < 1000</message>
Om hierdie fout te vermy, vervang die "<" karakter met 'n entiteitverwysing :
<message>salary < 1000</message>
Daar is 5 vooraf gedefinieerde entiteitsverwysings in XML:
< | < | less than |
> | > | greater than |
& | & | ampersand |
' | ' | apostrophe |
" | " | quotation mark |
Slegs < en & is streng onwettig in XML, maar dit is 'n goeie gewoonte om > te vervang met > ook.
Kommentaar in XML
Die sintaksis vir die skryf van opmerkings in XML is soortgelyk aan dié van HTML:
<!-- This is a comment -->
Twee strepies in die middel van 'n opmerking word nie toegelaat nie:
<!-- This is an invalid -- comment -->
Witspasie word in XML bewaar
XML kap nie veelvuldige witspasies af nie (HTML kap verskeie witspasies af tot een enkele witspasie):
XML: | Hello Tove |
HTML: | Hello Tove |
XML stoor nuwe lyn as LF
Windows-toepassings stoor 'n nuwe lyn as: koetretoer en lyntoevoer (CR+LF).
Unix en Mac OSX gebruik LF.
Ou Mac-stelsels gebruik CR.
XML stoor 'n nuwe reël as LF.
Goed gevormde XML
Daar word gesê dat XML-dokumente wat aan die sintaksisreëls hierbo voldoen, "Goed gevormde" XML-dokumente is.