HTML -kodering (karakterstelle)
Om 'n HTML-bladsy korrek te vertoon, moet 'n webblaaier weet watter karakterstel om te gebruik.
Van ASCII na UTF-8
ASCII was die eerste karakterkoderingstandaard. ASCII het 128 verskillende karakters gedefinieer wat op die internet gebruik kan word: syfers (0-9), Engelse letters (AZ) en 'n paar spesiale karakters soos ! $ + - ( ) @ < > .
ISO-8859-1 was die verstekkarakterstel vir HTML 4. Hierdie karakterstel het 256 verskillende karakterkodes ondersteun. HTML 4 ondersteun ook UTF-8.
ANSI (Windows-1252) was die oorspronklike Windows-karakterstel. ANSI is identies aan ISO-8859-1, behalwe dat ANSI 32 ekstra karakters het.
Die HTML5-spesifikasie moedig webontwikkelaars aan om die UTF-8-karakterstel te gebruik, wat byna al die karakters en simbole in die wêreld dek!
Die HTML-karaktersetkenmerk
Om 'n HTML-bladsy korrek te vertoon, moet 'n webblaaier die karakterstel ken wat in die bladsy gebruik word.
Dit word in die <meta>
merker gespesifiseer:
<meta charset="UTF-8">
Verskille tussen karakterstelle
Die volgende tabel toon die verskille tussen die karakterstelle hierbo beskryf:
Verdoof | ASCII | ANSI | 8859 | UTF-8 | Beskrywing |
---|---|---|---|---|---|
32 | spasie | ||||
33 | ! | ! | ! | ! | uitroepteken |
34 | " | " | " | " | vraagteken |
35 | # | # | # | # | nommer teken |
36 | $ | $ | $ | $ | dollar teken |
37 | % | % | % | % | persent teken |
38 | & | & | & | & | ampersand |
39 | ' | ' | ' | ' | apostrof |
40 | ( | ( | ( | ( | linkerhakies |
41 | ) | ) | ) | ) | regter hakies |
42 | * | * | * | * | asterisk |
43 | + | + | + | + | meer teken |
44 | , | , | , | , | komma |
45 | - | - | - | - | koppelteken-minus |
46 | . | . | . | . | punt |
47 | / | / | / | / | solidus |
48 | 0 | 0 | 0 | 0 | syfer nul |
49 | 1 | 1 | 1 | 1 | syfer een |
50 | 2 | 2 | 2 | 2 | syfer twee |
51 | 3 | 3 | 3 | 3 | syfer drie |
52 | 4 | 4 | 4 | 4 | syfer vier |
53 | 5 | 5 | 5 | 5 | syfer vyf |
54 | 6 | 6 | 6 | 6 | syfer ses |
55 | 7 | 7 | 7 | 7 | syfer sewe |
56 | 8 | 8 | 8 | 8 | syfer agt |
57 | 9 | 9 | 9 | 9 | syfer nege |
58 | : | : | : | : | kolon |
59 | ; | ; | ; | ; | kommapunt |
60 | < | < | < | < | minder-as-teken |
61 | = | = | = | = | gelyke teken |
62 | > | > | > | > | groter-as-teken |
63 | ? | ? | ? | ? | vraagteken |
64 | @ | @ | @ | @ | kommersiële by |
65 | A | A | A | A | Latynse hoofletter A |
66 | B | B | B | B | Latynse hoofletter B |
67 | C | C | C | C | Latynse hoofletter C |
68 | D | D | D | D | Latynse hoofletter D |
69 | E | E | E | E | Latynse hoofletter E |
70 | F | F | F | F | Latynse hoofletter F |
71 | G | G | G | G | Latynse hoofletter G |
72 | H | H | H | H | Latynse hoofletter H |
73 | ek | ek | ek | ek | Latynse hoofletter I |
74 | J | J | J | J | Latynse hoofletter J |
75 | K | K | K | K | Latynse hoofletter K |
76 | L | L | L | L | Latynse hoofletter L |
77 | M | M | M | M | Latynse hoofletter M |
78 | N | N | N | N | Latynse hoofletter N |
79 | DIE | DIE | DIE | DIE | Latynse hoofletter O |
80 | P | P | P | P | Latynse hoofletter P |
81 | V | V | V | V | Latynse hoofletter Q |
82 | R | R | R | R | Latynse hoofletter R |
83 | S | S | S | S | Latynse hoofletter S |
84 | T | T | T | T | Latynse hoofletter T |
85 | U | U | U | U | Latynse hoofletter U |
86 | V | V | V | V | Latynse hoofletter V |
87 | W | W | W | W | Latynse hoofletter W |
88 | X | X | X | X | Latynse hoofletter X |
89 | Y | Y | Y | Y | Latynse hoofletter Y |
90 | MET | MET | MET | MET | Latynse hoofletter Z |
91 | [ | [ | [ | [ | linker vierkantige hakie |
92 | \ | \ | \ | \ | omgekeerde solidus |
93 | ] | ] | ] | ] | regter vierkantige hakie |
94 | ^ | ^ | ^ | ^ | circumflex aksent |
95 | _ | _ | _ | _ | lae lyn |
96 | ` | ` | ` | ` | ernstige aksent |
97 | a | a | a | a | Latynse kleinletter a |
98 | b | b | b | b | Latynse kleinletter b |
99 | c | c | c | c | Latynse kleinletter c |
100 | d | d | d | d | Latynse kleinletter d |
101 | e | e | e | e | Latynse kleinletter e |
102 | f | f | f | f | Latynse kleinletter f |
103 | g | g | g | g | Latynse kleinletter g |
104 | h | h | h | h | Latynse kleinletter h |
105 | i | i | i | i | Latynse kleinletter i |
106 | j | j | j | j | Latynse kleinletter j |
107 | k | k | k | k | Latynse kleinletter k |
108 | l | l | l | l | Latynse kleinletter l |
109 | m | m | m | m | Latynse kleinletter m |
110 | n | n | n | n | Latynse kleinletter n |
111 | Die | Die | Die | Die | Latynse kleinletter o |
112 | bl | bl | bl | bl | Latynse kleinletter bl |
113 | q | q | q | q | Latynse kleinletter q |
114 | r | r | r | r | Latynse kleinletter r |
115 | s | s | s | s | Latynse kleinletter s |
116 | t | t | t | t | Latynse kleinletter t |
117 | u | u | u | u | Latynse kleinletter u |
118 | v | v | v | v | Latynse kleinletter v |
119 | w | w | w | w | Latynse kleinletter w |
120 | x | x | x | x | Latynse kleinletter x |
121 | Y | Y | Y | Y | Latynse kleinletter y |
122 | met | met | met | met | Latynse kleinletter z |
123 | { | { | { | { | linker krullerige hakie |
124 | | | | | | | | | vertikale lyn |
125 | } | } | } | } | regter krullerige hakie |
126 | ~ | ~ | ~ | ~ | tilde |
127 | VAN | ||||
128 | € | euro teken | |||
129 | | | | NIE GEBRUIK NIE | |
130 | ‚ | enkele lae-9 aanhalingsteken | |||
131 | ƒ | Latynse kleinletter f met haak | |||
132 | „ | dubbele lae-9 aanhalingsteken | |||
133 | … | horisontale ellips | |||
134 | † | dolk | |||
135 | ‡ | dubbele dolk | |||
136 | ˆ | wysiger letter circumflex aksent | |||
137 | ‰ | vir 'n duisend teken | |||
138 | Š | Latynse hoofletter S met karon | |||
139 | ‹ | enkele links-wysende hoek aanhalingsteken | |||
140 | Œ | Latynse hoofletter ligatuur OE | |||
141 | | | | NIE GEBRUIK NIE | |
142 | Z | Latynse hoofletter Z met karon | |||
143 | | | | NIE GEBRUIK NIE | |
144 | | | | NIE GEBRUIK NIE | |
145 | ' | linker enkele aanhalingsteken | |||
146 | ' | regter enkele aanhalingsteken | |||
147 | “ | linker dubbele aanhalingsteken | |||
148 | ” | regter dubbele aanhalingsteken | |||
149 | • | koeël | |||
150 | – | en strepie | |||
151 | — | jy stamp | |||
152 | ˜ | klein tilde | |||
153 | ™ | handelsmerk teken | |||
154 | š | Latynse kleinletter s met karon | |||
155 | › | enkele regswysende hoek aanhalingsteken | |||
156 | œ | Latynse klein ligatuur oe | |||
157 | | | | NIE GEBRUIK NIE | |
158 | Z | Latynse klein letter z met caron | |||
159 | Ÿ | Latynse hoofletter Y met diaeresis | |||
160 | geen-breek spasie | ||||
161 | ¡ | ¡ | ¡ | omgekeerde uitroepteken | |
162 | ¢ | ¢ | ¢ | sent teken | |
163 | £ | £ | £ | pond teken | |
164 | ¤ | ¤ | ¤ | geldeenheid teken | |
165 | ¥ | ¥ | ¥ | jen teken | |
166 | ¦ | ¦ | ¦ | gebreekte staaf | |
167 | § | § | § | afdeling teken | |
168 | ¨ | ¨ | ¨ | diaeresis | |
169 | © | © | © | kopiereg teken | |
170 | ª | ª | ª | vroulike ordinale aanwyser | |
171 | « | « | « | links wysende dubbelhoek aanhalingsteken | |
172 | ¬ | ¬ | ¬ | teken nie | |
173 | | | | sagte koppelteken | |
174 | ® | ® | ® | geregistreerde teken | |
175 | ¯ | ¯ | ¯ | makron | |
176 | ° | ° | ° | graad teken | |
177 | ± | ± | ± | plus-minus teken | |
178 | ² | ² | ² | boskrif twee | |
179 | ³ | ³ | ³ | boskrif drie | |
180 | ´ | ´ | ´ | akute aksent | |
181 | µ | µ | µ | mikro teken | |
182 | ¶ | ¶ | ¶ | pilkraai teken | |
183 | · | · | · | middelste kolletjie | |
184 | ¸ | ¸ | ¸ | cedilla | |
185 | ¹ | ¹ | ¹ | boskrif een | |
186 | º | º | º | manlike ordinale aanwyser | |
187 | » | » | » | regswysende dubbelhoek-aanhalingsteken | |
188 | ¼ | ¼ | ¼ | vulgêre breuk een kwart | |
189 | ½ | ½ | ½ | vulgêre breuk een helfte | |
190 | ¾ | ¾ | ¾ | vulgêre breuk driekwart | |
191 | ¿ | ¿ | ¿ | omgekeerde vraagteken | |
192 | BY | BY | BY | Latynse hoofletter A met graf | |
193 | Á | Á | Á | Latynse hoofletter A met akuut | |
194 | Â | Â | Â | Latynse hoofletter A met circumflex | |
195 | Ã | Ã | Ã | Latynse hoofletter A met tilde | |
196 | Ä | Ä | Ä | Latynse hoofletter A met diaeresis | |
197 | O | O | O | Latynse hoofletter A met ring bo | |
198 | Æ | Æ | Æ | Latynse hoofletter AE | |
199 | Ç | Ç | Ç | Latynse hoofletter C met cedilla | |
200 | IS | IS | IS | Latynse hoofletter E met graf | |
201 | DIS | DIS | DIS | Latynse hoofletter E met akuut | |
202 | Ê | Ê | Ê | Latynse hoofletter E met circumflex | |
203 | E | E | E | Latynse hoofletter E met diaeresis | |
204 | Ì | Ì | Ì | Latynse hoofletter I met graf | |
205 | Í | Í | Í | Latynse hoofletter I met akuut | |
206 | Î | Î | Î | Latynse hoofletter I met circumflex | |
207 | Ï | Ï | Ï | Latynse hoofletter I met diaeresis | |
208 | Ð | Ð | Ð | Latynse hoofletter Eth | |
209 | Ñ | Ñ | Ñ | Latynse hoofletter N met tilde | |
210 | Ò | Ò | Ò | Latynse hoofletter O met graf | |
211 | O | O | O | Latynse hoofletter O met akuut | |
212 | SAMBREL | SAMBREL | SAMBREL | Latynse hoofletter O met circumflex | |
213 | Õ | Õ | Õ | Latynse hoofletter O met tilde | |
214 | Ö | Ö | Ö | Latynse hoofletter O met diaeresis | |
215 | × | × | × | vermenigvuldigingsteken | |
216 | Ø | Ø | Ø | Latynse hoofletter O met streep | |
217 | Ù | Ù | Ù | Latynse hoofletter U met graf | |
218 | Ú | Ú | Ú | Latynse hoofletter U met akuut | |
219 | Û | Û | Û | Latynse hoofletter U met circumflex | |
220 | Ü | Ü | Ü | Latynse hoofletter U met diaeresis | |
221 | IDEE | IDEE | IDEE | Latynse hoofletter Y met akuut | |
222 | Þ | Þ | Þ | Latynse hoofletter Thorn | |
223 | ß | ß | ß | Latynse kleinletter skerp s | |
224 | by | by | by | Latynse kleinletter a met graf | |
225 | á | á | á | Latynse kleinletter a met akuut | |
226 | â | â | â | Latynse kleinletter a met circumflex | |
227 | ã | ã | ã | Latynse kleinletter a met tilde | |
228 | ä | ä | ä | Latynse kleinletter a met diaeresis | |
229 | å | å | å | Latynse kleinletter a met ring bo | |
230 | æ | æ | æ | Latynse kleinletter ae | |
231 | ç | ç | ç | Latynse klein letter c met cedilla | |
232 | is | is | is | Latynse klein letter e met graf | |
233 | Dit is | Dit is | Dit is | Latynse klein letter e met akuut | |
234 | ê | ê | ê | Latynse klein letter e met circumflex | |
235 | e | e | e | Latynse kleinletter e met diaeresis | |
236 | ì | ì | ì | Latynse klein letter i met graf | |
237 | í | í | í | Latynse klein letter i met akuut | |
238 | î | î | î | Latynse klein letter i met circumflex | |
239 | ï | ï | ï | Latynse klein letter i met diaeresis | |
240 | ð | ð | ð | Latynse kleinletter eth | |
241 | ñ | ñ | ñ | Latynse kleinletter n met tilde | |
242 | ò | ò | ò | Latynse kleinletter o met graf | |
243 | o | o | o | Latynse klein letter o met akuut | |
244 | Sambreel | Sambreel | Sambreel | Latynse kleinletter o met circumflex | |
245 | õ | õ | õ | Latynse kleinletter o met tilde | |
246 | ö | ö | ö | Latynse kleinletter o met diaeresis | |
247 | ÷ | ÷ | ÷ | verdeling teken | |
248 | ø | ø | ø | Latynse kleinletter o met streep | |
249 | ù | ù | ù | Latynse kleinletter u met graf | |
250 | ú | ú | ú | Latynse kleinletter u met akuut | |
251 | en | en | en | Latynse kleinletter met circumflex | |
252 | ü | ü | ü | Latynse kleinletter u met diaeresis | |
253 | idee | idee | idee | Latynse klein letter y met akuut | |
254 | þ | þ | þ | Latynse kleinletterdoring | |
255 | ÿ | ÿ | ÿ | Latynse kleinletter y met diaeresis |
Die ASCII-karakterstel
ASCII gebruik die waardes van 0 tot 31 (en 127) vir beheerkarakters.
ASCII gebruik die waardes van 32 tot 126 vir letters, syfers en simbole.
ASCII gebruik nie die waardes van 128 tot 255 nie.
Die ANSI-karakterstel (Windows-1252)
ANSI is identies aan ASCII vir die waardes van 0 tot 127.
ANSI het 'n eie stel karakters vir die waardes van 128 tot 159.
ANSI is identies aan UTF-8 vir die waardes van 160 tot 255.
Die ISO-8859-1 karakterstel
ISO-8859-1 is identies aan ASCII vir die waardes van 0 tot 127.
ISO-8859-1 gebruik nie die waardes van 128 tot 159 nie.
ISO-8859-1 is identies aan UTF-8 vir die waardes van 160 tot 255.
Die UTF-8 karakterstel
UTF-8 is identies aan ASCII vir die waardes van 0 tot 127.
UTF-8 gebruik nie die waardes van 128 tot 159 nie.
UTF-8 is identies aan beide ANSI en 8859-1 vir die waardes van 160 tot 255.
UTF-8 gaan voort vanaf die waarde 256 met meer as 10 000 verskillende karakters.
Vir 'n nader kyk, bestudeer ons volledige HTML-karakterverwysing .