Encoding

Mit Encoding (Zeichenkodierung) wird die Art der Codierung der Zeichen in einem Dokument bezeichnet. Das Encoding bestimmt, welche Bytes der Daten für welches darzustellende Zeichen stehen. Bei XML-Dokumenten ist UTF-8 Standard, in Deutschland sind zudem ISO 8859-1 und (das leider nicht mit ISO 8859-1 identische) Windows-1252 (auch Cp1252) weit verbreitet, einige Bedeutung hat zudem UTF-16.

Eine falsche Deklaration des Encodings im Prolog einer XML-Datei oder ein falsche Interpretation des Parsers bzw. Editors führen zu Darstellungsfehlern (meist verstümmelte Sonderzeichen). Achtung: In diesem Fall darf das Dokument nur in einem Editor mit dem ursprünglichen Encoding korrigiert werden, weil sonst oft unbemerkt Zeichen falsch ersetzt werden. Hier sollte im Prolog das Encoding explizit definiert werden. Ein schlechter Weg für die üblichen Windows-Probleme ist übrigens das Ersetzen durch Numeric Character References aus dem »verbotenen Bereich« zwischen &7F; und &9F; (z.B. – für den Gedankenstrich), besser ist die richtige Definition des Encodings im Prolog und die Ersetzung durch »echte« Unicode-Referenzen (für den Gedankenstrich also –).

Wikipedia: http://de.wikipedia.org/wiki/Zeichenkodierung, http://de.wikipedia.org/wiki/UTF-8, http://de.wikipedia.org/wiki/UTF-16, http://de.wikipedia.org/wiki/ISO_8859-1

siehe auch:

  1. Bisher keine Kommentare.
(wird nicht veröffentlicht)

Time limit is exhausted. Please reload CAPTCHA.