homedukeOOP mit Java: Der Unicode-Zeichensatz Prof. Dr. Uwe Schmidt FH Wedel

Der Unicode-Zeichensatz

weiter

weiter

Unicode

Zeichen mit 16 Bit
Unicode ist eine Obermenge des ASCII Zeichensatzes
Nationale Zeichensätze
für Umlaute, Akzente, arabische, japanische, ..., Schriften
Bezeichner
dürfen außer bestimmten Sonderzeichen beliebige Unicode-Zeichen, also auch Umlaute enthalten
Maskierungs-Sequenz
escape-Sequenz
 
\uHHHH eine 4-stellige Hexadezimalzahl
UTF-8-Codierung
effiziente, platzsparende Speicherung
 
\u0001 - \u007F    1 byte
\u0080 - \u07FF    2 byte
\u0800 - \uFFFF    3 byte
Ein- und Ausgabe
in Stream-Klassen definiert:
Text
Binärdaten

Letzte Änderung: 14.02.2012
© Prof. Dr. Uwe Schmidt
Prof. Dr. Uwe Schmidt FH Wedel