Zeichen mit 16 Bit |
Unicode ist eine Obermenge des ASCII Zeichensatzes
|
Nationale Zeichensätze |
für Umlaute, Akzente, arabische, japanische, ..., Schriften
|
Bezeichner |
dürfen außer bestimmten Sonderzeichen
beliebige Unicode-Zeichen, also auch Umlaute enthalten
|
Maskierungs-Sequenz |
escape-Sequenz
|
|
\uHHHH eine 4-stellige Hexadezimalzahl
|
UTF-8-Codierung |
effiziente, platzsparende Speicherung
|
|
\u0001 - \u007F 1 byte
\u0080 - \u07FF 2 byte
\u0800 - \uFFFF 3 byte
|
Ein- und Ausgabe |
in Stream-Klassen definiert:
|
Text |
|
Binärdaten |
|
|