Unicode Informatik?

1 Antwort

Jedes Unicode-Zeichen ist in der Unicode-Tabelle vermerkt. Dein Smiley 🙂 ist Zeichen Nummer 128578, bzw. hexadezimal geschrieben: 1F642.

Jetzt kommt aber noch eine Besonderheit: Das Zeichen wird etwas anders gespeichert... Da kommt die UTF-8 Codierung ins Spiel, sie "verpackt" die Zahl in Häppchen zu je 1 Byte:

1F642 ist Binär die Zahl: 00011111011001000010

UTF-8 codiert Zahlen, die größer als 7 Bit sind nach einem ganz bestimmten System. https://de.wikipedia.org/wiki/UTF-8

Die Zahl wird in 6 Bit-Blöcke aufgeteilt, wobei von hinten begonnen wird:

000 11111 011001 000010

Die Gruppen werden jetzt jeweils zu einem Byte, das erste Byte beginnt mit so vielen 1en, wie es Anzahl an Gruppen gibt, die anderen Gruppen beginnen jeweils mit 10:

11110000 10111111 10011001 10000010

Hex-Dezimal entspricht das: F0 9F 99 82
In dieser Form ist das Zeichen dann auf der Festplatte gespeichert.