c't 7/2024
S. 130
Wissen
Unicode-Erweiterungen
Bild: ChatGPT, Dall-E

Babylon 16

Neuerungen in Unicode 16: Hieroglyphen und Audio

Seit über 30 Jahren ermöglicht der Unicode-Standard den Austausch von Textdokumenten über alle Sprachen dieser Welt hinweg. Etwa einmal im Jahr gibt es ein Update mit weiteren Zeichen für exotische Sprachen und meist auch ein paar neuen Emoji. Über die diesjährigen Neuerungen freuen sich vor allem Ägyptologen, aber auch für Programmierer ist etwas dabei.

Von Dr. Harald Bögeholz

Was war das für ein Chaos in den 80er-Jahren, als der 7-bittige ASCII-Code mit dem IBM PC auf 8 Bit aufgebohrt wurde, wenige Jahre später aber umschaltbare „Code Pages“ den oberen 128 Zeichencodes unterschiedliche Bedeutungen gaben. Ältere erinnern sich vielleicht, dass man beim Nadeldrucker per DIP-Schalter einstellen konnte, ob die Zeichencodes von 91 bis 93 und 123 bis 126 als „[\]{|}~“ oder als „ÄÖÜäöüß“ gedruckt werden.

Damit sollte der Unicode-Standard endgültig aufräumen, der im Jahr 1991 in Version 1.0 erschien. Er ordnete den Schriftzeichen für zunächst 24 verschiedene Schriftsysteme ein für alle Mal feste Codes zu, zunächst 7161 Zeichen. Wenig später kam ein Riesen-Batzen CJK-Ideogramme (Chinesisch, Japanisch, Koreanisch) hinzu und der heute gültige Unicode-Standard 15.1 umfasst 149.813 Zeichen aus 161 Schriftsystemen.

Kommentare lesen (11 Beiträge)