Zeichensatz (ASCII, ISO 8859, Unicode)
US-ASCII
7-Bit-Zeichenkodierung; sie entspricht der US-Variante von
ISO 646 und dient als Grundlage für spätere auf mehr
Bits basierende Kodierungen für Zeichensätze.
Die Mutter aller Zeichensätze.
Die druckbaren Zeichen umfassen das lateinische
Alphabet in Groß- und Kleinschreibung, die zehn arabischen Ziffern sowie einige Satzzeichen. Der Zeichenvorrat entspricht weitgehend dem einer
Tastatur oder Schreibmaschine für die englische Sprache. In Computern und anderen elektronischen Geräten, die
Text darstellen, wird dieser in der
Regel gemäß
ASCII oder abwärtskompatibel (
ISO 8859,
Unicode) dazu gespeichert.
Wurde für einen Fernschreiber
1963 entwickelt. Druckbare Zeichen und Steuerzeichen.
Die ISO-8859-Normen werden von
ISO/
IEC nicht mehr aktiv weiterentwickelt. Für die Zukunft wird eine fortschreitende Ablösung dieser Zeichensätze durch ISO
UCS, inhaltsgleich zum Unicode-Standard, erwartet. Dieser findet vor allem in
Form der UTF-8-Kodierung immer mehr Verbreitung.
Eng verwandt sind die jeweils entsprechenden Teilnormen, die sich lediglich durch zusätzliche nicht darstellbare Steuerzeichen an den in ISO 8859 freien Positionen unterscheiden.
UTF-8
UTF-16
UTF-32
Unicode ist ein internationaler
Standard, in dem langfristig für jedes sinntragende Schriftzeichen oder Textelement aller bekannten Schriftkulturen und Zeichensysteme ein digitaler
Code festgelegt wird.
Ziel ist es, die Verwendung unterschiedlicher und inkompatibler Kodierungen in verschiedenen Ländern oder Kulturkreisen zu beseitigen. Unicode wird ständig um Zeichen weiterer Schriftsysteme ergänzt.
ISO 10646 ist die von ISO verwendete, praktisch bedeutungsgleiche Bezeichnung des Unicode-Zeichensatzes; er wird dort als
Universal Character Set (UCS) bezeichnet.