Fazit

 

Eine Zeichenkodierung, die von aller Hard- und Software gelesen werden kann,
ist notwendige Voraussetzung für medienneutrale Datenhaltung. Zwei Lösungen sind derzeit verfügbar:

  • ISO 8879):
    • Beschränkung auf die 128 Zeichen, die in allen Betriebssystemen und
      Programmen gleich kodiert sind (ASCII.
    • Alle anderen Zeichen werden durch besonders gekennzeichnete Zeichen-
      Kombinationen kodiert (sog. entities; z. B. »ä« als ä für »a-umlaut«).
    • Da ISO-Entities Teil des SGML-Standards sind, können sie nur von
      entsprechender Software (
      SGML/XML/HTML-Programme) verarbeitet werden. Office-Software beherrscht diesen Standard meist nicht.
    • ISO-Entities werden wegen ihrer Zuverlässigkeit und
      unbegrenzten Abwärtskompatibilität gerade im professionellen Umfeld
      noch immer häufig verwendet.
  • Unicode (ISO 10646):
    • Ein neuer Standard, mit dem derzeit ca. 65 500 Zeichen-
      adressen eindeutig kodiert werden können.
    • Die softwareseitige Umsetzung dieses Standards leidet
      noch an Kinderkrankheiten.
    • Universalität und zunehmende Verbreitung lassen die Prognose zu,
      dass Unicode die Zukunft gehört.
    • Derzeit ist Unicode in der Version 2.0 (= ISO 10646-1)
      im Encoding UTF-8 zuverlässig verwendbar.