Allgemein
Quivira 3.2 enthält 7.535 Zeichen aus zahlreichen Unicode-Blöcken. Die meisten davon funktionieren problemlos, aber es können unter Umständen Probleme mit Zeichen mit höheren Codepoints als 65,535 und kombinierenden Zeichen auftreten.
Die Bedeutung und die Namen der einzelnen Zeichen sind im Unicode Standard definiert. Zeichen, die Sie nicht direkt eintippen können, können Sie mithilfe einer Zeichentabelle einfügen, z.B. mit derjenigen, die mit Microsoft Windows mitgeliefert wird (»Start« → »Programme« → »Zubehör« → »Systemprogramme« → »Zeichentabelle«). Office-Programme bieten üblicherweise Dialoge zum Einfügen von Sonderzeichen an. Allerdings zeigen diese Dialoge nicht immer alle Zeichen, auch wenn die Programme sie richtig darstellen können. Falls Sie Microsoft Windows verwenden, empfehle ich die BabelMap als Zeichentabelle, die nicht nur alle Zeichen anzeigt, sondern auch deren Namen und Eigenschaften.
Unterstützte Unicode-Blöcke
Die folgenden Unicode-Blöcke werden unterstützt:
- Basic Latin (00000 – 0007F)
- Vollständig (95 Zeichen)
- Latin-1 Supplement (00080 – 000FF)
- Vollständig (96 Zeichen)
- Latin Extended-A (00100 – 0017F)
- Vollständig (128 Zeichen)
- Latin Extended-B (00180 – 0024F)
- Vollständig (208 Zeichen)
- IPA Extensions (00250 – 002AF)
- Vollständig (96 Zeichen)
- Spacing Modifier Letters (002B0 – 002FF)
- Vollständig (80 Zeichen)
- Combining Diacritical Marks (00300 – 0036F)
- Vollständig (111 Zeichen)
- Alle Zeichen sind kombinierende Zeichen und werden eventuell nicht korrekt platziert.
- Greek and Coptic (00370 – 003FF)
- Vollständig (134 Zeichen)
- Cyrillic (00400 – 004FF)
- Vollständig (256 Zeichen)
- Enthält 7 kombinierende Zeichen, die eventuell nicht korrekt platziert werden.
- Cyrillic Supplement (00500 – 00520)
- Vollständig (38 Zeichen)
- Armenian (00530 – 0058F)
- Vollständig (86 Zeichen)
- Hebrew (00590 – 005FF)
- Vollständig (87 Zeichen)
- Enthält 51 kombinierende Zeichen, die eventuell nicht korrekt platziert werden.
- Thai (00E00 – 00E7F)
- Vollständig (87 Zeichen)
- Enthält 16 kombinierende Zeichen, die eventuell nicht korrekt platziert werden.
- Georgian (010A0 – 010FF)
- Vollständig (83 Zeichen)
- Cherokee (013A0 – 013FF)
- Vollständig (85 Zeichen)
- Ogham (01680 – 0169F)
- Vollständig (29 Zeichen)
- Runic (016A0 – 016FF)
- Vollständig (81 Zeichen)
- Tagalog (01700 – 0171F)
- Vollständig (20 Zeichen)
- Enthält 3 kombinierende Zeichen, die eventuell nicht korrekt platziert werden.
- Hanunoo (01720 – 0173F)
- Vollständig (23 Zeichen)
- Enthält 3 kombinierende Zeichen, die eventuell nicht korrekt platziert werden.
- Buhid (01740 – 0175F)
- Vollständig (20 Zeichen)
- Enthält 2 kombinierende Zeichen, die eventuell nicht korrekt platziert werden.
- Tagbanwa (01760 – 0177F)
- Vollständig (18 Zeichen)
- Enthält 2 kombinierende Zeichen, die eventuell nicht korrekt platziert werden.
- Phonetic Extensions (01D00 – 01D7F)
- Vollständig (128 Zeichen)
- Phonetic Extensions Supplement (01D80 – 01DBF)
- Vollständig (64 Zeichen)
- Latin Extended Additional (01E00 – 01EFF)
- Vollständig (256 Zeichen)
- Greek Extended (01F00 – 01FFF)
- Vollständig (233 Zeichen)
- General Punctuation (02000 – 0206F)
- Vollständig (85 Zeichen)
- Superscripts and Subscripts (02070 – 0209F)
- Vollständig (34 Zeichen)
- Currency Symbols (020A0 – 020CF)
- Vollständig (25 Zeichen)
- Letterlike Symbols (02100 – 0214F)
- Vollständig (80 Zeichen)
- Number Forms (02150 – 0218F)
- Vollständig (58 Zeichen)
- Arrows (02190 – 021FF)
- Vollständig (112 Zeichen)
- Mathematical Operators (02200 – 022FF)
- Vollständig (256 Zeichen)
- Miscellanous Technical (02300 – 023FF)
- Vollständig (233 Zeichen)
- Control Pictures (02400 – 0243F)
- Vollständig (39 Zeichen)
- Optical Character Recognition (02440 – 0245F)
- Vollständig (11 Zeichen)
- Enclosed Alphanumerics (02460 – 024FF)
- Vollständig (160 Zeichen)
- Box Drawing (02500 – 0257F)
- Vollständig (128 Zeichen)
- Block Elements (02580 – 0259F)
- Vollständig (32 Zeichen)
- Geometric Shapes (025A0 – 025FF)
- Vollständig (96 Zeichen)
- Miscellanous Symbols (02600 – 026FF)
- 147 Zeichen (von 250)
- Dingbats (02700 – 027BF)
- 117 Zeichen (von 175)
- Miscellanous Mathematical Symbols-A (027C0 – 027EF)
- Vollständig (44 Zeichen)
- Supplemental Arrows-A (027F0 – 027FF)
- Vollständig (16 Zeichen)
- Braille Patterns (02800 – 028FF)
- Vollständig (256 Zeichen)
- Supplemental Arrows-B (02900 – 0297F)
- Vollständig (128 characters)
- Miscellanous Mathematical Symbols-B (02980 – 029FF)
- Vollständig (128 Zeichen)
- Supplemental Mathematical Operators (02A00 – 02AFF)
- Vollständig (256 Zeichen)
- Miscellanous Symbols and Arrows (02B00 – 02BFF)
- Vollständig (87 Zeichen)
- Latin Extended-C (02C60 – 02C7F)
- Vollständig (32 Zeichen)
- Coptic (02C80 – 02CFF)
- Vollständig (121 Zeichen)
- Enthält 3 kombinierende Zeichen, die eventuell nicht korrekt platziert werden.
- Georgian Supplement (02D00 – 02D2F)
- Vollständig (38 Zeichen)
- Tifinagh (02D30 – 02D7F)
- Vollständig (55 Zeichen)
- Cyrillic Extended-A (02DE0 – 02DFF)
- Vollständig (32 Zeichen)
- Alle Zeichen sind kombinierende Zeichen und werden eventuell nicht korrekt platziert.
- Ideographic Description Characters (02FF0 – 02FFF)
- Vollständig (12 Zeichen)
- Enclosed CJK Letters and Months (03200 – 032FF)
- 30 Zeichen (von 254)
- Enthält nur die eingekreisten Zahlen von 21 bis 50
- Yijing Hexagram Symbols (04DC0 – 04DFF)
- Vollständig (64 Zeichen)
- Lisu (0A4D0 – 0A4FF)
- Vollständig (48 Zeichen)
- Cyrillic Extended-B (0A640 – 0A69F)
- Vollständig (78 Zeichen)
- Enthält 6 kombinierende Zeichen, die eventuell nicht korrekt platziert werden.
- Modifier Tone Letters (0A700 – 0A71F)
- Vollständig (32 Zeichen)
- Latin Extended-D (0A720 – 0A7FF)
- Vollständig (114 Zeichen)
- Private Use Area (0E000 – 0F8FF)
- 449 Zeichen
- Diese Zeichen sind nicht im Unicode Standard definiert, siehe unten.
- Alphabetic Presentation Forms (0FB00 – 0FB4F)
- Vollständig (58 Zeichen)
- Halfwidth and Fullwidth Forms (0FF00 – 0FFEF)
- 110 Zeichen (von 225)
- Diese Zeichen sind Varianten der Zeichen im Basic-Latin-Block mit fester Breite und werden in Verbindung mit ostasiatischen Ideographen verwendet.¹
- Specials (0FFF0 – 0FFFF)
- Vollständig (2 Zeichen)
- Ancient Greek Numbers (10140 – 1018F)
- Vollständig (75 Zeichen)
- Ancient Symbols (10190 – 101CF)
- Vollständig (12 Zeichen)
- Lycian (10280 – 1029F)
- Vollständig (29 Zeichen)
- Carian (102A0 – 102DF)
- Vollständig (49 Zeichen)
- Old Italic (10300 – 1032F)
- Vollständig (35 Zeichen)
- Gothic (10330 – 1034F)
- Vollständig (27 Zeichen)
- Lydian (10920 – 1093F)
- Vollständig (27 Zeichen)
- Musical Symbols (1D100 – 1D1FF)
- 83 Zeichen (von 220)
- Ancient Greek Musical Notation (1D200 – 1D24F)
- Vollständig (70 Zeichen)
- Tai Xuan Jing Symbols (1D300 – 1D35F)
- Vollständig (87 Zeichen)
- Mathematical Alphanumeric Symbols (1D400 – 1D7FF)
- 596 Zeichen (von 996)
- Domino Tiles (1F030 – 1F09F)
- Vollständig (100 Zeichen)
¹ Da Quivira keine Han-Ideographen enthält, sind die Zeichen im Block »Halfwidth and Fullwidth Forms« relativ nutzlos. Sie sind nur enthalten, da sie intern zur Zusammensetzung der Control Characters verwendet werden.
Private Use Area
Quivira 3.2 enthält 449 Zeichen in dem Unicode-Block »Private Use Area«. Diese Zeichen haben generische Namen wie z.B. »PRIVATE USE CHARACTER-E000« (der letzte Teil nach dem Bindestrich ist der Codepoint in Hexadezimalschreibweise) und die Zeichenklasse »Co [Other, Private Use]«.
Die Private Use Area ist in selbstdefinierte Blöcke unterteilt, und die einzelnen Zeichen haben Namen, analog zu den standardisierten Zeichen. Diese Blöcke und Namen sind eigene Erfindungen und werden nur in der Dokumentation zu Quivira verwendet, um zu zeigen, wofür diese Zeichen gedacht sind. Sie gehören zu keinem Standard (wie z.B. Unicode) und werden von keinem Programm verwendet oder angezeigt (stattdessen werden die oben genannten Unicode-Namen verwendet).
Aus dem selben Grund haben diese Zeichen keine definierten Eigenschaften, d.h. verarbeitende Programme wissen nicht, ob sie Buchstaben oder Symbole darstellen etc. Die Umwandlung von Groß- in Kleinbuchstaben und umgekehrt funktioniert nicht. Die Rechtschreibprüfung erkennt sie nicht als Buchstaben, sondern wird sie als Symbole betrachten und ignorieren. Wenn Sie bei einem vorhandenen Dokument die Schriftart ändern, werden sie nicht mehr korrekt angezeigt, da die andere Schriftart die selben Codepoints u.U. für völlig andere Zeichen verwendet (oder auch überhaupt nicht).
In Unicode wird ein einmal aufgenommes Zeichen niemals geändert oder entfernt. Die Private Use Area in Quivira ist allerdings nicht ganz so stabil: Wenn ein Zeichen aus der Private Use Area in den Unicode-Standard aufgenommen wird, wird es auf seinen neuen standardisierten Codepoint verschoben. Aus diesem Grund enthält die Private Use Area nur Zeichen, die eher schlechte Chancen haben, von Unicode akzeptiert zu werden.
In der PDF-Datei Liste der Zeichen in der Private Use Area finden Sie die detaillierten Beschreibungen der einzelnen Zeichen (auf Englisch).
Zukünftige Entwicklung
Die Weiterentwicklung Quiviras ist nicht abgeschlossen, aber da ich dies nur als Hobby betreibe, erscheinen neue Versionen in sehr unregelmäßigen Zeitabständen. Ich kann nicht vorhersagen, wann die nächste Version fertig sein wird.
Über die Zeichen, die in der jeweils nächsten Version aufgenommen werden, wird spontan entschieden, d.h. es gibt keine Roadmap für zukünftige Versionen. Falls Sie ein bestimmtes Zeichen oder ein bestimmtes Script benötigen, kontaktieren Sie mich, und ich werde versuchen, diese in der nächstmöglichen Version einzubauen (dies kann allerdings einige Monate dauern).
Bitte beachten Sie, daß es einige Arten von Zeichen gibt, die auch auf Anfrage nicht hinzugefügt werden. Dies betrifft:
- Zeichen, die dem Unicode-Standard widersprechen, z.B. Varianten vorhandener Buchstaben. Wenn Sie Variationen in Ihren Dokumenten wünschen, verwenden Sie verschiedene Schriftarten, aber verwirren Sie nicht die Rechtschreibprüfung durch unnötige Private-Use-Zeichen.
- Zeichen, die sich in der Unicode Pipeline Table (Proposed New Characters) für die Aufnahme in Unicode befinden. Ich kann diesen noch nicht den zukünftigen Codepoint zuweisen, da er sich eventuell noch ändern kann. Ebenso möchte ich sie nicht in die Private Use Area aufnehmen, da sie sonst bald verschoben werden müßten, wodurch entweder Duplikate entstünden oder existierende Dokumente zerstört werden.
- Zeichen, die technisch unmöglich sind. In TrueType-Schriftarten können Zeichen keine Farben haben, nicht animiert sein und nicht aus der Zeile herausragen.
- Zeichen, die zu nicht vorhandenen Schriften gehören. Beispielsweise wäre es sinnlos, ein seltenes chinesisches Zeichen hinzuzufügen, ohne die üblicheren zu haben.
Quivira soll so viele Schriften und Sprachen wie möglich unterstützen, aber es gibt Einschränkungen. Das erste Problem ist die Anzahl der im Unicode-Standard definierten Zeichen, da eine einzelne Schrift nicht so viele Zeichen enthalten kann. Aus diesem Grund enthält Quivira keine Han-Ideographen (das sind mehr Zeichen als alle anderen zusammen).
Die zweite Einschränkung ergibt sich aus technischen Schwierigkeiten: Für einige Zeichen könnte ich zwar entsprechende Glyphen aufnehmen, aber ein Text, der sie enthält, würde trotzdem nicht korrekt gerendert werden. Dieses Problem betrifft generell die kombinierenden Zeichen sowie komplexe Schriften wie z.B. die meisten indischen und südostasiatischen Schriften. Es betrifft ebenso Buchstaben, die ihre Form in Abhängigkeit von den umgebenden Buchstaben verändern, wie z.B. im Arabischen (dies ist der Grund, warum die arabische Schrift bisher nicht unterstützt wird, trotz ihrer Bedeutsamkeit).
Diese Probleme können wahrscheinlich gelöst werden, indem Quivira in das OpenType-Format konvertiert wird. Allerdings traten bei meinen bisherigen Versuchen diverse Probleme auf, die einige vorhandene Zeichen unbenutzbar machten. Ich bin überzeugt, irgendwann eine gute Lösung zu finden, aber derzeit ist keine in Sicht.

English
Social Bookmarks