Allgemein
Quivira 4.1 enthält 11.053 Zeichen aus zahlreichen Unicode-Blöcken. Die meisten davon funktionieren problemlos, aber es können unter Umständen Probleme mit Zeichen mit höheren Codepoints als 65,535 und kombinierenden Zeichen auftreten.
Die Bedeutung und die Namen der einzelnen Zeichen sind im Unicode Standard definiert. Zeichen, die Sie nicht direkt eintippen können, können Sie mithilfe einer Zeichentabelle einfügen, z.B. mit derjenigen, die mit Microsoft Windows mitgeliefert wird (»Start« → »Programme« → »Zubehör« → »Systemprogramme« → »Zeichentabelle«). Office-Programme bieten üblicherweise Dialoge zum Einfügen von Sonderzeichen an. Allerdings zeigen diese Dialoge nicht immer alle Zeichen, auch wenn die Programme sie richtig darstellen können. Falls Sie Microsoft Windows verwenden, empfehle ich die BabelMap als Zeichentabelle, die nicht nur alle Zeichen anzeigt, sondern auch deren Namen und Eigenschaften.
Unterstützte Unicode-Blöcke
Die folgenden Unicode-Blöcke werden unterstützt:
- Basic Latin (00000 – 0007F)
- Vollständig (95 Zeichen)
- Latin-1 Supplement (00080 – 000FF)
- Vollständig (96 Zeichen)
- Latin Extended-A (00100 – 0017F)
- Vollständig (128 Zeichen)
- Latin Extended-B (00180 – 0024F)
- Vollständig (208 Zeichen)
- IPA Extensions (00250 – 002AF)
- Vollständig (96 Zeichen)
- Spacing Modifier Letters (002B0 – 002FF)
- Vollständig (80 Zeichen)
- Combining Diacritical Marks (00300 – 0036F)
- Vollständig (111 Zeichen)
- Greek and Coptic (00370 – 003FF)
- Vollständig (135 Zeichen)
- Cyrillic (00400 – 004FF)
- Vollständig (256 Zeichen)
- Cyrillic Supplement (00500 – 00520)
- Vollständig (48 Zeichen)
- Armenian (00530 – 0058F)
- Vollständig (89 Zeichen)
- Hebrew (00590 – 005FF)
- Vollständig (87 Zeichen)
- Samaritan (00800 – 0083F)
- Vollständig (61 Zeichen)
- Thai (00E00 – 00E7F)
- Vollständig (87 Zeichen)
- Georgian (010A0 – 010FF)
- Vollständig (83 Zeichen)
- Cherokee (013A0 – 013FF)
- Vollständig (85 Zeichen)
- Unified Canadian Aboriginal Syllabics (01400 – 0167F)
- Vollständig (640 Zeichen)
- Ogham (01680 – 0169F)
- Vollständig (29 Zeichen)
- Runic (016A0 – 016FF)
- Vollständig (87 Zeichen)
- Tagalog (01700 – 0171F)
- Vollständig (20 Zeichen)
- Hanunoo (01720 – 0173F)
- Vollständig (23 Zeichen)
- Buhid (01740 – 0175F)
- Vollständig (20 Zeichen)
- Tagbanwa (01760 – 0177F)
- Vollständig (18 Zeichen)
- Unified Canadian Aboriginal Syllabics Extended (018B0 – 018FF)
- Vollständig (70 Zeichen)
- Phonetic Extensions (01D00 – 01D7F)
- Vollständig (128 Zeichen)
- Phonetic Extensions Supplement (01D80 – 01DBF)
- Vollständig (64 Zeichen)
- Latin Extended Additional (01E00 – 01EFF)
- Vollständig (256 Zeichen)
- Greek Extended (01F00 – 01FFF)
- Vollständig (233 Zeichen)
- General Punctuation (02000 – 0206F)
- Vollständig (85 Zeichen)
- Superscripts and Subscripts (02070 – 0209F)
- Vollständig (42 Zeichen)
- Currency Symbols (020A0 – 020CF)
- Vollständig (30 Zeichen)
- Letterlike Symbols (02100 – 0214F)
- Vollständig (80 Zeichen)
- Number Forms (02150 – 0218F)
- Vollständig (58 Zeichen)
- Arrows (02190 – 021FF)
- Vollständig (112 Zeichen)
- Mathematical Operators (02200 – 022FF)
- Vollständig (256 Zeichen)
- Miscellaneous Technical (02300 – 023FF)
- Vollständig (251 Zeichen)
- Control Pictures (02400 – 0243F)
- Vollständig (39 Zeichen)
- Optical Character Recognition (02440 – 0245F)
- Vollständig (11 Zeichen)
- Enclosed Alphanumerics (02460 – 024FF)
- Vollständig (160 Zeichen)
- Box Drawing (02500 – 0257F)
- Vollständig (128 Zeichen)
- Block Elements (02580 – 0259F)
- Vollständig (32 Zeichen)
- Geometric Shapes (025A0 – 025FF)
- Vollständig (96 Zeichen)
- Miscellaneous Symbols (02600 – 026FF)
- 220 Zeichen (von 256)
- Dingbats (02700 – 027BF)
- 160 Zeichen (von 192)
- Miscellaneous Mathematical Symbols-A (027C0 – 027EF)
- Vollständig (46 Zeichen)
- Supplemental Arrows-A (027F0 – 027FF)
- Vollständig (16 Zeichen)
- Braille Patterns (02800 – 028FF)
- Vollständig (256 Zeichen)
- Supplemental Arrows-B (02900 – 0297F)
- Vollständig (128 characters)
- Miscellaneous Mathematical Symbols-B (02980 – 029FF)
- Vollständig (128 Zeichen)
- Supplemental Mathematical Operators (02A00 – 02AFF)
- Vollständig (256 Zeichen)
- Miscellaneous Symbols and Arrows (02B00 – 02BFF)
- Vollständig (202 Zeichen)
- Glagolitic (02C00 – 02C5F)
- Vollständig (94 Zeichen)
- Latin Extended-C (02C60 – 02C7F)
- Vollständig (32 Zeichen)
- Coptic (02C80 – 02CFF)
- Vollständig (121 Zeichen)
- Georgian Supplement (02D00 – 02D2F)
- Vollständig (38 Zeichen)
- Tifinagh (02D30 – 02D7F)
- Vollständig (56 Zeichen)
- Cyrillic Extended-A (02DE0 – 02DFF)
- Vollständig (32 Zeichen)
- Supplemental Punctuation (02E00 – 02E7F)
- Vollständig (67 Zeichen)
- Ideographic Description Characters (02FF0 – 02FFF)
- Vollständig (12 Zeichen)
- CJK Symbols and Punctuation (03000 – 0303F)
- 8 Zeichen (von 64)
- Enclosed CJK Letters and Months (03200 – 032FF)
- 39 Zeichen (von 254)
- Yijing Hexagram Symbols (04DC0 – 04DFF)
- Vollständig (64 Zeichen)
- Lisu (0A4D0 – 0A4FF)
- Vollständig (48 Zeichen)
- Vai (0A500 – 0A63F)
- Vollständig (300 Zeichen)
- Cyrillic Extended-B (0A640 – 0A69F)
- Vollständig (95 Zeichen)
- Modifier Tone Letters (0A700 – 0A71F)
- Vollständig (32 Zeichen)
- Latin Extended-D (0A720 – 0A7FF)
- Vollständig (152 Zeichen)
- Private Use Area (0E000 – 0F8FF)
- 888 Zeichen
- Diese Zeichen sind nicht im Unicode Standard definiert, siehe unten.
- Alphabetic Presentation Forms (0FB00 – 0FB4F)
- Vollständig (58 Zeichen)
- Halfwidth and Fullwidth Forms (0FF00 – 0FFEF)
- 110 Zeichen (von 225)
- Diese Zeichen sind Varianten der Zeichen im Basic-Latin-Block mit fester Breite und werden in Verbindung mit ostasiatischen Ideographen verwendet.¹
- Specials (0FFF0 – 0FFFF)
- Vollständig (5 Zeichen)
- Aegean Numbers (10100 – 1013F)
- Vollständig (57 Zeichen)
- Ancient Greek Numbers (10140 – 1018F)
- Vollständig (77 Zeichen)
- Ancient Symbols (10190 – 101CF)
- Vollständig (13 Zeichen)
- Lycian (10280 – 1029F)
- Vollständig (29 Zeichen)
- Carian (102A0 – 102DF)
- Vollständig (49 Zeichen)
- Old Italic (10300 – 1032F)
- Vollständig (36 Zeichen)
- Gothic (10330 – 1034F)
- Vollständig (27 Zeichen)
- Ugaritic (10380 – 1039F)
- Vollständig (31 Zeichen)
- Imperial Aramaic (10840 – 1085F)
- Vollständig (31 Zeichen)
- Phoenician (10900 – 1091F)
- Vollständig (29 Zeichen)
- Lydian (10920 – 1093F)
- Vollständig (27 Zeichen)
- Old South Arabian (10A60 – 10A7F)
- Vollständig (32 Zeichen)
- Old Turkic (10C00 – 10C4F)
- Vollständig (73 Zeichen)
- Musical Symbols (1D100 – 1D1FF)
- 83 Zeichen (von 220)
- Ancient Greek Musical Notation (1D200 – 1D24F)
- Vollständig (70 Zeichen)
- Tai Xuan Jing Symbols (1D300 – 1D35F)
- Vollständig (87 Zeichen)
- Counting Rod Numerals (1D360 – 1D37F)
- Vollständig (18 Zeichen)
- Mathematical Alphanumeric Symbols (1D400 – 1D7FF)
- Vollständig (996 Zeichen)
- Mahjong Tiles (1F000 – 1F02F)
- Vollständig (44 Zeichen)
- Domino Tiles (1F030 – 1F09F)
- Vollständig (100 Zeichen)
- Playing Cards (1F0A0 – 1F0FF)
- Vollständig (82 Zeichen)
- Enclosed Alphanumerics Supplement (1F100 – 1F1FF)
- Vollständig (173 Zeichen)
- Miscellaneous Symbols and Pictographs (1F300 – 1F5FF)
- 191 Zeichen (von 742)
- Emoticons (1F600 – 16F4F)
- Vollständig (78 Zeichen)
- Alchemical Symbols (1F700 – 1F77F)
- Vollständig (116 Zeichen)
- Geometric Shapes Extended (1F780 – 1F7FF)
- 64 Zeichen (von 85)
¹ Da Quivira keine Han-Ideographen enthält, sind die Zeichen im Block »Halfwidth and Fullwidth Forms« relativ nutzlos. Sie sind nur enthalten, da sie intern zur Zusammensetzung der Control Characters verwendet werden.
Private Use Area
Quivira 4.1 enthält 888 Zeichen in dem Unicode-Block »Private Use Area«. Diese Zeichen haben generische Namen wie z.B. »PRIVATE USE CHARACTER-E000« (der letzte Teil nach dem Bindestrich ist der Codepoint in Hexadezimalschreibweise) und die Zeichenklasse »Co [Other, Private Use]«.
Die Private Use Area ist in selbstdefinierte Blöcke unterteilt, und die einzelnen Zeichen haben Namen, analog zu den standardisierten Zeichen. Diese Blöcke und Namen sind eigene Erfindungen und werden nur in der Dokumentation zu Quivira verwendet, um zu zeigen, wofür diese Zeichen gedacht sind. Sie gehören zu keinem Standard (wie z.B. Unicode) und werden von keinem Programm verwendet oder angezeigt (stattdessen werden die oben genannten Unicode-Namen verwendet).
Aus dem selben Grund haben diese Zeichen keine definierten Eigenschaften, d.h. verarbeitende Programme wissen nicht, ob sie Buchstaben oder Symbole darstellen etc. Die Umwandlung von Groß- in Kleinbuchstaben und umgekehrt funktioniert nicht. Die Rechtschreibprüfung erkennt sie nicht als Buchstaben, sondern wird sie als Symbole betrachten und ignorieren. Wenn Sie bei einem vorhandenen Dokument die Schriftart ändern, werden sie nicht mehr korrekt angezeigt, da die andere Schriftart die selben Codepoints u.U. für völlig andere Zeichen verwendet (oder auch überhaupt nicht).
In Unicode wird ein einmal aufgenommes Zeichen niemals geändert oder entfernt. Die Private Use Area in Quivira ist allerdings nicht ganz so stabil: Wenn ein Zeichen aus der Private Use Area in den Unicode-Standard aufgenommen wird, wird es auf seinen neuen standardisierten Codepoint verschoben. Aus diesem Grund enthält die Private Use Area nur Zeichen, die eher schlechte Chancen haben, von Unicode akzeptiert zu werden.
In der PDF-Datei Liste der Zeichen in der Private Use Area finden Sie die detaillierten Beschreibungen der einzelnen Zeichen (auf Englisch).
Zukünftige Entwicklung
Die Weiterentwicklung Quiviras ist nicht abgeschlossen, aber da ich dies nur als Hobby betreibe, erscheinen neue Versionen in sehr unregelmäßigen Zeitabständen. Ich kann nicht vorhersagen, wann die nächste Version fertig sein wird.
Über die Zeichen, die in der jeweils nächsten Version aufgenommen werden, wird spontan entschieden, d.h. es gibt keine Roadmap für zukünftige Versionen. Falls Sie ein bestimmtes Zeichen oder ein bestimmtes Script benötigen, kontaktieren Sie mich, und ich werde versuchen, diese in der nächstmöglichen Version einzubauen (dies kann allerdings einige Monate dauern).
Bitte beachten Sie, daß es einige Arten von Zeichen gibt, die auch auf Anfrage nicht hinzugefügt werden. Dies betrifft:
- Zeichen, die dem Unicode-Standard widersprechen, z.B. Varianten vorhandener Buchstaben. Wenn Sie Variationen in Ihren Dokumenten wünschen, verwenden Sie verschiedene Schriftarten, aber verwirren Sie nicht die Rechtschreibprüfung durch unnötige Private-Use-Zeichen.
- Zeichen, die sich in der Unicode Pipeline Table (Proposed New Characters) für die Aufnahme in Unicode befinden. Ich kann diesen noch nicht den zukünftigen Codepoint zuweisen, da er sich eventuell noch ändern kann. Ebenso möchte ich sie nicht in die Private Use Area aufnehmen, da sie sonst bald verschoben werden müßten, wodurch entweder Duplikate entstünden oder existierende Dokumente zerstört werden.
- Zeichen, die technisch unmöglich sind. In OpenType-Schriftarten können Zeichen
keine Farben haben,¹ nicht animiert sein und nicht aus der Zeile herausragen. - Zeichen, die zu nicht vorhandenen Schriften gehören. Beispielsweise wäre es sinnlos, ein seltenes chinesisches Zeichen hinzuzufügen, ohne die üblicheren zu haben.
Quivira soll so viele Schriften und Sprachen wie möglich unterstützen, aber es gibt Einschränkungen. Das erste Problem ist die Anzahl der im Unicode-Standard definierten Zeichen, da eine einzelne Schrift nicht so viele Zeichen enthalten kann. Aus diesem Grund enthält Quivira keine Han-Ideographen (das sind mehr Zeichen als alle anderen zusammen).
Die zweite Einschränkung ergibt sich aus der Komplexität mancher Schriften: Für einige Zeichen könnte ich zwar entsprechende Glyphen aufnehmen, aber ein Text, der sie enthält, würde trotzdem nicht korrekt gerendert werden. Dieses Problem betrifft v.a. die meisten indischen und südostasiatischen Schriften. Es betrifft ebenso Buchstaben, die ihre Form in Abhängigkeit von den umgebenden Buchstaben verändern, wie z.B. im Arabischen (dies ist der Grund, warum die arabische Schrift bisher nicht unterstützt wird, trotz ihrer Bedeutsamkeit).
Die entsprechenden Features sind zwar dank der Umstellung auf OpenType prinzipiell möglich, aber sehr aufwendig. Deswegen konzentriere ich mich bis auf weiteres auf Schriften, die ohne oder mit nur relativ wenig OpenType-Script auskommen.
¹ In der Zwischenzeit sind mehrfarbige Glyphen möglich geworden. Allerdings enthält Quivira derzeit keine.
Social Bookmarks