Imported from antiword-0.37.tar.gz.
[antiword.git] / Resources / roman.txt
blobd3ed19e6fd354cd8205ecb0cf52302d4c65293c9
1 #=======================================================================\r#   FTP file name:  ROMAN.TXT\r#\r#   Contents:       Map (external version) from Mac OS Roman\r#                   character set to Unicode 2.1\r#\r#   Copyright:      (c) 1994-1999 by Apple Computer, Inc., all rights\r#                   reserved.\r#\r#   Contact:        charsets@apple.com\r#\r#   Changes:\r#\r#       b03  1999-Sep-22    Update contact e-mail address. Matches\r#                           internal utom<b4>, ufrm<b3>, and Text\r#                           Encoding Converter version 1.5.\r#       b02  1998-Aug-18    Encoding changed for Mac OS 8.5; change\r#                           mapping of 0xDB from CURRENCY SIGN to\r#                           EURO SIGN. Matches internal utom<b3>,\r#                           ufrm<b3>.\r#       n08  1998-Feb-05    Minor update to header comments\r#       n06  1997-Dec-14    Add warning about future changes to 0xDB\r#                           from CURRENCY SIGN to EURO SIGN. Clarify\r#                           some header information\r#       n04  1997-Dec-01    Update to match internal utom<n3>, ufrm<n22>:\r#                           Change standard mapping for 0xBD from U+2126\r#                           to its canonical decomposition, U+03A9.\r#       n03  1995-Apr-15    First version (after fixing some typos).\r#                           Matches internal ufrm<n9>.\r#\r# Standard header:\r# ----------------\r#\r#   Apple, the Apple logo, and Macintosh are trademarks of Apple\r#   Computer, Inc., registered in the United States and other countries.\r#   Unicode is a trademark of Unicode Inc. For the sake of brevity,\r#   throughout this document, "Macintosh" can be used to refer to\r#   Macintosh computers and "Unicode" can be used to refer to the\r#   Unicode standard.\r#\r#   Apple makes no warranty or representation, either express or\r#   implied, with respect to these tables, their quality, accuracy, or\r#   fitness for a particular purpose. In no event will Apple be liable\r#   for direct, indirect, special, incidental, or consequential damages \r#   resulting from any defect or inaccuracy in this document or the\r#   accompanying tables.\r#\r#   These mapping tables and character lists are subject to change.\r#   The latest tables should be available from the following:\r#\r#   <ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/APPLE/>\r#   <ftp://dev.apple.com/devworld/Technical_Documentation/Misc._Standards/>\r#\r#   For general information about Mac OS encodings and these mapping\r#   tables, see the file "README.TXT".\r#\r# Format:\r# -------\r#\r#   Three tab-separated columns;\r#   '#' begins a comment which continues to the end of the line.\r#     Column #1 is the Mac OS Roman code (in hex as 0xNN)\r#     Column #2 is the corresponding Unicode (in hex as 0xNNNN)\r#     Column #3 is a comment containing the Unicode name\r#\r#   The entries are in Mac OS Roman code order.\r#\r#   One of these mappings requires the use of a corporate character.\r#   See the file "CORPCHAR.TXT" and notes below.\r#\r#   Control character mappings are not shown in this table, following\r#   the conventions of the standard UTC mapping tables. However, the\r#   Mac OS Roman character set uses the standard control characters at\r#   0x00-0x1F and 0x7F.\r#\r# Notes on Mac OS Roman:\r# ----------------------\r#\r#   This character set is used for at least the following Mac OS\r#   localizations: U.S., British, Canadian French, French, Swiss\r#   French, German, Swiss German, Italian, Swiss Italian, Dutch,\r#   Swedish, Norwegian, Danish, Finnish, Spanish, Catalan,\r#   Portuguese, Brazilian, and the default International system.\r#\r#   Variants of Mac OS Roman are used for Croatian, Icelandic,\r#   Turkish, Romanian, and other encodings. Separate mapping tables\r#   are available for these encodings.\r#\r#   Before Mac OS 8.5, code point 0xDB was CURRENCY SIGN, and was\r#   mapped to U+00A4. In Mac OS 8.5 and later versions, code point\r#   0xDB is changed to EURO SIGN and maps to U+20AC; the standard\r#   Apple fonts are updated for Mac OS 8.5 to reflect this. There is\r#   a "currency sign" variant of the Mac OS Roman encoding that still\r#   maps 0xDB to U+00A4; this can be used for older fonts.\r#   Note: U+20AC is new with Unicode 2.1; for earlier Unicode\r#   versions, Mac OS Roman 0xDB may be mapped to private-use character\r#   U+F8A0.\r#\r#   Before Mac OS 8.5, the ROM bitmap versions of the fonts Chicago,\r#   New York, Geneva, and Monaco did not implement the full Mac OS\r#   Roman character set; they only supported character codes up to\r#   0xD8. The TrueType versions of these fonts have always implemented\r#   the full character set, as with the bitmap and TrueType versions\r#   of the other standard Roman fonts.\r#\r#   In all Mac OS encodings, fonts such as Chicago which are used\r#   as "system" fonts (for menus, dialogs, etc.) have four glyphs\r#   at code points 0x11-0x14 for transient use by the Menu Manager.\r#   These glyphs are not intended as characters for use in normal\r#   text, and the associated code points are not generally\r#   interpreted as associated with these glyphs; they are usually\r#   interpreted (if at all) as the control codes DC1-DC4.\r#\r# Unicode mapping issues and notes:\r# ---------------------------------\r#\r#   The following corporate zone Unicode character is used in this\r#   mapping:\r#\r#     0xF8FF  Apple logo\r#\r#   NOTE: The graphic image associated with the Apple logo character\r#   is not authorized for use without permission of Apple, and\r#   unauthorized use might constitute trademark infringement.\r#\r# Details of mapping changes in each version:\r# -------------------------------------------\r#\r#   Changes from version n08 to version b02:\r#\r#   - Encoding changed for Mac OS 8.5; change mapping of 0xDB from\r#   CURRENCY SIGN (U+00A4) to EURO SIGN (U+20AC).\r#\r#   Changes from version n03 to version n04:\r#\r#   - Change mapping of 0xBD from U+2126 to its canonical\r#     decomposition, U+03A9.\r#\r##################\r\r0x20 0x0020  # SPACE\r0x21    0x0021  # EXCLAMATION MARK\r0x22 0x0022  # QUOTATION MARK\r0x23   0x0023  # NUMBER SIGN\r0x24      0x0024  # DOLLAR SIGN\r0x25      0x0025  # PERCENT SIGN\r0x26     0x0026  # AMPERSAND\r0x27        0x0027  # APOSTROPHE\r0x28       0x0028  # LEFT PARENTHESIS\r0x29 0x0029  # RIGHT PARENTHESIS\r0x2A        0x002A  # ASTERISK\r0x2B 0x002B  # PLUS SIGN\r0x2C        0x002C  # COMMA\r0x2D    0x002D  # HYPHEN-MINUS\r0x2E     0x002E  # FULL STOP\r0x2F        0x002F  # SOLIDUS\r0x30  0x0030  # DIGIT ZERO\r0x31       0x0031  # DIGIT ONE\r0x32        0x0032  # DIGIT TWO\r0x33        0x0033  # DIGIT THREE\r0x34      0x0034  # DIGIT FOUR\r0x35       0x0035  # DIGIT FIVE\r0x36       0x0036  # DIGIT SIX\r0x37        0x0037  # DIGIT SEVEN\r0x38      0x0038  # DIGIT EIGHT\r0x39      0x0039  # DIGIT NINE\r0x3A       0x003A  # COLON\r0x3B    0x003B  # SEMICOLON\r0x3C        0x003C  # LESS-THAN SIGN\r0x3D   0x003D  # EQUALS SIGN\r0x3E      0x003E  # GREATER-THAN SIGN\r0x3F        0x003F  # QUESTION MARK\r0x40    0x0040  # COMMERCIAL AT\r0x41    0x0041  # LATIN CAPITAL LETTER A\r0x42   0x0042  # LATIN CAPITAL LETTER B\r0x43   0x0043  # LATIN CAPITAL LETTER C\r0x44   0x0044  # LATIN CAPITAL LETTER D\r0x45   0x0045  # LATIN CAPITAL LETTER E\r0x46   0x0046  # LATIN CAPITAL LETTER F\r0x47   0x0047  # LATIN CAPITAL LETTER G\r0x48   0x0048  # LATIN CAPITAL LETTER H\r0x49   0x0049  # LATIN CAPITAL LETTER I\r0x4A   0x004A  # LATIN CAPITAL LETTER J\r0x4B   0x004B  # LATIN CAPITAL LETTER K\r0x4C   0x004C  # LATIN CAPITAL LETTER L\r0x4D   0x004D  # LATIN CAPITAL LETTER M\r0x4E   0x004E  # LATIN CAPITAL LETTER N\r0x4F   0x004F  # LATIN CAPITAL LETTER O\r0x50   0x0050  # LATIN CAPITAL LETTER P\r0x51   0x0051  # LATIN CAPITAL LETTER Q\r0x52   0x0052  # LATIN CAPITAL LETTER R\r0x53   0x0053  # LATIN CAPITAL LETTER S\r0x54   0x0054  # LATIN CAPITAL LETTER T\r0x55   0x0055  # LATIN CAPITAL LETTER U\r0x56   0x0056  # LATIN CAPITAL LETTER V\r0x57   0x0057  # LATIN CAPITAL LETTER W\r0x58   0x0058  # LATIN CAPITAL LETTER X\r0x59   0x0059  # LATIN CAPITAL LETTER Y\r0x5A   0x005A  # LATIN CAPITAL LETTER Z\r0x5B   0x005B  # LEFT SQUARE BRACKET\r0x5C      0x005C  # REVERSE SOLIDUS\r0x5D  0x005D  # RIGHT SQUARE BRACKET\r0x5E     0x005E  # CIRCUMFLEX ACCENT\r0x5F        0x005F  # LOW LINE\r0x60 0x0060  # GRAVE ACCENT\r0x61     0x0061  # LATIN SMALL LETTER A\r0x62     0x0062  # LATIN SMALL LETTER B\r0x63     0x0063  # LATIN SMALL LETTER C\r0x64     0x0064  # LATIN SMALL LETTER D\r0x65     0x0065  # LATIN SMALL LETTER E\r0x66     0x0066  # LATIN SMALL LETTER F\r0x67     0x0067  # LATIN SMALL LETTER G\r0x68     0x0068  # LATIN SMALL LETTER H\r0x69     0x0069  # LATIN SMALL LETTER I\r0x6A     0x006A  # LATIN SMALL LETTER J\r0x6B     0x006B  # LATIN SMALL LETTER K\r0x6C     0x006C  # LATIN SMALL LETTER L\r0x6D     0x006D  # LATIN SMALL LETTER M\r0x6E     0x006E  # LATIN SMALL LETTER N\r0x6F     0x006F  # LATIN SMALL LETTER O\r0x70     0x0070  # LATIN SMALL LETTER P\r0x71     0x0071  # LATIN SMALL LETTER Q\r0x72     0x0072  # LATIN SMALL LETTER R\r0x73     0x0073  # LATIN SMALL LETTER S\r0x74     0x0074  # LATIN SMALL LETTER T\r0x75     0x0075  # LATIN SMALL LETTER U\r0x76     0x0076  # LATIN SMALL LETTER V\r0x77     0x0077  # LATIN SMALL LETTER W\r0x78     0x0078  # LATIN SMALL LETTER X\r0x79     0x0079  # LATIN SMALL LETTER Y\r0x7A     0x007A  # LATIN SMALL LETTER Z\r0x7B     0x007B  # LEFT CURLY BRACKET\r0x7C       0x007C  # VERTICAL LINE\r0x7D    0x007D  # RIGHT CURLY BRACKET\r0x7E      0x007E  # TILDE\r#\r0x80  0x00C4  # LATIN CAPITAL LETTER A WITH DIAERESIS\r0x81    0x00C5  # LATIN CAPITAL LETTER A WITH RING ABOVE\r0x82   0x00C7  # LATIN CAPITAL LETTER C WITH CEDILLA\r0x83      0x00C9  # LATIN CAPITAL LETTER E WITH ACUTE\r0x84        0x00D1  # LATIN CAPITAL LETTER N WITH TILDE\r0x85        0x00D6  # LATIN CAPITAL LETTER O WITH DIAERESIS\r0x86    0x00DC  # LATIN CAPITAL LETTER U WITH DIAERESIS\r0x87    0x00E1  # LATIN SMALL LETTER A WITH ACUTE\r0x88  0x00E0  # LATIN SMALL LETTER A WITH GRAVE\r0x89  0x00E2  # LATIN SMALL LETTER A WITH CIRCUMFLEX\r0x8A     0x00E4  # LATIN SMALL LETTER A WITH DIAERESIS\r0x8B      0x00E3  # LATIN SMALL LETTER A WITH TILDE\r0x8C  0x00E5  # LATIN SMALL LETTER A WITH RING ABOVE\r0x8D     0x00E7  # LATIN SMALL LETTER C WITH CEDILLA\r0x8E        0x00E9  # LATIN SMALL LETTER E WITH ACUTE\r0x8F  0x00E8  # LATIN SMALL LETTER E WITH GRAVE\r0x90  0x00EA  # LATIN SMALL LETTER E WITH CIRCUMFLEX\r0x91     0x00EB  # LATIN SMALL LETTER E WITH DIAERESIS\r0x92      0x00ED  # LATIN SMALL LETTER I WITH ACUTE\r0x93  0x00EC  # LATIN SMALL LETTER I WITH GRAVE\r0x94  0x00EE  # LATIN SMALL LETTER I WITH CIRCUMFLEX\r0x95     0x00EF  # LATIN SMALL LETTER I WITH DIAERESIS\r0x96      0x00F1  # LATIN SMALL LETTER N WITH TILDE\r0x97  0x00F3  # LATIN SMALL LETTER O WITH ACUTE\r0x98  0x00F2  # LATIN SMALL LETTER O WITH GRAVE\r0x99  0x00F4  # LATIN SMALL LETTER O WITH CIRCUMFLEX\r0x9A     0x00F6  # LATIN SMALL LETTER O WITH DIAERESIS\r0x9B      0x00F5  # LATIN SMALL LETTER O WITH TILDE\r0x9C  0x00FA  # LATIN SMALL LETTER U WITH ACUTE\r0x9D  0x00F9  # LATIN SMALL LETTER U WITH GRAVE\r0x9E  0x00FB  # LATIN SMALL LETTER U WITH CIRCUMFLEX\r0x9F     0x00FC  # LATIN SMALL LETTER U WITH DIAERESIS\r0xA0      0x2020  # DAGGER\r0xA1   0x00B0  # DEGREE SIGN\r0xA2      0x00A2  # CENT SIGN\r0xA3        0x00A3  # POUND SIGN\r0xA4       0x00A7  # SECTION SIGN\r0xA5     0x2022  # BULLET\r0xA6   0x00B6  # PILCROW SIGN\r0xA7     0x00DF  # LATIN SMALL LETTER SHARP S\r0xA8       0x00AE  # REGISTERED SIGN\r0xA9  0x00A9  # COPYRIGHT SIGN\r0xAA   0x2122  # TRADE MARK SIGN\r0xAB  0x00B4  # ACUTE ACCENT\r0xAC     0x00A8  # DIAERESIS\r0xAD        0x2260  # NOT EQUAL TO\r0xAE     0x00C6  # LATIN CAPITAL LETTER AE\r0xAF  0x00D8  # LATIN CAPITAL LETTER O WITH STROKE\r0xB0       0x221E  # INFINITY\r0xB1 0x00B1  # PLUS-MINUS SIGN\r0xB2  0x2264  # LESS-THAN OR EQUAL TO\r0xB3    0x2265  # GREATER-THAN OR EQUAL TO\r0xB4 0x00A5  # YEN SIGN\r0xB5 0x00B5  # MICRO SIGN\r0xB6       0x2202  # PARTIAL DIFFERENTIAL\r0xB7     0x2211  # N-ARY SUMMATION\r0xB8  0x220F  # N-ARY PRODUCT\r0xB9    0x03C0  # GREEK SMALL LETTER PI\r0xBA    0x222B  # INTEGRAL\r0xBB 0x00AA  # FEMININE ORDINAL INDICATOR\r0xBC       0x00BA  # MASCULINE ORDINAL INDICATOR\r0xBD      0x03A9  # GREEK CAPITAL LETTER OMEGA\r0xBE       0x00E6  # LATIN SMALL LETTER AE\r0xBF    0x00F8  # LATIN SMALL LETTER O WITH STROKE\r0xC0 0x00BF  # INVERTED QUESTION MARK\r0xC1   0x00A1  # INVERTED EXCLAMATION MARK\r0xC2        0x00AC  # NOT SIGN\r0xC3 0x221A  # SQUARE ROOT\r0xC4      0x0192  # LATIN SMALL LETTER F WITH HOOK\r0xC5   0x2248  # ALMOST EQUAL TO\r0xC6  0x2206  # INCREMENT\r0xC7        0x00AB  # LEFT-POINTING DOUBLE ANGLE QUOTATION MARK\r0xC8        0x00BB  # RIGHT-POINTING DOUBLE ANGLE QUOTATION MARK\r0xC9       0x2026  # HORIZONTAL ELLIPSIS\r0xCA      0x00A0  # NO-BREAK SPACE\r0xCB   0x00C0  # LATIN CAPITAL LETTER A WITH GRAVE\r0xCC        0x00C3  # LATIN CAPITAL LETTER A WITH TILDE\r0xCD        0x00D5  # LATIN CAPITAL LETTER O WITH TILDE\r0xCE        0x0152  # LATIN CAPITAL LIGATURE OE\r0xCF        0x0153  # LATIN SMALL LIGATURE OE\r0xD0  0x2013  # EN DASH\r0xD1  0x2014  # EM DASH\r0xD2  0x201C  # LEFT DOUBLE QUOTATION MARK\r0xD3       0x201D  # RIGHT DOUBLE QUOTATION MARK\r0xD4      0x2018  # LEFT SINGLE QUOTATION MARK\r0xD5       0x2019  # RIGHT SINGLE QUOTATION MARK\r0xD6      0x00F7  # DIVISION SIGN\r0xD7    0x25CA  # LOZENGE\r0xD8  0x00FF  # LATIN SMALL LETTER Y WITH DIAERESIS\r0xD9      0x0178  # LATIN CAPITAL LETTER Y WITH DIAERESIS\r0xDA    0x2044  # FRACTION SLASH\r0xDB   0x20AC  # EURO SIGN\r0xDC        0x2039  # SINGLE LEFT-POINTING ANGLE QUOTATION MARK\r0xDD        0x203A  # SINGLE RIGHT-POINTING ANGLE QUOTATION MARK\r0xDE       0xFB01  # LATIN SMALL LIGATURE FI\r0xDF  0xFB02  # LATIN SMALL LIGATURE FL\r0xE0  0x2021  # DOUBLE DAGGER\r0xE1    0x00B7  # MIDDLE DOT\r0xE2       0x201A  # SINGLE LOW-9 QUOTATION MARK\r0xE3      0x201E  # DOUBLE LOW-9 QUOTATION MARK\r0xE4      0x2030  # PER MILLE SIGN\r0xE5   0x00C2  # LATIN CAPITAL LETTER A WITH CIRCUMFLEX\r0xE6   0x00CA  # LATIN CAPITAL LETTER E WITH CIRCUMFLEX\r0xE7   0x00C1  # LATIN CAPITAL LETTER A WITH ACUTE\r0xE8        0x00CB  # LATIN CAPITAL LETTER E WITH DIAERESIS\r0xE9    0x00C8  # LATIN CAPITAL LETTER E WITH GRAVE\r0xEA        0x00CD  # LATIN CAPITAL LETTER I WITH ACUTE\r0xEB        0x00CE  # LATIN CAPITAL LETTER I WITH CIRCUMFLEX\r0xEC   0x00CF  # LATIN CAPITAL LETTER I WITH DIAERESIS\r0xED    0x00CC  # LATIN CAPITAL LETTER I WITH GRAVE\r0xEE        0x00D3  # LATIN CAPITAL LETTER O WITH ACUTE\r0xEF        0x00D4  # LATIN CAPITAL LETTER O WITH CIRCUMFLEX\r0xF0   0xF8FF  # Apple logo\r0xF1       0x00D2  # LATIN CAPITAL LETTER O WITH GRAVE\r0xF2        0x00DA  # LATIN CAPITAL LETTER U WITH ACUTE\r0xF3        0x00DB  # LATIN CAPITAL LETTER U WITH CIRCUMFLEX\r0xF4   0x00D9  # LATIN CAPITAL LETTER U WITH GRAVE\r0xF5        0x0131  # LATIN SMALL LETTER DOTLESS I\r0xF6     0x02C6  # MODIFIER LETTER CIRCUMFLEX ACCENT\r0xF7        0x02DC  # SMALL TILDE\r0xF8      0x00AF  # MACRON\r0xF9   0x02D8  # BREVE\r0xFA    0x02D9  # DOT ABOVE\r0xFB        0x02DA  # RING ABOVE\r0xFC       0x00B8  # CEDILLA\r0xFD  0x02DD  # DOUBLE ACUTE ACCENT\r0xFE      0x02DB  # OGONEK\r0xFF   0x02C7  # CARON\r