Imported from antiword-0.37.tar.gz.
[antiword.git] / Resources / MacRoman.txt
blobb2b672388271af59971deb1513377b059c396181
1 #=======================================================================\r
2 #   File name:  ROMAN.TXT\r
3 #\r
4 #   Contents:   Map (external version) from Mac OS Roman\r
5 #               character set to Unicode 2.1 through Unicode 3.2\r
6 #\r
7 #   Copyright:  (c) 1994-2002 by Apple Computer, Inc., all rights\r
8 #               reserved.\r
9 #\r
10 #   Contact:    charsets@apple.com\r
11 #\r
12 #   Changes:\r
13 #\r
14 #      b4,c1 2002-Dec-19    Update URLs, notes. Matches internal\r
15 #                           utom<b5>.\r
16 #       b03  1999-Sep-22    Update contact e-mail address. Matches\r
17 #                           internal utom<b4>, ufrm<b3>, and Text\r
18 #                           Encoding Converter version 1.5.\r
19 #       b02  1998-Aug-18    Encoding changed for Mac OS 8.5; change\r
20 #                           mapping of 0xDB from CURRENCY SIGN to\r
21 #                           EURO SIGN. Matches internal utom<b3>,\r
22 #                           ufrm<b3>.\r
23 #       n08  1998-Feb-05    Minor update to header comments\r
24 #       n06  1997-Dec-14    Add warning about future changes to 0xDB\r
25 #                           from CURRENCY SIGN to EURO SIGN. Clarify\r
26 #                           some header information\r
27 #       n04  1997-Dec-01    Update to match internal utom<n3>, ufrm<n22>:\r
28 #                           Change standard mapping for 0xBD from U+2126\r
29 #                           to its canonical decomposition, U+03A9.\r
30 #       n03  1995-Apr-15    First version (after fixing some typos).\r
31 #                           Matches internal ufrm<n9>.\r
32 #\r
33 # Standard header:\r
34 # ----------------\r
35 #\r
36 #   Apple, the Apple logo, and Macintosh are trademarks of Apple\r
37 #   Computer, Inc., registered in the United States and other countries.\r
38 #   Unicode is a trademark of Unicode Inc. For the sake of brevity,\r
39 #   throughout this document, "Macintosh" can be used to refer to\r
40 #   Macintosh computers and "Unicode" can be used to refer to the\r
41 #   Unicode standard.\r
42 #\r
43 #   Apple makes no warranty or representation, either express or\r
44 #   implied, with respect to these tables, their quality, accuracy, or\r
45 #   fitness for a particular purpose. In no event will Apple be liable\r
46 #   for direct, indirect, special, incidental, or consequential damages \r
47 #   resulting from any defect or inaccuracy in this document or the\r
48 #   accompanying tables.\r
49 #\r
50 #   These mapping tables and character lists are subject to change.\r
51 #   The latest tables should be available from the following:\r
52 #\r
53 #   <http://www.unicode.org/Public/MAPPINGS/VENDORS/APPLE/>\r
54 #\r
55 #   For general information about Mac OS encodings and these mapping\r
56 #   tables, see the file "README.TXT".\r
57 #\r
58 # Format:\r
59 # -------\r
60 #\r
61 #   Three tab-separated columns;\r
62 #   '#' begins a comment which continues to the end of the line.\r
63 #     Column #1 is the Mac OS Roman code (in hex as 0xNN)\r
64 #     Column #2 is the corresponding Unicode (in hex as 0xNNNN)\r
65 #     Column #3 is a comment containing the Unicode name\r
66 #\r
67 #   The entries are in Mac OS Roman code order.\r
68 #\r
69 #   One of these mappings requires the use of a corporate character.\r
70 #   See the file "CORPCHAR.TXT" and notes below.\r
71 #\r
72 #   Control character mappings are not shown in this table, following\r
73 #   the conventions of the standard UTC mapping tables. However, the\r
74 #   Mac OS Roman character set uses the standard control characters at\r
75 #   0x00-0x1F and 0x7F.\r
76 #\r
77 # Notes on Mac OS Roman:\r
78 # ----------------------\r
79 #\r
80 #   This character set is used for at least the following Mac OS\r
81 #   localizations: U.S., British, Canadian French, French, Swiss\r
82 #   French, German, Swiss German, Italian, Swiss Italian, Dutch,\r
83 #   Swedish, Norwegian, Danish, Finnish, Spanish, Catalan,\r
84 #   Portuguese, Brazilian, and the default International system.\r
85 #\r
86 #   Variants of Mac OS Roman are used for Croatian, Icelandic,\r
87 #   Turkish, Romanian, and other encodings. Separate mapping tables\r
88 #   are available for these encodings.\r
89 #\r
90 #   Before Mac OS 8.5, code point 0xDB was CURRENCY SIGN, and was\r
91 #   mapped to U+00A4. In Mac OS 8.5 and later versions, code point\r
92 #   0xDB is changed to EURO SIGN and maps to U+20AC; the standard\r
93 #   Apple fonts are updated for Mac OS 8.5 to reflect this. There is\r
94 #   a "currency sign" variant of the Mac OS Roman encoding that still\r
95 #   maps 0xDB to U+00A4; this can be used for older fonts.\r
96 #\r
97 #   Before Mac OS 8.5, the ROM bitmap versions of the fonts Chicago,\r
98 #   New York, Geneva, and Monaco did not implement the full Mac OS\r
99 #   Roman character set; they only supported character codes up to\r
100 #   0xD8. The TrueType versions of these fonts have always implemented\r
101 #   the full character set, as with the bitmap and TrueType versions\r
102 #   of the other standard Roman fonts.\r
104 #   In all Mac OS encodings, fonts such as Chicago which are used\r
105 #   as "system" fonts (for menus, dialogs, etc.) have four glyphs\r
106 #   at code points 0x11-0x14 for transient use by the Menu Manager.\r
107 #   These glyphs are not intended as characters for use in normal\r
108 #   text, and the associated code points are not generally\r
109 #   interpreted as associated with these glyphs; they are usually\r
110 #   interpreted (if at all) as the control codes DC1-DC4.\r
112 # Unicode mapping issues and notes:\r
113 # ---------------------------------\r
115 #   The following corporate zone Unicode character is used in this\r
116 #   mapping:\r
118 #     0xF8FF  Apple logo\r
120 #   NOTE: The graphic image associated with the Apple logo character\r
121 #   is not authorized for use without permission of Apple, and\r
122 #   unauthorized use might constitute trademark infringement.\r
124 # Details of mapping changes in each version:\r
125 # -------------------------------------------\r
127 #   Changes from version n08 to version b02:\r
129 #   - Encoding changed for Mac OS 8.5; change mapping of 0xDB from\r
130 #   CURRENCY SIGN (U+00A4) to EURO SIGN (U+20AC).\r
132 #   Changes from version n03 to version n04:\r
134 #   - Change mapping of 0xBD from U+2126 to its canonical\r
135 #     decomposition, U+03A9.\r
137 ##################\r
139 0x20    0x0020  # SPACE\r
140 0x21    0x0021  # EXCLAMATION MARK\r
141 0x22    0x0022  # QUOTATION MARK\r
142 0x23    0x0023  # NUMBER SIGN\r
143 0x24    0x0024  # DOLLAR SIGN\r
144 0x25    0x0025  # PERCENT SIGN\r
145 0x26    0x0026  # AMPERSAND\r
146 0x27    0x0027  # APOSTROPHE\r
147 0x28    0x0028  # LEFT PARENTHESIS\r
148 0x29    0x0029  # RIGHT PARENTHESIS\r
149 0x2A    0x002A  # ASTERISK\r
150 0x2B    0x002B  # PLUS SIGN\r
151 0x2C    0x002C  # COMMA\r
152 0x2D    0x002D  # HYPHEN-MINUS\r
153 0x2E    0x002E  # FULL STOP\r
154 0x2F    0x002F  # SOLIDUS\r
155 0x30    0x0030  # DIGIT ZERO\r
156 0x31    0x0031  # DIGIT ONE\r
157 0x32    0x0032  # DIGIT TWO\r
158 0x33    0x0033  # DIGIT THREE\r
159 0x34    0x0034  # DIGIT FOUR\r
160 0x35    0x0035  # DIGIT FIVE\r
161 0x36    0x0036  # DIGIT SIX\r
162 0x37    0x0037  # DIGIT SEVEN\r
163 0x38    0x0038  # DIGIT EIGHT\r
164 0x39    0x0039  # DIGIT NINE\r
165 0x3A    0x003A  # COLON\r
166 0x3B    0x003B  # SEMICOLON\r
167 0x3C    0x003C  # LESS-THAN SIGN\r
168 0x3D    0x003D  # EQUALS SIGN\r
169 0x3E    0x003E  # GREATER-THAN SIGN\r
170 0x3F    0x003F  # QUESTION MARK\r
171 0x40    0x0040  # COMMERCIAL AT\r
172 0x41    0x0041  # LATIN CAPITAL LETTER A\r
173 0x42    0x0042  # LATIN CAPITAL LETTER B\r
174 0x43    0x0043  # LATIN CAPITAL LETTER C\r
175 0x44    0x0044  # LATIN CAPITAL LETTER D\r
176 0x45    0x0045  # LATIN CAPITAL LETTER E\r
177 0x46    0x0046  # LATIN CAPITAL LETTER F\r
178 0x47    0x0047  # LATIN CAPITAL LETTER G\r
179 0x48    0x0048  # LATIN CAPITAL LETTER H\r
180 0x49    0x0049  # LATIN CAPITAL LETTER I\r
181 0x4A    0x004A  # LATIN CAPITAL LETTER J\r
182 0x4B    0x004B  # LATIN CAPITAL LETTER K\r
183 0x4C    0x004C  # LATIN CAPITAL LETTER L\r
184 0x4D    0x004D  # LATIN CAPITAL LETTER M\r
185 0x4E    0x004E  # LATIN CAPITAL LETTER N\r
186 0x4F    0x004F  # LATIN CAPITAL LETTER O\r
187 0x50    0x0050  # LATIN CAPITAL LETTER P\r
188 0x51    0x0051  # LATIN CAPITAL LETTER Q\r
189 0x52    0x0052  # LATIN CAPITAL LETTER R\r
190 0x53    0x0053  # LATIN CAPITAL LETTER S\r
191 0x54    0x0054  # LATIN CAPITAL LETTER T\r
192 0x55    0x0055  # LATIN CAPITAL LETTER U\r
193 0x56    0x0056  # LATIN CAPITAL LETTER V\r
194 0x57    0x0057  # LATIN CAPITAL LETTER W\r
195 0x58    0x0058  # LATIN CAPITAL LETTER X\r
196 0x59    0x0059  # LATIN CAPITAL LETTER Y\r
197 0x5A    0x005A  # LATIN CAPITAL LETTER Z\r
198 0x5B    0x005B  # LEFT SQUARE BRACKET\r
199 0x5C    0x005C  # REVERSE SOLIDUS\r
200 0x5D    0x005D  # RIGHT SQUARE BRACKET\r
201 0x5E    0x005E  # CIRCUMFLEX ACCENT\r
202 0x5F    0x005F  # LOW LINE\r
203 0x60    0x0060  # GRAVE ACCENT\r
204 0x61    0x0061  # LATIN SMALL LETTER A\r
205 0x62    0x0062  # LATIN SMALL LETTER B\r
206 0x63    0x0063  # LATIN SMALL LETTER C\r
207 0x64    0x0064  # LATIN SMALL LETTER D\r
208 0x65    0x0065  # LATIN SMALL LETTER E\r
209 0x66    0x0066  # LATIN SMALL LETTER F\r
210 0x67    0x0067  # LATIN SMALL LETTER G\r
211 0x68    0x0068  # LATIN SMALL LETTER H\r
212 0x69    0x0069  # LATIN SMALL LETTER I\r
213 0x6A    0x006A  # LATIN SMALL LETTER J\r
214 0x6B    0x006B  # LATIN SMALL LETTER K\r
215 0x6C    0x006C  # LATIN SMALL LETTER L\r
216 0x6D    0x006D  # LATIN SMALL LETTER M\r
217 0x6E    0x006E  # LATIN SMALL LETTER N\r
218 0x6F    0x006F  # LATIN SMALL LETTER O\r
219 0x70    0x0070  # LATIN SMALL LETTER P\r
220 0x71    0x0071  # LATIN SMALL LETTER Q\r
221 0x72    0x0072  # LATIN SMALL LETTER R\r
222 0x73    0x0073  # LATIN SMALL LETTER S\r
223 0x74    0x0074  # LATIN SMALL LETTER T\r
224 0x75    0x0075  # LATIN SMALL LETTER U\r
225 0x76    0x0076  # LATIN SMALL LETTER V\r
226 0x77    0x0077  # LATIN SMALL LETTER W\r
227 0x78    0x0078  # LATIN SMALL LETTER X\r
228 0x79    0x0079  # LATIN SMALL LETTER Y\r
229 0x7A    0x007A  # LATIN SMALL LETTER Z\r
230 0x7B    0x007B  # LEFT CURLY BRACKET\r
231 0x7C    0x007C  # VERTICAL LINE\r
232 0x7D    0x007D  # RIGHT CURLY BRACKET\r
233 0x7E    0x007E  # TILDE\r
235 0x80    0x00C4  # LATIN CAPITAL LETTER A WITH DIAERESIS\r
236 0x81    0x00C5  # LATIN CAPITAL LETTER A WITH RING ABOVE\r
237 0x82    0x00C7  # LATIN CAPITAL LETTER C WITH CEDILLA\r
238 0x83    0x00C9  # LATIN CAPITAL LETTER E WITH ACUTE\r
239 0x84    0x00D1  # LATIN CAPITAL LETTER N WITH TILDE\r
240 0x85    0x00D6  # LATIN CAPITAL LETTER O WITH DIAERESIS\r
241 0x86    0x00DC  # LATIN CAPITAL LETTER U WITH DIAERESIS\r
242 0x87    0x00E1  # LATIN SMALL LETTER A WITH ACUTE\r
243 0x88    0x00E0  # LATIN SMALL LETTER A WITH GRAVE\r
244 0x89    0x00E2  # LATIN SMALL LETTER A WITH CIRCUMFLEX\r
245 0x8A    0x00E4  # LATIN SMALL LETTER A WITH DIAERESIS\r
246 0x8B    0x00E3  # LATIN SMALL LETTER A WITH TILDE\r
247 0x8C    0x00E5  # LATIN SMALL LETTER A WITH RING ABOVE\r
248 0x8D    0x00E7  # LATIN SMALL LETTER C WITH CEDILLA\r
249 0x8E    0x00E9  # LATIN SMALL LETTER E WITH ACUTE\r
250 0x8F    0x00E8  # LATIN SMALL LETTER E WITH GRAVE\r
251 0x90    0x00EA  # LATIN SMALL LETTER E WITH CIRCUMFLEX\r
252 0x91    0x00EB  # LATIN SMALL LETTER E WITH DIAERESIS\r
253 0x92    0x00ED  # LATIN SMALL LETTER I WITH ACUTE\r
254 0x93    0x00EC  # LATIN SMALL LETTER I WITH GRAVE\r
255 0x94    0x00EE  # LATIN SMALL LETTER I WITH CIRCUMFLEX\r
256 0x95    0x00EF  # LATIN SMALL LETTER I WITH DIAERESIS\r
257 0x96    0x00F1  # LATIN SMALL LETTER N WITH TILDE\r
258 0x97    0x00F3  # LATIN SMALL LETTER O WITH ACUTE\r
259 0x98    0x00F2  # LATIN SMALL LETTER O WITH GRAVE\r
260 0x99    0x00F4  # LATIN SMALL LETTER O WITH CIRCUMFLEX\r
261 0x9A    0x00F6  # LATIN SMALL LETTER O WITH DIAERESIS\r
262 0x9B    0x00F5  # LATIN SMALL LETTER O WITH TILDE\r
263 0x9C    0x00FA  # LATIN SMALL LETTER U WITH ACUTE\r
264 0x9D    0x00F9  # LATIN SMALL LETTER U WITH GRAVE\r
265 0x9E    0x00FB  # LATIN SMALL LETTER U WITH CIRCUMFLEX\r
266 0x9F    0x00FC  # LATIN SMALL LETTER U WITH DIAERESIS\r
267 0xA0    0x2020  # DAGGER\r
268 0xA1    0x00B0  # DEGREE SIGN\r
269 0xA2    0x00A2  # CENT SIGN\r
270 0xA3    0x00A3  # POUND SIGN\r
271 0xA4    0x00A7  # SECTION SIGN\r
272 0xA5    0x2022  # BULLET\r
273 0xA6    0x00B6  # PILCROW SIGN\r
274 0xA7    0x00DF  # LATIN SMALL LETTER SHARP S\r
275 0xA8    0x00AE  # REGISTERED SIGN\r
276 0xA9    0x00A9  # COPYRIGHT SIGN\r
277 0xAA    0x2122  # TRADE MARK SIGN\r
278 0xAB    0x00B4  # ACUTE ACCENT\r
279 0xAC    0x00A8  # DIAERESIS\r
280 0xAD    0x2260  # NOT EQUAL TO\r
281 0xAE    0x00C6  # LATIN CAPITAL LETTER AE\r
282 0xAF    0x00D8  # LATIN CAPITAL LETTER O WITH STROKE\r
283 0xB0    0x221E  # INFINITY\r
284 0xB1    0x00B1  # PLUS-MINUS SIGN\r
285 0xB2    0x2264  # LESS-THAN OR EQUAL TO\r
286 0xB3    0x2265  # GREATER-THAN OR EQUAL TO\r
287 0xB4    0x00A5  # YEN SIGN\r
288 0xB5    0x00B5  # MICRO SIGN\r
289 0xB6    0x2202  # PARTIAL DIFFERENTIAL\r
290 0xB7    0x2211  # N-ARY SUMMATION\r
291 0xB8    0x220F  # N-ARY PRODUCT\r
292 0xB9    0x03C0  # GREEK SMALL LETTER PI\r
293 0xBA    0x222B  # INTEGRAL\r
294 0xBB    0x00AA  # FEMININE ORDINAL INDICATOR\r
295 0xBC    0x00BA  # MASCULINE ORDINAL INDICATOR\r
296 0xBD    0x03A9  # GREEK CAPITAL LETTER OMEGA\r
297 0xBE    0x00E6  # LATIN SMALL LETTER AE\r
298 0xBF    0x00F8  # LATIN SMALL LETTER O WITH STROKE\r
299 0xC0    0x00BF  # INVERTED QUESTION MARK\r
300 0xC1    0x00A1  # INVERTED EXCLAMATION MARK\r
301 0xC2    0x00AC  # NOT SIGN\r
302 0xC3    0x221A  # SQUARE ROOT\r
303 0xC4    0x0192  # LATIN SMALL LETTER F WITH HOOK\r
304 0xC5    0x2248  # ALMOST EQUAL TO\r
305 0xC6    0x2206  # INCREMENT\r
306 0xC7    0x00AB  # LEFT-POINTING DOUBLE ANGLE QUOTATION MARK\r
307 0xC8    0x00BB  # RIGHT-POINTING DOUBLE ANGLE QUOTATION MARK\r
308 0xC9    0x2026  # HORIZONTAL ELLIPSIS\r
309 0xCA    0x00A0  # NO-BREAK SPACE\r
310 0xCB    0x00C0  # LATIN CAPITAL LETTER A WITH GRAVE\r
311 0xCC    0x00C3  # LATIN CAPITAL LETTER A WITH TILDE\r
312 0xCD    0x00D5  # LATIN CAPITAL LETTER O WITH TILDE\r
313 0xCE    0x0152  # LATIN CAPITAL LIGATURE OE\r
314 0xCF    0x0153  # LATIN SMALL LIGATURE OE\r
315 0xD0    0x2013  # EN DASH\r
316 0xD1    0x2014  # EM DASH\r
317 0xD2    0x201C  # LEFT DOUBLE QUOTATION MARK\r
318 0xD3    0x201D  # RIGHT DOUBLE QUOTATION MARK\r
319 0xD4    0x2018  # LEFT SINGLE QUOTATION MARK\r
320 0xD5    0x2019  # RIGHT SINGLE QUOTATION MARK\r
321 0xD6    0x00F7  # DIVISION SIGN\r
322 0xD7    0x25CA  # LOZENGE\r
323 0xD8    0x00FF  # LATIN SMALL LETTER Y WITH DIAERESIS\r
324 0xD9    0x0178  # LATIN CAPITAL LETTER Y WITH DIAERESIS\r
325 0xDA    0x2044  # FRACTION SLASH\r
326 0xDB    0x20AC  # EURO SIGN\r
327 0xDC    0x2039  # SINGLE LEFT-POINTING ANGLE QUOTATION MARK\r
328 0xDD    0x203A  # SINGLE RIGHT-POINTING ANGLE QUOTATION MARK\r
329 0xDE    0xFB01  # LATIN SMALL LIGATURE FI\r
330 0xDF    0xFB02  # LATIN SMALL LIGATURE FL\r
331 0xE0    0x2021  # DOUBLE DAGGER\r
332 0xE1    0x00B7  # MIDDLE DOT\r
333 0xE2    0x201A  # SINGLE LOW-9 QUOTATION MARK\r
334 0xE3    0x201E  # DOUBLE LOW-9 QUOTATION MARK\r
335 0xE4    0x2030  # PER MILLE SIGN\r
336 0xE5    0x00C2  # LATIN CAPITAL LETTER A WITH CIRCUMFLEX\r
337 0xE6    0x00CA  # LATIN CAPITAL LETTER E WITH CIRCUMFLEX\r
338 0xE7    0x00C1  # LATIN CAPITAL LETTER A WITH ACUTE\r
339 0xE8    0x00CB  # LATIN CAPITAL LETTER E WITH DIAERESIS\r
340 0xE9    0x00C8  # LATIN CAPITAL LETTER E WITH GRAVE\r
341 0xEA    0x00CD  # LATIN CAPITAL LETTER I WITH ACUTE\r
342 0xEB    0x00CE  # LATIN CAPITAL LETTER I WITH CIRCUMFLEX\r
343 0xEC    0x00CF  # LATIN CAPITAL LETTER I WITH DIAERESIS\r
344 0xED    0x00CC  # LATIN CAPITAL LETTER I WITH GRAVE\r
345 0xEE    0x00D3  # LATIN CAPITAL LETTER O WITH ACUTE\r
346 0xEF    0x00D4  # LATIN CAPITAL LETTER O WITH CIRCUMFLEX\r
347 0xF0    0xF8FF  # Apple logo\r
348 0xF1    0x00D2  # LATIN CAPITAL LETTER O WITH GRAVE\r
349 0xF2    0x00DA  # LATIN CAPITAL LETTER U WITH ACUTE\r
350 0xF3    0x00DB  # LATIN CAPITAL LETTER U WITH CIRCUMFLEX\r
351 0xF4    0x00D9  # LATIN CAPITAL LETTER U WITH GRAVE\r
352 0xF5    0x0131  # LATIN SMALL LETTER DOTLESS I\r
353 0xF6    0x02C6  # MODIFIER LETTER CIRCUMFLEX ACCENT\r
354 0xF7    0x02DC  # SMALL TILDE\r
355 0xF8    0x00AF  # MACRON\r
356 0xF9    0x02D8  # BREVE\r
357 0xFA    0x02D9  # DOT ABOVE\r
358 0xFB    0x02DA  # RING ABOVE\r
359 0xFC    0x00B8  # CEDILLA\r
360 0xFD    0x02DD  # DOUBLE ACUTE ACCENT\r
361 0xFE    0x02DB  # OGONEK\r
362 0xFF    0x02C7  # CARON\r