Umlaute raus!
[closure-html.git] / resources / encodings / apple / SYMBOL.TXT
blobcd320c6c9a0206aaec1db7922a82951f7be74d2e
1 #=======================================================================
2 #   FTP file name:  SYMBOL.TXT
4 #   Contents:       Map (external version) from Mac OS Symbol
5 #                   character set to Unicode 2.1
7 #   Copyright:      (c) 1994-1998 by Apple Computer, Inc., all rights
8 #                   reserved.
10 #   Contacts:       Peter Edberg <pedberg@apple.com>
11 #                   Julio Gonzalez <juliog@apple.com>
12 #                   John Jenkins <jenkins@apple.com>
14 #   Changes:
16 #       b02  1998-Aug-18    Add new mapping from 0xA0 to EURO SIGN.
17 #                           Matches internal utom<b3>, ufrm<b3>.
18 #       n05  1998-Feb-05    Update to match internal utom<n5>, ufrm<n15>
19 #                           and Text Encoding Converter version 1.3:
20 #                           Use standard Unicodes plus transcoding hints
21 #                           instead of single corporate characters, also
22 #                           change mappings for 0xE1 & 0xF1 from U+2329
23 #                           & U+232A to their canonical decompositions;
24 #                           see details below. Also update header
25 #                           comments to new format.
26 #       n03  1995-Apr-15    First version (after fixing some typos).
27 #                           Matches internal ufrm<n4>.
29 # Standard header:
30 # ----------------
32 #   Apple, the Apple logo, and Macintosh are trademarks of Apple
33 #   Computer, Inc., registered in the United States and other countries.
34 #   Unicode is a trademark of Unicode Inc. For the sake of brevity,
35 #   throughout this document, "Macintosh" can be used to refer to
36 #   Macintosh computers and "Unicode" can be used to refer to the
37 #   Unicode standard.
39 #   Apple makes no warranty or representation, either express or
40 #   implied, with respect to these tables, their quality, accuracy, or
41 #   fitness for a particular purpose. In no event will Apple be liable
42 #   for direct, indirect, special, incidental, or consequential damages 
43 #   resulting from any defect or inaccuracy in this document or the
44 #   accompanying tables.
46 #   These mapping tables and character lists are subject to change.
47 #   The latest tables should be available from the following:
49 #   <ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/APPLE/>
50 #   <ftp://dev.apple.com/devworld/Technical_Documentation/Misc._Standards/>
52 #   For general information about Mac OS encodings and these mapping
53 #   tables, see the file "README.TXT".
55 # Format:
56 # -------
58 #   Three tab-separated columns;
59 #   '#' begins a comment which continues to the end of the line.
60 #     Column #1 is the Mac OS Symbol code (in hex as 0xNN)
61 #     Column #2 is the corresponding Unicode or Unicode sequence
62 #       (in hex as 0xNNNN or 0xNNNN+0xNNNN).
63 #     Column #3 is a comment containing the Unicode name.
64 #       In some cases an additional comment follows the Unicode name.
66 #   The entries are in Mac OS Symbol code order.
68 #   Some of these mappings require the use of corporate characters.
69 #   See the file "CORPCHAR.TXT" and notes below.
71 #   Control character mappings are not shown in this table, following
72 #   the conventions of the standard UTC mapping tables. However, the
73 #   Mac OS Symbol character set uses the standard control characters
74 #   at 0x00-0x1F and 0x7F.
76 # Notes on Mac OS Symbol:
77 # -----------------------
79 #   The Mac OS Symbol encoding shares the script code smRoman
80 #   (0) with the Mac OS Roman encoding. To determine if the Symbol
81 #   encoding is being used, you must check if the font name is
82 #   "Symbol".
84 #   Before Mac OS 8.5, code point 0xA0 was unused. In Mac OS 8.5
85 #   and later versions, code point 0xA0 is EURO SIGN and maps to
86 #   U+20AC (the Symbol font is updated for Mac OS 8.5 to reflect
87 #   this). Note: U+20AC is new with Unicode 2.1; for earlier Unicode
88 #   versions, Mac OS Symbol 0xA0 may be mapped to private-use
89 #   character U+F8A0.
91 #   The layout of the Mac OS Symbol character set is identical to
92 #   the layout of the Adobe Symbol encoding vector, with the
93 #   addition of the Apple logo character at 0xF0.
95 #   This character set encodes a number of glyph fragments. Some are
96 #   used as extenders: 0x60 is used to extend radical signs, 0xBD and
97 #   0xBE are used to extend vertical and horizontal arrows, etc. In
98 #   addition, there are top, bottom, and center sections for
99 #   parentheses, brackets, integral signs, and other signs that may
100 #   extend vertically for 2 or more lines of normal text. In general,
101 #   Unicode does not encode such fragments, so these are mapping
102 #   using corporate-zone Unicode characters (see below).
104 #   In addition, Symbol separately encodes both serif and sans-serif
105 #   forms for copyright, trademark, and registered signs. Unicode
106 #   encodes only the abstract characters, so one set of these (the
107 #   sans-serif forms) are also mapped using corporate-zone Unicode
108 #   characters (see below).
110 #   The following code points are unused, and are not shown here:
111 #   0x80-0x9F, 0xFF.
113 # Unicode mapping issues and notes:
114 # ---------------------------------
116 #   The goals in the mappings provided here are:
117 #   - Ensure roundtrip mapping from every character in the Mac OS
118 #     Symbol character set to Unicode and back
119 #   - Use standard Unicode characters as much as possible, to
120 #     maximize interchangeability of the resulting Unicode text.
121 #     Whenever possible, avoid having content carried by private-use
122 #     characters.
124 #   Some of the characters in the Mac OS Symbol character set do not
125 #   correspond to distinct, single Unicode characters. To map these
126 #   and satisfy both goals above, we employ various strategies.
128 #   a) If possible, use private use characters in combination with
129 #   standard Unicode characters to mark variants of the standard
130 #   Unicode character.
132 #   Apple has defined a block of 32 corporate characters as "transcoding
133 #   hints." These are used in combination with standard Unicode characters
134 #   to force them to be treated in a special way for mapping to other
135 #   encodings; they have no other effect. Sixteen of these transcoding
136 #   hints are "grouping hints" - they indicate that the next 2-4 Unicode
137 #   characters should be treated as a single entity for transcoding. The
138 #   other sixteen transcoding hints are "variant tags" - they are like
139 #   combining characters, and can follow a standard Unicode (or a sequence
140 #   consisting of a base character and other combining characters) to
141 #   cause it to be treated in a special way for transcoding. These always
142 #   terminate a combining-character sequence.
144 #   The transcoding coding hints used in this mapping table are four
145 #   variant tags, 0xF870-72 and 0xF87F. Since these are combined with
146 #   standard Unicode characters, some characters in the Mac OS Symbol
147 #   character set map to a sequence of two Unicodes instead of a single
148 #   Unicode character.
150 #   For example, the Mac OS Symbol character at 0xE2 is an alternate,
151 #   sans-serif form of the REGISTERED SIGN (the standard mapping is for
152 #   the abstract character at 0xD2, which here has a serif form). So 0xE2
153 #   is mapped to 0x00AE (REGISTERED SIGN) + 0xF87F (a variant tag).
155 #   b) Otherwise, use private use characters by themselves to map
156 #   Mac OS Symbol characters which have no relationship to any standard
157 #   Unicode character.
159 #   The following additional corporate zone Unicode characters are
160 #   used for this purpose here:
162 #     0xF8E5  radical extender
163 #     0xF8E6  vertical arrow extender
164 #     0xF8E7  horizontal arrow extender
165 #     0xF8F4  curly bracket extender
166 #     0xF8FF  Apple logo
168 #   NOTE: The graphic image associated with the Apple logo character
169 #   is not authorized for use without permission of Apple, and
170 #   unauthorized use might constitute trademark infringement.
172 # Details of mapping changes in each version:
173 # -------------------------------------------
175 #   Changes from version n05 to version b02:
177 #   - 0xA0 now maps to 0x20AC, EURO SIGN; 0xA0 was unmapped in
178 #   earlier versions.
180 #   Changes from version n03 to version n05:
182 #       - Change strict mapping for 0xE1 & 0xF1 from U+2329 & U+232A
183 #     to their canonical decompositions, U+3008 & U+3009.
185 #   - Change mapping for the following to use standard Unicode +
186 #     transcoding hint, instead of single corporate-zone
187 #     character: 0xE2-0xE4, 0xE6-0xEE, 0xF4, 0xF6-0xFE.
189 ##################
191 0x20    0x0020  # SPACE
192 0x21    0x0021  # EXCLAMATION MARK
193 0x22    0x2200  # FOR ALL
194 0x23    0x0023  # NUMBER SIGN
195 0x24    0x2203  # THERE EXISTS
196 0x25    0x0025  # PERCENT SIGN
197 0x26    0x0026  # AMPERSAND
198 0x27    0x220D  # SMALL CONTAINS AS MEMBER
199 0x28    0x0028  # LEFT PARENTHESIS
200 0x29    0x0029  # RIGHT PARENTHESIS
201 0x2A    0x2217  # ASTERISK OPERATOR
202 0x2B    0x002B  # PLUS SIGN
203 0x2C    0x002C  # COMMA
204 0x2D    0x2212  # MINUS SIGN
205 0x2E    0x002E  # FULL STOP
206 0x2F    0x002F  # SOLIDUS
207 0x30    0x0030  # DIGIT ZERO
208 0x31    0x0031  # DIGIT ONE
209 0x32    0x0032  # DIGIT TWO
210 0x33    0x0033  # DIGIT THREE
211 0x34    0x0034  # DIGIT FOUR
212 0x35    0x0035  # DIGIT FIVE
213 0x36    0x0036  # DIGIT SIX
214 0x37    0x0037  # DIGIT SEVEN
215 0x38    0x0038  # DIGIT EIGHT
216 0x39    0x0039  # DIGIT NINE
217 0x3A    0x003A  # COLON
218 0x3B    0x003B  # SEMICOLON
219 0x3C    0x003C  # LESS-THAN SIGN
220 0x3D    0x003D  # EQUALS SIGN
221 0x3E    0x003E  # GREATER-THAN SIGN
222 0x3F    0x003F  # QUESTION MARK
223 0x40    0x2245  # APPROXIMATELY EQUAL TO
224 0x41    0x0391  # GREEK CAPITAL LETTER ALPHA
225 0x42    0x0392  # GREEK CAPITAL LETTER BETA
226 0x43    0x03A7  # GREEK CAPITAL LETTER CHI
227 0x44    0x0394  # GREEK CAPITAL LETTER DELTA
228 0x45    0x0395  # GREEK CAPITAL LETTER EPSILON
229 0x46    0x03A6  # GREEK CAPITAL LETTER PHI
230 0x47    0x0393  # GREEK CAPITAL LETTER GAMMA
231 0x48    0x0397  # GREEK CAPITAL LETTER ETA
232 0x49    0x0399  # GREEK CAPITAL LETTER IOTA
233 0x4A    0x03D1  # GREEK THETA SYMBOL
234 0x4B    0x039A  # GREEK CAPITAL LETTER KAPPA
235 0x4C    0x039B  # GREEK CAPITAL LETTER LAMDA
236 0x4D    0x039C  # GREEK CAPITAL LETTER MU
237 0x4E    0x039D  # GREEK CAPITAL LETTER NU
238 0x4F    0x039F  # GREEK CAPITAL LETTER OMICRON
239 0x50    0x03A0  # GREEK CAPITAL LETTER PI
240 0x51    0x0398  # GREEK CAPITAL LETTER THETA
241 0x52    0x03A1  # GREEK CAPITAL LETTER RHO
242 0x53    0x03A3  # GREEK CAPITAL LETTER SIGMA
243 0x54    0x03A4  # GREEK CAPITAL LETTER TAU
244 0x55    0x03A5  # GREEK CAPITAL LETTER UPSILON
245 0x56    0x03C2  # GREEK SMALL LETTER FINAL SIGMA
246 0x57    0x03A9  # GREEK CAPITAL LETTER OMEGA
247 0x58    0x039E  # GREEK CAPITAL LETTER XI
248 0x59    0x03A8  # GREEK CAPITAL LETTER PSI
249 0x5A    0x0396  # GREEK CAPITAL LETTER ZETA
250 0x5B    0x005B  # LEFT SQUARE BRACKET
251 0x5C    0x2234  # THEREFORE
252 0x5D    0x005D  # RIGHT SQUARE BRACKET
253 0x5E    0x22A5  # UP TACK
254 0x5F    0x005F  # LOW LINE
255 0x60    0xF8E5  # radical extender
256 0x61    0x03B1  # GREEK SMALL LETTER ALPHA
257 0x62    0x03B2  # GREEK SMALL LETTER BETA
258 0x63    0x03C7  # GREEK SMALL LETTER CHI
259 0x64    0x03B4  # GREEK SMALL LETTER DELTA
260 0x65    0x03B5  # GREEK SMALL LETTER EPSILON
261 0x66    0x03C6  # GREEK SMALL LETTER PHI
262 0x67    0x03B3  # GREEK SMALL LETTER GAMMA
263 0x68    0x03B7  # GREEK SMALL LETTER ETA
264 0x69    0x03B9  # GREEK SMALL LETTER IOTA
265 0x6A    0x03D5  # GREEK PHI SYMBOL
266 0x6B    0x03BA  # GREEK SMALL LETTER KAPPA
267 0x6C    0x03BB  # GREEK SMALL LETTER LAMDA
268 0x6D    0x03BC  # GREEK SMALL LETTER MU
269 0x6E    0x03BD  # GREEK SMALL LETTER NU
270 0x6F    0x03BF  # GREEK SMALL LETTER OMICRON
271 0x70    0x03C0  # GREEK SMALL LETTER PI
272 0x71    0x03B8  # GREEK SMALL LETTER THETA
273 0x72    0x03C1  # GREEK SMALL LETTER RHO
274 0x73    0x03C3  # GREEK SMALL LETTER SIGMA
275 0x74    0x03C4  # GREEK SMALL LETTER TAU
276 0x75    0x03C5  # GREEK SMALL LETTER UPSILON
277 0x76    0x03D6  # GREEK PI SYMBOL
278 0x77    0x03C9  # GREEK SMALL LETTER OMEGA
279 0x78    0x03BE  # GREEK SMALL LETTER XI
280 0x79    0x03C8  # GREEK SMALL LETTER PSI
281 0x7A    0x03B6  # GREEK SMALL LETTER ZETA
282 0x7B    0x007B  # LEFT CURLY BRACKET
283 0x7C    0x007C  # VERTICAL LINE
284 0x7D    0x007D  # RIGHT CURLY BRACKET
285 0x7E    0x223C  # TILDE OPERATOR
287 0xA0    0x20AC  # EURO SIGN
288 0xA1    0x03D2  # GREEK UPSILON WITH HOOK SYMBOL
289 0xA2    0x2032  # PRIME # minute
290 0xA3    0x2264  # LESS-THAN OR EQUAL TO
291 0xA4    0x2044  # FRACTION SLASH
292 0xA5    0x221E  # INFINITY
293 0xA6    0x0192  # LATIN SMALL LETTER F WITH HOOK
294 0xA7    0x2663  # BLACK CLUB SUIT
295 0xA8    0x2666  # BLACK DIAMOND SUIT
296 0xA9    0x2665  # BLACK HEART SUIT
297 0xAA    0x2660  # BLACK SPADE SUIT
298 0xAB    0x2194  # LEFT RIGHT ARROW
299 0xAC    0x2190  # LEFTWARDS ARROW
300 0xAD    0x2191  # UPWARDS ARROW
301 0xAE    0x2192  # RIGHTWARDS ARROW
302 0xAF    0x2193  # DOWNWARDS ARROW
303 0xB0    0x00B0  # DEGREE SIGN
304 0xB1    0x00B1  # PLUS-MINUS SIGN
305 0xB2    0x2033  # DOUBLE PRIME  # second
306 0xB3    0x2265  # GREATER-THAN OR EQUAL TO
307 0xB4    0x00D7  # MULTIPLICATION SIGN
308 0xB5    0x221D  # PROPORTIONAL TO
309 0xB6    0x2202  # PARTIAL DIFFERENTIAL
310 0xB7    0x2022  # BULLET
311 0xB8    0x00F7  # DIVISION SIGN
312 0xB9    0x2260  # NOT EQUAL TO
313 0xBA    0x2261  # IDENTICAL TO
314 0xBB    0x2248  # ALMOST EQUAL TO
315 0xBC    0x2026  # HORIZONTAL ELLIPSIS
316 0xBD    0xF8E6  # vertical arrow extender
317 0xBE    0xF8E7  # horizontal arrow extender
318 0xBF    0x21B5  # DOWNWARDS ARROW WITH CORNER LEFTWARDS
319 0xC0    0x2135  # ALEF SYMBOL
320 0xC1    0x2111  # BLACK-LETTER CAPITAL I
321 0xC2    0x211C  # BLACK-LETTER CAPITAL R
322 0xC3    0x2118  # SCRIPT CAPITAL P
323 0xC4    0x2297  # CIRCLED TIMES
324 0xC5    0x2295  # CIRCLED PLUS
325 0xC6    0x2205  # EMPTY SET
326 0xC7    0x2229  # INTERSECTION
327 0xC8    0x222A  # UNION
328 0xC9    0x2283  # SUPERSET OF
329 0xCA    0x2287  # SUPERSET OF OR EQUAL TO
330 0xCB    0x2284  # NOT A SUBSET OF
331 0xCC    0x2282  # SUBSET OF
332 0xCD    0x2286  # SUBSET OF OR EQUAL TO
333 0xCE    0x2208  # ELEMENT OF
334 0xCF    0x2209  # NOT AN ELEMENT OF
335 0xD0    0x2220  # ANGLE
336 0xD1    0x2207  # NABLA
337 0xD2    0x00AE  # REGISTERED SIGN       # serif
338 0xD3    0x00A9  # COPYRIGHT SIGN        # serif
339 0xD4    0x2122  # TRADE MARK SIGN       # serif
340 0xD5    0x220F  # N-ARY PRODUCT
341 0xD6    0x221A  # SQUARE ROOT
342 0xD7    0x22C5  # DOT OPERATOR
343 0xD8    0x00AC  # NOT SIGN
344 0xD9    0x2227  # LOGICAL AND
345 0xDA    0x2228  # LOGICAL OR
346 0xDB    0x21D4  # LEFT RIGHT DOUBLE ARROW
347 0xDC    0x21D0  # LEFTWARDS DOUBLE ARROW
348 0xDD    0x21D1  # UPWARDS DOUBLE ARROW
349 0xDE    0x21D2  # RIGHTWARDS DOUBLE ARROW
350 0xDF    0x21D3  # DOWNWARDS DOUBLE ARROW
351 0xE0    0x22C4  # DIAMOND OPERATOR
352 0xE1    0x3008  # LEFT ANGLE BRACKET
353 0xE2    0x00AE+0xF87F   # REGISTERED SIGN, alternate (sans serif)
354 0xE3    0x00A9+0xF87F   # COPYRIGHT SIGN, alternate (sans serif)
355 0xE4    0x2122+0xF87F   # TRADE MARK SIGN, alternate (sans serif)
356 0xE5    0x2211  # N-ARY SUMMATION
357 0xE6    0x0028+0xF870   # LEFT PARENTHESIS, fragment (top)
358 0xE7    0x0028+0xF871   # LEFT PARENTHESIS, fragment (extender)
359 0xE8    0x0028+0xF872   # LEFT PARENTHESIS, fragment (bottom)
360 0xE9    0x005B+0xF870   # LEFT SQUARE BRACKET, fragment (top)
361 0xEA    0x005B+0xF871   # LEFT SQUARE BRACKET, fragment (extender)
362 0xEB    0x005B+0xF872   # LEFT SQUARE BRACKET, fragment (bottom)
363 0xEC    0x007B+0xF870   # LEFT CURLY BRACKET, fragment (top)
364 0xED    0x007B+0xF871   # LEFT CURLY BRACKET, fragment (center)
365 0xEE    0x007B+0xF872   # LEFT CURLY BRACKET, fragment (bottom)
366 0xEF    0xF8F4  # curly bracket extender
367 0xF0    0xF8FF  # Apple logo
368 0xF1    0x3009  # RIGHT ANGLE BRACKET
369 0xF2    0x222B  # INTEGRAL
370 0xF3    0x2320  # TOP HALF INTEGRAL
371 0xF4    0x222B+0xF871   # INTEGRAL, fragment (extender)
372 0xF5    0x2321  # BOTTOM HALF INTEGRAL
373 0xF6    0x0029+0xF870   # RIGHT PARENTHESIS, fragment (top)
374 0xF7    0x0029+0xF871   # RIGHT PARENTHESIS, fragment (extender)
375 0xF8    0x0029+0xF872   # RIGHT PARENTHESIS, fragment (bottom)
376 0xF9    0x005D+0xF870   # RIGHT SQUARE BRACKET, fragment (top)
377 0xFA    0x005D+0xF871   # RIGHT SQUARE BRACKET, fragment (extender)
378 0xFB    0x005D+0xF872   # RIGHT SQUARE BRACKET, fragment (bottom)
379 0xFC    0x007D+0xF870   # RIGHT CURLY BRACKET, fragment (top)
380 0xFD    0x007D+0xF871   # RIGHT CURLY BRACKET, fragment (center)
381 0xFE    0x007D+0xF872   # RIGHT CURLY BRACKET, fragment (bottom)