Umlaute raus!
[closure-html.git] / resources / encodings / apple / THAI.TXT
blob8330114045c8908c995fd7ff6b0828d8674db737
1 #=======================================================================
2 #   FTP file name:  THAI.TXT
4 #   Contents:       Map (external version) from Mac OS Thai
5 #                   character set to Unicode 2.0
7 #   Copyright:      (c) 1995-1998 by Apple Computer, Inc., all rights
8 #                   reserved.
10 #   Contacts:       Peter Edberg <pedberg@apple.com>
11 #                   Julio Gonzalez <juliog@apple.com>
12 #                   John Jenkins <jenkins@apple.com>
14 #   Changes:
16 #       n07  1998-Feb-05    Update to match internal utom<5>, ufrm<13>
17 #                           and Text Encoding Converter version 1.3:
18 #                           Use standard Unicodes plus transcoding hints
19 #                           instead of single corporate characters; see
20 #                           details below. Also update header comments
21 #                           to new format.
22 #       n04  1995-Nov-17    First version (after fixing some typos).
23 #                           Matches internal ufrm<6>.
25 # Standard header:
26 # ----------------
28 #   Apple, the Apple logo, and Macintosh are trademarks of Apple
29 #   Computer, Inc., registered in the United States and other countries.
30 #   Unicode is a trademark of Unicode Inc. For the sake of brevity,
31 #   throughout this document, "Macintosh" can be used to refer to
32 #   Macintosh computers and "Unicode" can be used to refer to the
33 #   Unicode standard.
35 #   Apple makes no warranty or representation, either express or
36 #   implied, with respect to these tables, their quality, accuracy, or
37 #   fitness for a particular purpose. In no event will Apple be liable
38 #   for direct, indirect, special, incidental, or consequential damages 
39 #   resulting from any defect or inaccuracy in this document or the
40 #   accompanying tables.
42 #   These mapping tables and character lists are subject to change.
43 #   The latest tables should be available from the following:
45 #   <ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/APPLE/>
46 #   <ftp://dev.apple.com/devworld/Technical_Documentation/Misc._Standards/>
48 #   For general information about Mac OS encodings and these mapping
49 #   tables, see the file "README.TXT".
51 # Format:
52 # -------
54 #   Three tab-separated columns;
55 #   '#' begins a comment which continues to the end of the line.
56 #     Column #1 is the Mac OS Thai code (in hex as 0xNN)
57 #     Column #2 is the corresponding Unicode or Unicode sequence
58 #       (in hex as 0xNNNN or 0xNNNN+0xNNNN).
59 #     Column #3 is a comment containing the Unicode name
61 #   The entries are in Mac OS Thai code order.
63 #   Some of these mappings require the use of corporate characters.
64 #   See the file "CORPCHAR.TXT" and notes below.
66 #   Control character mappings are not shown in this table, following
67 #   the conventions of the standard UTC mapping tables. However, the
68 #   Mac OS Thai character set uses the standard control characters at
69 #   0x00-0x1F and 0x7F.
71 # Notes on Mac OS Thai:
72 # ---------------------
74 #   Codes 0xA1-0xDA and 0xDF-0xFB are the character set from Thai
75 #   standard TIS 620-2533, except that the following changes are
76 #   made:
77 #     0xEE is TRADE MARK SIGN (instead of THAI CHARACTER YAMAKKAN)
78 #     0xFA is REGISTERED SIGN (instead of THAI CHARACTER ANGKHANKHU)
79 #     0xFB is COPYRIGHT SIGN (instead of THAI CHARACTER KHOMUT)
81 #   Codes 0x80-0x82, 0x8D-0x8E, 0x91, 0x9D-0x9E, and 0xDB-0xDE are
82 #   various additional punctuation marks (e.g. curly quotes,
83 #   ellipsis), no-break space, and two special characters "word join"
84 #   and "word break".
86 #   Codes 0x83-0x8C, 0x8F, and 0x92-0x9C are for positional variants
87 #   of the upper vowels, tone marks, and other signs at 0xD1,
88 #   0xD4-0xD7, and 0xE7-0xED. The positional variants would normally
89 #   be considered presentation forms only and not characters. In most
90 #   cases they are not typed directly; they are selected automatically
91 #   at display time by the WorldScript software. However, using the
92 #   Thai-DTP keyboard, the presentation forms can in fact be typed
93 #   directly using dead keys. Thus they must be treated as real
94 #   characters in the Mac OS Thai encoding. They are mapped using
95 #   variant tags; see below.
97 #   Several code points are undefined and unused (they cannot be
98 #   typed using any of the Mac OS Thai keyboard layouts): 0x90, 0x9F,
99 #   0xFC-0xFE. These are not shown in the table below.
101 # Unicode mapping issues and notes:
102 # ---------------------------------
104 #   The goals in the Apple mappings provided here are:
105 #   - Ensure roundtrip mapping from every character in the Mac OS Thai
106 #   character set to Unicode and back
107 #   - Use standard Unicode characters as much as possible, to maximize
108 #   interchangeability of the resulting Unicode text. Whenever possible,
109 #   avoid having content carried by private-use characters.
111 #   To satisfy both goals, we use private use characters to mark variants
112 #   that are similar to a sequence of one or more standard Unicode
113 #   characters.
115 #   Apple has defined a block of 32 corporate characters as "transcoding
116 #   hints." These are used in combination with standard Unicode characters
117 #   to force them to be treated in a special way for mapping to other
118 #   encodings; they have no other effect. Sixteen of these transcoding
119 #   hints are "grouping hints" - they indicate that the next 2-4 Unicode
120 #   characters should be treated as a single entity for transcoding. The
121 #   other sixteen transcoding hints are "variant tags" - they are like
122 #   combining characters, and can follow a standard Unicode (or a sequence
123 #   consisting of a base character and other combining characters) to
124 #   cause it to be treated in a special way for transcoding. These always
125 #   terminate a combining-character sequence.
127 #   The transcoding coding hints used in this mapping table are four
128 #   variant tags in the range 0xF873-75. Since these are combined with
129 #   standard Unicode characters, some characters in the Mac OS Thai
130 #   character set map to a sequence of two Unicodes instead of a single
131 #   Unicode character. For example, the Mac OS Thai character at 0x83 is a
132 #   low-left positional variant of THAI CHARACTER MAI EK (the standard
133 #   mapping is for the abstract character at 0xE8). So 0x83 is mapped to
134 #   0x0E48 (THAI CHARACTER MAI EK) + 0xF875 (a variant tag).
136 # Details of mapping changes in each version:
137 # -------------------------------------------
139 #   Changes from version n04 to version n07:
141 #   - Changed mappings of the positional variants to use standard
142 #   Unicodes + transcoding hint, instead of using single corporate
143 #   zone characters. This affected the mappings for the following:
144 #   0x83-08C, 0x8F, 0x92-0x9C
146 #   - Just comment out unused code points in the table, instead
147 #   of mapping them to U+FFFD.
149 ##################
151 0x20    0x0020  # SPACE
152 0x21    0x0021  # EXCLAMATION MARK
153 0x22    0x0022  # QUOTATION MARK
154 0x23    0x0023  # NUMBER SIGN
155 0x24    0x0024  # DOLLAR SIGN
156 0x25    0x0025  # PERCENT SIGN
157 0x26    0x0026  # AMPERSAND
158 0x27    0x0027  # APOSTROPHE
159 0x28    0x0028  # LEFT PARENTHESIS
160 0x29    0x0029  # RIGHT PARENTHESIS
161 0x2A    0x002A  # ASTERISK
162 0x2B    0x002B  # PLUS SIGN
163 0x2C    0x002C  # COMMA
164 0x2D    0x002D  # HYPHEN-MINUS
165 0x2E    0x002E  # FULL STOP
166 0x2F    0x002F  # SOLIDUS
167 0x30    0x0030  # DIGIT ZERO
168 0x31    0x0031  # DIGIT ONE
169 0x32    0x0032  # DIGIT TWO
170 0x33    0x0033  # DIGIT THREE
171 0x34    0x0034  # DIGIT FOUR
172 0x35    0x0035  # DIGIT FIVE
173 0x36    0x0036  # DIGIT SIX
174 0x37    0x0037  # DIGIT SEVEN
175 0x38    0x0038  # DIGIT EIGHT
176 0x39    0x0039  # DIGIT NINE
177 0x3A    0x003A  # COLON
178 0x3B    0x003B  # SEMICOLON
179 0x3C    0x003C  # LESS-THAN SIGN
180 0x3D    0x003D  # EQUALS SIGN
181 0x3E    0x003E  # GREATER-THAN SIGN
182 0x3F    0x003F  # QUESTION MARK
183 0x40    0x0040  # COMMERCIAL AT
184 0x41    0x0041  # LATIN CAPITAL LETTER A
185 0x42    0x0042  # LATIN CAPITAL LETTER B
186 0x43    0x0043  # LATIN CAPITAL LETTER C
187 0x44    0x0044  # LATIN CAPITAL LETTER D
188 0x45    0x0045  # LATIN CAPITAL LETTER E
189 0x46    0x0046  # LATIN CAPITAL LETTER F
190 0x47    0x0047  # LATIN CAPITAL LETTER G
191 0x48    0x0048  # LATIN CAPITAL LETTER H
192 0x49    0x0049  # LATIN CAPITAL LETTER I
193 0x4A    0x004A  # LATIN CAPITAL LETTER J
194 0x4B    0x004B  # LATIN CAPITAL LETTER K
195 0x4C    0x004C  # LATIN CAPITAL LETTER L
196 0x4D    0x004D  # LATIN CAPITAL LETTER M
197 0x4E    0x004E  # LATIN CAPITAL LETTER N
198 0x4F    0x004F  # LATIN CAPITAL LETTER O
199 0x50    0x0050  # LATIN CAPITAL LETTER P
200 0x51    0x0051  # LATIN CAPITAL LETTER Q
201 0x52    0x0052  # LATIN CAPITAL LETTER R
202 0x53    0x0053  # LATIN CAPITAL LETTER S
203 0x54    0x0054  # LATIN CAPITAL LETTER T
204 0x55    0x0055  # LATIN CAPITAL LETTER U
205 0x56    0x0056  # LATIN CAPITAL LETTER V
206 0x57    0x0057  # LATIN CAPITAL LETTER W
207 0x58    0x0058  # LATIN CAPITAL LETTER X
208 0x59    0x0059  # LATIN CAPITAL LETTER Y
209 0x5A    0x005A  # LATIN CAPITAL LETTER Z
210 0x5B    0x005B  # LEFT SQUARE BRACKET
211 0x5C    0x005C  # REVERSE SOLIDUS
212 0x5D    0x005D  # RIGHT SQUARE BRACKET
213 0x5E    0x005E  # CIRCUMFLEX ACCENT
214 0x5F    0x005F  # LOW LINE
215 0x60    0x0060  # GRAVE ACCENT
216 0x61    0x0061  # LATIN SMALL LETTER A
217 0x62    0x0062  # LATIN SMALL LETTER B
218 0x63    0x0063  # LATIN SMALL LETTER C
219 0x64    0x0064  # LATIN SMALL LETTER D
220 0x65    0x0065  # LATIN SMALL LETTER E
221 0x66    0x0066  # LATIN SMALL LETTER F
222 0x67    0x0067  # LATIN SMALL LETTER G
223 0x68    0x0068  # LATIN SMALL LETTER H
224 0x69    0x0069  # LATIN SMALL LETTER I
225 0x6A    0x006A  # LATIN SMALL LETTER J
226 0x6B    0x006B  # LATIN SMALL LETTER K
227 0x6C    0x006C  # LATIN SMALL LETTER L
228 0x6D    0x006D  # LATIN SMALL LETTER M
229 0x6E    0x006E  # LATIN SMALL LETTER N
230 0x6F    0x006F  # LATIN SMALL LETTER O
231 0x70    0x0070  # LATIN SMALL LETTER P
232 0x71    0x0071  # LATIN SMALL LETTER Q
233 0x72    0x0072  # LATIN SMALL LETTER R
234 0x73    0x0073  # LATIN SMALL LETTER S
235 0x74    0x0074  # LATIN SMALL LETTER T
236 0x75    0x0075  # LATIN SMALL LETTER U
237 0x76    0x0076  # LATIN SMALL LETTER V
238 0x77    0x0077  # LATIN SMALL LETTER W
239 0x78    0x0078  # LATIN SMALL LETTER X
240 0x79    0x0079  # LATIN SMALL LETTER Y
241 0x7A    0x007A  # LATIN SMALL LETTER Z
242 0x7B    0x007B  # LEFT CURLY BRACKET
243 0x7C    0x007C  # VERTICAL LINE
244 0x7D    0x007D  # RIGHT CURLY BRACKET
245 0x7E    0x007E  # TILDE
247 0x80    0x00AB  # LEFT-POINTING DOUBLE ANGLE QUOTATION MARK
248 0x81    0x00BB  # RIGHT-POINTING DOUBLE ANGLE QUOTATION MARK
249 0x82    0x2026  # HORIZONTAL ELLIPSIS
250 0x83    0x0E48+0xF875   # THAI CHARACTER MAI EK, low left position
251 0x84    0x0E49+0xF875   # THAI CHARACTER MAI THO, low left position
252 0x85    0x0E4A+0xF875   # THAI CHARACTER MAI TRI, low left position
253 0x86    0x0E4B+0xF875   # THAI CHARACTER MAI CHATTAWA, low left position
254 0x87    0x0E4C+0xF875   # THAI CHARACTER THANTHAKHAT, low left position
255 0x88    0x0E48+0xF873   # THAI CHARACTER MAI EK, low position
256 0x89    0x0E49+0xF873   # THAI CHARACTER MAI THO, low position
257 0x8A    0x0E4A+0xF873   # THAI CHARACTER MAI TRI, low position
258 0x8B    0x0E4B+0xF873   # THAI CHARACTER MAI CHATTAWA, low position
259 0x8C    0x0E4C+0xF873   # THAI CHARACTER THANTHAKHAT, low position
260 0x8D    0x201C  # LEFT DOUBLE QUOTATION MARK
261 0x8E    0x201D  # RIGHT DOUBLE QUOTATION MARK
262 0x8F    0x0E4D+0xF874   # THAI CHARACTER NIKHAHIT, left position
264 0x91    0x2022  # BULLET
265 0x92    0x0E31+0xF874   # THAI CHARACTER MAI HAN-AKAT, left position
266 0x93    0x0E47+0xF874   # THAI CHARACTER MAITAIKHU, left position
267 0x94    0x0E34+0xF874   # THAI CHARACTER SARA I, left position  
268 0x95    0x0E35+0xF874   # THAI CHARACTER SARA II, left position
269 0x96    0x0E36+0xF874   # THAI CHARACTER SARA UE, left position
270 0x97    0x0E37+0xF874   # THAI CHARACTER SARA UEE, left position
271 0x98    0x0E48+0xF874   # THAI CHARACTER MAI EK, left position
272 0x99    0x0E49+0xF874   # THAI CHARACTER MAI THO, left position
273 0x9A    0x0E4A+0xF874   # THAI CHARACTER MAI TRI, left position
274 0x9B    0x0E4B+0xF874   # THAI CHARACTER MAI CHATTAWA, left position
275 0x9C    0x0E4C+0xF874   # THAI CHARACTER THANTHAKHAT, left position
276 0x9D    0x2018  # LEFT SINGLE QUOTATION MARK
277 0x9E    0x2019  # RIGHT SINGLE QUOTATION MARK
279 0xA0    0x00A0  # NO-BREAK SPACE
280 0xA1    0x0E01  # THAI CHARACTER KO KAI
281 0xA2    0x0E02  # THAI CHARACTER KHO KHAI
282 0xA3    0x0E03  # THAI CHARACTER KHO KHUAT
283 0xA4    0x0E04  # THAI CHARACTER KHO KHWAI
284 0xA5    0x0E05  # THAI CHARACTER KHO KHON
285 0xA6    0x0E06  # THAI CHARACTER KHO RAKHANG
286 0xA7    0x0E07  # THAI CHARACTER NGO NGU
287 0xA8    0x0E08  # THAI CHARACTER CHO CHAN
288 0xA9    0x0E09  # THAI CHARACTER CHO CHING
289 0xAA    0x0E0A  # THAI CHARACTER CHO CHANG
290 0xAB    0x0E0B  # THAI CHARACTER SO SO
291 0xAC    0x0E0C  # THAI CHARACTER CHO CHOE
292 0xAD    0x0E0D  # THAI CHARACTER YO YING
293 0xAE    0x0E0E  # THAI CHARACTER DO CHADA
294 0xAF    0x0E0F  # THAI CHARACTER TO PATAK
295 0xB0    0x0E10  # THAI CHARACTER THO THAN
296 0xB1    0x0E11  # THAI CHARACTER THO NANGMONTHO
297 0xB2    0x0E12  # THAI CHARACTER THO PHUTHAO
298 0xB3    0x0E13  # THAI CHARACTER NO NEN
299 0xB4    0x0E14  # THAI CHARACTER DO DEK
300 0xB5    0x0E15  # THAI CHARACTER TO TAO
301 0xB6    0x0E16  # THAI CHARACTER THO THUNG
302 0xB7    0x0E17  # THAI CHARACTER THO THAHAN
303 0xB8    0x0E18  # THAI CHARACTER THO THONG
304 0xB9    0x0E19  # THAI CHARACTER NO NU
305 0xBA    0x0E1A  # THAI CHARACTER BO BAIMAI
306 0xBB    0x0E1B  # THAI CHARACTER PO PLA
307 0xBC    0x0E1C  # THAI CHARACTER PHO PHUNG
308 0xBD    0x0E1D  # THAI CHARACTER FO FA
309 0xBE    0x0E1E  # THAI CHARACTER PHO PHAN
310 0xBF    0x0E1F  # THAI CHARACTER FO FAN
311 0xC0    0x0E20  # THAI CHARACTER PHO SAMPHAO
312 0xC1    0x0E21  # THAI CHARACTER MO MA
313 0xC2    0x0E22  # THAI CHARACTER YO YAK
314 0xC3    0x0E23  # THAI CHARACTER RO RUA
315 0xC4    0x0E24  # THAI CHARACTER RU
316 0xC5    0x0E25  # THAI CHARACTER LO LING
317 0xC6    0x0E26  # THAI CHARACTER LU
318 0xC7    0x0E27  # THAI CHARACTER WO WAEN
319 0xC8    0x0E28  # THAI CHARACTER SO SALA
320 0xC9    0x0E29  # THAI CHARACTER SO RUSI
321 0xCA    0x0E2A  # THAI CHARACTER SO SUA
322 0xCB    0x0E2B  # THAI CHARACTER HO HIP
323 0xCC    0x0E2C  # THAI CHARACTER LO CHULA
324 0xCD    0x0E2D  # THAI CHARACTER O ANG
325 0xCE    0x0E2E  # THAI CHARACTER HO NOKHUK
326 0xCF    0x0E2F  # THAI CHARACTER PAIYANNOI
327 0xD0    0x0E30  # THAI CHARACTER SARA A
328 0xD1    0x0E31  # THAI CHARACTER MAI HAN-AKAT
329 0xD2    0x0E32  # THAI CHARACTER SARA AA
330 0xD3    0x0E33  # THAI CHARACTER SARA AM
331 0xD4    0x0E34  # THAI CHARACTER SARA I
332 0xD5    0x0E35  # THAI CHARACTER SARA II
333 0xD6    0x0E36  # THAI CHARACTER SARA UE
334 0xD7    0x0E37  # THAI CHARACTER SARA UEE
335 0xD8    0x0E38  # THAI CHARACTER SARA U
336 0xD9    0x0E39  # THAI CHARACTER SARA UU
337 0xDA    0x0E3A  # THAI CHARACTER PHINTHU
338 0xDB    0xFEFF  # ZERO WIDTH NO-BREAK SPACE
339 0xDC    0x200B  # ZERO WIDTH SPACE
340 0xDD    0x2013  # EN DASH
341 0xDE    0x2014  # EM DASH
342 0xDF    0x0E3F  # THAI CURRENCY SYMBOL BAHT
343 0xE0    0x0E40  # THAI CHARACTER SARA E
344 0xE1    0x0E41  # THAI CHARACTER SARA AE
345 0xE2    0x0E42  # THAI CHARACTER SARA O
346 0xE3    0x0E43  # THAI CHARACTER SARA AI MAIMUAN
347 0xE4    0x0E44  # THAI CHARACTER SARA AI MAIMALAI
348 0xE5    0x0E45  # THAI CHARACTER LAKKHANGYAO
349 0xE6    0x0E46  # THAI CHARACTER MAIYAMOK
350 0xE7    0x0E47  # THAI CHARACTER MAITAIKHU
351 0xE8    0x0E48  # THAI CHARACTER MAI EK
352 0xE9    0x0E49  # THAI CHARACTER MAI THO
353 0xEA    0x0E4A  # THAI CHARACTER MAI TRI
354 0xEB    0x0E4B  # THAI CHARACTER MAI CHATTAWA
355 0xEC    0x0E4C  # THAI CHARACTER THANTHAKHAT
356 0xED    0x0E4D  # THAI CHARACTER NIKHAHIT
357 0xEE    0x2122  # TRADE MARK SIGN
358 0xEF    0x0E4F  # THAI CHARACTER FONGMAN
359 0xF0    0x0E50  # THAI DIGIT ZERO
360 0xF1    0x0E51  # THAI DIGIT ONE
361 0xF2    0x0E52  # THAI DIGIT TWO
362 0xF3    0x0E53  # THAI DIGIT THREE
363 0xF4    0x0E54  # THAI DIGIT FOUR
364 0xF5    0x0E55  # THAI DIGIT FIVE
365 0xF6    0x0E56  # THAI DIGIT SIX
366 0xF7    0x0E57  # THAI DIGIT SEVEN
367 0xF8    0x0E58  # THAI DIGIT EIGHT
368 0xF9    0x0E59  # THAI DIGIT NINE
369 0xFA    0x00AE  # REGISTERED SIGN
370 0xFB    0x00A9  # COPYRIGHT SIGN