* groff.texinfo: Document special behaviour of `.vs 0'.
[s-roff.git] / src / roff / troff / glyphuni.cpp
blob7e242ce20507d3d1d143c6163921a1a898778951
1 // -*- C++ -*-
2 /* Copyright (C) 2002, 2003
3 Free Software Foundation, Inc.
4 Written by Werner Lemberg <wl@gnu.org>
6 This file is part of groff.
8 groff is free software; you can redistribute it and/or modify it under
9 the terms of the GNU General Public License as published by the Free
10 Software Foundation; either version 2, or (at your option) any later
11 version.
13 groff is distributed in the hope that it will be useful, but WITHOUT ANY
14 WARRANTY; without even the implied warranty of MERCHANTABILITY or
15 FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License
16 for more details.
18 You should have received a copy of the GNU General Public License along
19 with groff; see the file COPYING. If not, write to the Free Software
20 Foundation, 59 Temple Place - Suite 330, Boston, MA 02111-1307, USA. */
22 #include "lib.h"
23 #include "stringclass.h"
24 #include "ptable.h"
26 #include "unicode.h"
28 struct glyph_to_unicode {
29 char *value;
32 declare_ptable(glyph_to_unicode)
33 implement_ptable(glyph_to_unicode)
35 PTABLE(glyph_to_unicode) glyph_to_unicode_table;
37 struct {
38 const char *key;
39 const char *value;
40 } glyph_to_unicode_list[] = {
41 { "!", "0021" },
42 { "\"", "0022" },
43 { "dq", "0022" },
44 { "#", "0023" },
45 { "sh", "0023" },
46 { "$", "0024" },
47 { "Do", "0024" },
48 { "%", "0025" },
49 { "&", "0026" },
50 { "aq", "0027" },
51 { "(", "0028" },
52 { ")", "0029" },
53 { "*", "002A" },
54 { "+", "002B" },
55 { "pl", "002B" },
56 { ",", "002C" },
57 { ".", "002E" },
58 { "/", "002F" },
59 { "sl", "002F" },
60 { "0", "0030" },
61 { "1", "0031" },
62 { "2", "0032" },
63 { "3", "0033" },
64 { "4", "0034" },
65 { "5", "0035" },
66 { "6", "0036" },
67 { "7", "0037" },
68 { "8", "0038" },
69 { "9", "0039" },
70 { ":", "003A" },
71 { ";", "003B" },
72 { "<", "003C" },
73 { "=", "003D" },
74 { "eq", "003D" },
75 { ">", "003E" },
76 { "?", "003F" },
77 { "@", "0040" },
78 { "at", "0040" },
79 { "A", "0041" },
80 { "B", "0042" },
81 { "C", "0043" },
82 { "D", "0044" },
83 { "E", "0045" },
84 { "F", "0046" },
85 { "G", "0047" },
86 { "H", "0048" },
87 { "I", "0049" },
88 { "J", "004A" },
89 { "K", "004B" },
90 { "L", "004C" },
91 { "M", "004D" },
92 { "N", "004E" },
93 { "O", "004F" },
94 { "P", "0050" },
95 { "Q", "0051" },
96 { "R", "0052" },
97 { "S", "0053" },
98 { "T", "0054" },
99 { "U", "0055" },
100 { "V", "0056" },
101 { "W", "0057" },
102 { "X", "0058" },
103 { "Y", "0059" },
104 { "Z", "005A" },
105 //{ "[", "005B" },
106 { "lB", "005B" },
107 //{ "\\", "005C" },
108 { "rs", "005C" },
109 //{ "]", "005D" },
110 { "rB", "005D" },
111 { "a^", "005E" },
112 { "^", "005E" },
113 { "ha", "005E" },
114 { "_", "005F" },
115 { "ru", "005F" },
116 { "ul", "005F" },
117 //{ "\\`", "0060" },
118 { "ga", "0060" },
119 { "a", "0061" },
120 { "b", "0062" },
121 { "c", "0063" },
122 { "d", "0064" },
123 { "e", "0065" },
124 { "f", "0066" },
125 { "ff", "0066_0066" },
126 { "Fi", "0066_0066_0069" },
127 { "Fl", "0066_0066_006C" },
128 { "fi", "0066_0069" },
129 { "fl", "0066_006C" },
130 { "g", "0067" },
131 { "h", "0068" },
132 { "i", "0069" },
133 { "j", "006A" },
134 { "k", "006B" },
135 { "l", "006C" },
136 { "m", "006D" },
137 { "n", "006E" },
138 { "o", "006F" },
139 { "p", "0070" },
140 { "q", "0071" },
141 { "r", "0072" },
142 { "s", "0073" },
143 { "t", "0074" },
144 { "u", "0075" },
145 { "v", "0076" },
146 { "w", "0077" },
147 { "x", "0078" },
148 { "y", "0079" },
149 { "z", "007A" },
150 { "lC", "007B" },
151 { "{", "007B" },
152 { "ba", "007C" },
153 { "or", "007C" },
154 { "|", "007C" },
155 { "rC", "007D" },
156 { "}", "007D" },
157 { "a~", "007E" },
158 { "~", "007E" },
159 { "ti", "007E" },
160 { "r!", "00A1" },
161 { "ct", "00A2" },
162 { "Po", "00A3" },
163 { "Cs", "00A4" },
164 { "Ye", "00A5" },
165 { "bb", "00A6" },
166 { "sc", "00A7" },
167 { "ad", "00A8" },
168 { "co", "00A9" },
169 { "Of", "00AA" },
170 { "Fo", "00AB" },
171 { "no", "00AC" },
172 { "tno", "00AC" },
173 { "shc", "00AD" },
174 { "rg", "00AE" },
175 { "a-", "00AF" },
176 { "de", "00B0" },
177 { "+-", "00B1" },
178 { "t+-", "00B1" },
179 { "S2", "00B2" },
180 { "S3", "00B3" },
181 { "aa", "00B4" },
182 //{ "\\'", "00B4" },
183 { "mc", "00B5" },
184 { "ps", "00B6" },
185 { "pc", "00B7" },
186 { "ac", "00B8" },
187 { "S1", "00B9" },
188 { "Om", "00BA" },
189 { "Fc", "00BB" },
190 { "14", "00BC" },
191 { "12", "00BD" },
192 { "34", "00BE" },
193 { "r?", "00BF" },
194 { "`A", "00C0" },
195 { "'A", "00C1" },
196 { "^A", "00C2" },
197 { "~A", "00C3" },
198 { ":A", "00C4" },
199 { "oA", "00C5" },
200 { "AE", "00C6" },
201 { ",C", "00C7" },
202 { "`E", "00C8" },
203 { "'E", "00C9" },
204 { "^E", "00CA" },
205 { ":E", "00CB" },
206 { "`I", "00CC" },
207 { "'I", "00CD" },
208 { "^I", "00CE" },
209 { ":I", "00CF" },
210 { "-D", "00D0" },
211 { "~N", "00D1" },
212 { "`O", "00D2" },
213 { "'O", "00D3" },
214 { "^O", "00D4" },
215 { "~O", "00D5" },
216 { ":O", "00D6" },
217 { "mu", "00D7" },
218 { "tmu", "00D7" },
219 { "/O", "00D8" },
220 { "`U", "00D9" },
221 { "'U", "00DA" },
222 { "^U", "00DB" },
223 { ":U", "00DC" },
224 { "'Y", "00DD" },
225 { "TP", "00DE" },
226 { "ss", "00DF" },
227 { "`a", "00E0" },
228 { "'a", "00E1" },
229 { "^a", "00E2" },
230 { "~a", "00E3" },
231 { ":a", "00E4" },
232 { "oa", "00E5" },
233 { "ae", "00E6" },
234 { ",c", "00E7" },
235 { "`e", "00E8" },
236 { "'e", "00E9" },
237 { "^e", "00EA" },
238 { ":e", "00EB" },
239 { "`i", "00EC" },
240 { "'i", "00ED" },
241 { "^i", "00EE" },
242 { ":i", "00EF" },
243 { "Sd", "00F0" },
244 { "~n", "00F1" },
245 { "`o", "00F2" },
246 { "'o", "00F3" },
247 { "^o", "00F4" },
248 { "~o", "00F5" },
249 { ":o", "00F6" },
250 { "di", "00F7" },
251 { "tdi", "00F7" },
252 { "/o", "00F8" },
253 { "`u", "00F9" },
254 { "'u", "00FA" },
255 { "^u", "00FB" },
256 { ":u", "00FC" },
257 { "'y", "00FD" },
258 { "Tp", "00FE" },
259 { ":y", "00FF" },
260 { "'C", "0106" },
261 { "'c", "0107" },
262 { ".i", "0131" },
263 { "IJ", "0132" },
264 { "ij", "0133" },
265 { "/L", "0141" },
266 { "/l", "0142" },
267 { "OE", "0152" },
268 { "oe", "0153" },
269 { "vS", "0160" },
270 { "vs", "0161" },
271 { ":Y", "0178" },
272 { "vZ", "017D" },
273 { "vz", "017E" },
274 { "Fn", "0192" },
275 { "ah", "02C7" },
276 { "ab", "02D8" },
277 { "a.", "02D9" },
278 { "ao", "02DA" },
279 { "ho", "02DB" },
280 { "a\"", "02DD" },
281 { "*A", "0391" },
282 { "*B", "0392" },
283 { "*G", "0393" },
284 { "*D", "0394" },
285 { "*E", "0395" },
286 { "*Z", "0396" },
287 { "*Y", "0397" },
288 { "*H", "0398" },
289 { "*I", "0399" },
290 { "*K", "039A" },
291 { "*L", "039B" },
292 { "*M", "039C" },
293 { "*N", "039D" },
294 { "*C", "039E" },
295 { "*O", "039F" },
296 { "*P", "03A0" },
297 { "*R", "03A1" },
298 { "*S", "03A3" },
299 { "*T", "03A4" },
300 { "*U", "03A5" },
301 { "*F", "03A6" },
302 { "*X", "03A7" },
303 { "*Q", "03A8" },
304 { "*W", "03A9" },
305 { "*a", "03B1" },
306 { "*b", "03B2" },
307 { "*g", "03B3" },
308 { "*d", "03B4" },
309 { "*e", "03B5" },
310 { "*z", "03B6" },
311 { "*y", "03B7" },
312 { "*h", "03B8" },
313 { "*i", "03B9" },
314 { "*k", "03BA" },
315 { "*l", "03BB" },
316 { "*m", "03BC" },
317 { "*n", "03BD" },
318 { "*c", "03BE" },
319 { "*o", "03BF" },
320 { "*p", "03C0" },
321 { "*r", "03C1" },
322 { "ts", "03C2" },
323 { "*s", "03C3" },
324 { "*t", "03C4" },
325 { "*u", "03C5" },
326 { "*f", "03C6" },
327 { "*x", "03C7" },
328 { "*q", "03C8" },
329 { "*w", "03C9" },
330 { "+h", "03D1" },
331 { "+f", "03D5" },
332 { "+p", "03D6" },
333 { "+e", "03F5" },
334 { "-", "2010" },
335 { "hy", "2010" },
336 { "en", "2013" },
337 { "em", "2014" },
338 { "`", "2018" },
339 { "oq", "2018" },
340 { "'", "2019" },
341 { "cq", "2019" },
342 { "bq", "201A" },
343 { "lq", "201C" },
344 { "rq", "201D" },
345 { "Bq", "201E" },
346 { "dg", "2020" },
347 { "dd", "2021" },
348 { "bu", "2022" },
349 { "%0", "2030" },
350 { "fm", "2032" },
351 { "sd", "2033" },
352 { "fo", "2039" },
353 { "fc", "203A" },
354 { "rn", "203E" },
355 { "f/", "2044" },
356 { "eu", "20AC" },
357 { "Eu", "20AC" },
358 { "-h", "210F" },
359 { "hbar", "210F" },
360 { "Im", "2111" },
361 { "wp", "2118" },
362 { "Re", "211C" },
363 { "tm", "2122" },
364 { "Ah", "2135" },
365 { "18", "215B" },
366 { "38", "215C" },
367 { "58", "215D" },
368 { "78", "215E" },
369 { "<-", "2190" },
370 { "ua", "2191" },
371 { "->", "2192" },
372 { "da", "2193" },
373 { "<>", "2194" },
374 { "va", "2195" },
375 { "CR", "21B5" },
376 { "lA", "21D0" },
377 { "uA", "21D1" },
378 { "rA", "21D2" },
379 { "dA", "21D3" },
380 { "hA", "21D4" },
381 { "vA", "21D5" },
382 { "fa", "2200" },
383 { "pd", "2202" },
384 { "te", "2203" },
385 { "es", "2205" },
386 { "gr", "2207" },
387 { "mo", "2208" },
388 { "nm", "2209" },
389 { "st", "220B" },
390 { "product", "220F" },
391 { "sum", "2211" },
392 //{ "\\-", "2212" },
393 { "mi", "2212" },
394 { "-+", "2213" },
395 { "**", "2217" },
396 { "sr", "221A" },
397 { "pt", "221D" },
398 { "if", "221E" },
399 { "/_", "2220" },
400 { "AN", "2227" },
401 { "OR", "2228" },
402 { "ca", "2229" },
403 { "cu", "222A" },
404 { "is", "222B" },
405 { "integral", "222B" },
406 { "tf", "2234" },
407 { "3d", "2234" },
408 { "ap", "223C" },
409 { "|=", "2243" },
410 { "=~", "2245" },
411 { "~~", "2248" },
412 { "~=", "2248" },
413 { "!=", "2260" },
414 { "==", "2261" },
415 { "ne", "2262" },
416 { "<=", "2264" },
417 { ">=", "2265" },
418 { ">>", "226A" },
419 { "<<", "226B" },
420 { "sb", "2282" },
421 { "sp", "2283" },
422 { "nb", "2284" },
423 { "nc", "2285" },
424 { "ib", "2286" },
425 { "ip", "2287" },
426 { "c+", "2295" },
427 { "c*", "2297" },
428 { "pp", "22A5" },
429 { "md", "22C5" },
430 { "lc", "2308" },
431 { "rc", "2309" },
432 { "lf", "230A" },
433 { "rf", "230B" },
434 { "parenlefttp", "239B" },
435 { "parenleftex", "239C" },
436 { "parenleftbt", "239D" },
437 { "parenrighttp", "239E" },
438 { "parenrightex", "239F" },
439 { "parenrightbt", "23A0" },
440 { "bracketlefttp", "23A1" },
441 { "bracketleftex", "23A2" },
442 { "bracketleftbt", "23A3" },
443 { "bracketrighttp", "23A4" },
444 { "bracketrightex", "23A5" },
445 { "bracketrightbt", "23A6" },
446 { "lt", "23A7" },
447 { "bracelefttp", "23A7" },
448 { "lk", "23A8" },
449 { "braceleftmid", "23A8" },
450 { "lb", "23A9" },
451 { "braceleftbt", "23A9" },
452 { "bv", "23AA" },
453 { "braceex", "23AA" },
454 { "braceleftex", "23AA" },
455 { "bracerightex", "23AA" },
456 { "rt", "23AB" },
457 { "bracerighttp", "23AB" },
458 { "rk", "23AC" },
459 { "bracerightmid", "23AC" },
460 { "rb", "23AD" },
461 { "bracerightbt", "23AD" },
462 { "an", "23AF" },
463 { "br", "2502" },
464 { "rk", "251D" },
465 { "lk", "2525" },
466 { "lt", "256D" },
467 { "rt", "256E" },
468 { "rb", "256F" },
469 { "lb", "2570" },
470 { "sq", "25A1" },
471 { "lz", "25CA" },
472 { "ci", "25CB" },
473 { "lh", "261C" },
474 { "rh", "261E" },
475 { "SP", "2660" },
476 { "CL", "2663" },
477 { "HE", "2665" },
478 { "DI", "2666" },
479 { "OK", "2713" },
480 { "la", "27E8" },
481 { "ra", "27E9" },
484 // global constructor
485 static struct glyph_to_unicode_init {
486 glyph_to_unicode_init();
487 } _glyph_to_unicode_init;
489 glyph_to_unicode_init::glyph_to_unicode_init() {
490 for (unsigned int i = 0;
491 i < sizeof(glyph_to_unicode_list)/sizeof(glyph_to_unicode_list[0]);
492 i++) {
493 glyph_to_unicode *gtu = new glyph_to_unicode[1];
494 gtu->value = (char *)glyph_to_unicode_list[i].value;
495 glyph_to_unicode_table.define(glyph_to_unicode_list[i].key, gtu);
499 const char *glyph_name_to_unicode(const char *s)
501 glyph_to_unicode *result = glyph_to_unicode_table.lookup(s);
502 return result ? result->value : 0;