Fix Fix Savannah bug #43905.
[s-roff.git] / src / lib-roff / uniglyph.cpp
blob5c74644798c189f34df056e1215f292e881446be
1 /*@
2 * Copyright (c) 2014 - 2017 Steffen (Daode) Nurpmeso <steffen@sdaoden.eu>.
4 * Copyright (C) 2002 - 2004, 2006
5 * Free Software Foundation, Inc.
6 * Written by Werner Lemberg <wl@gnu.org>
8 * This is free software; you can redistribute it and/or modify it under
9 * the terms of the GNU General Public License as published by the Free
10 * Software Foundation; either version 2, or (at your option) any later
11 * version.
13 * This is distributed in the hope that it will be useful, but WITHOUT ANY
14 * WARRANTY; without even the implied warranty of MERCHANTABILITY or
15 * FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License
16 * for more details.
18 * You should have received a copy of the GNU General Public License along
19 * with groff; see the file COPYING. If not, write to the Free Software
20 * Foundation, 51 Franklin St - Fifth Floor, Boston, MA 02110-1301, USA.
23 #include "config.h"
25 #include "lib.h"
26 #include "stringclass.h"
27 #include "ptable.h"
28 #include "unicode.h"
30 struct unicode_to_glyph {
31 char *value;
34 declare_ptable(unicode_to_glyph)
35 implement_ptable(unicode_to_glyph)
37 PTABLE(unicode_to_glyph) unicode_to_glyph_table;
39 struct S {
40 const char *key;
41 const char *value;
42 } unicode_to_glyph_list[] = { // FIXME const
43 { "0021", "!" },
44 //{ "0022", "\"" },
45 { "0022", "dq" },
46 //{ "0023", "#" },
47 { "0023", "sh" },
48 //{ "0024", "$" },
49 { "0024", "Do" },
50 { "0025", "%" },
51 { "0026", "&" },
52 { "0027", "aq" },
53 { "0028", "(" },
54 { "0029", ")" },
55 { "002A", "*" },
56 //{ "002B", "+" },
57 { "002B", "pl" },
58 { "002C", "," },
59 { "002E", "." },
60 //{ "002F", "/" },
61 { "002F", "sl" },
62 { "0030", "0" },
63 { "0031", "1" },
64 { "0032", "2" },
65 { "0033", "3" },
66 { "0034", "4" },
67 { "0035", "5" },
68 { "0036", "6" },
69 { "0037", "7" },
70 { "0038", "8" },
71 { "0039", "9" },
72 { "003A", ":" },
73 { "003B", ";" },
74 { "003C", "<" },
75 //{ "003D", "=" },
76 { "003D", "eq" },
77 { "003D_0338", "!=" },
78 { "003E", ">" },
79 { "003F", "?" },
80 //{ "0040", "@" },
81 { "0040", "at" },
82 { "0041", "A" },
83 { "0041_0300", "`A" },
84 { "0041_0301", "'A" },
85 { "0041_0302", "^A" },
86 { "0041_0303", "~A" },
87 { "0041_0308", ":A" },
88 { "0041_030A", "oA" },
89 { "0042", "B" },
90 { "0043", "C" },
91 { "0043_0301", "'C" },
92 { "0043_0327", ",C" },
93 { "0044", "D" },
94 { "0045", "E" },
95 { "0045_0300", "`E" },
96 { "0045_0301", "'E" },
97 { "0045_0302", "^E" },
98 { "0045_0308", ":E" },
99 { "0046", "F" },
100 { "0047", "G" },
101 { "0048", "H" },
102 { "0049", "I" },
103 { "0049_0300", "`I" },
104 { "0049_0301", "'I" },
105 { "0049_0302", "^I" },
106 { "0049_0308", ":I" },
107 { "004A", "J" },
108 { "004B", "K" },
109 { "004C", "L" },
110 { "004D", "M" },
111 { "004E", "N" },
112 { "004E_0303", "~N" },
113 { "004F", "O" },
114 { "004F_0300", "`O" },
115 { "004F_0301", "'O" },
116 { "004F_0302", "^O" },
117 { "004F_0303", "~O" },
118 { "004F_0308", ":O" },
119 { "0050", "P" },
120 { "0051", "Q" },
121 { "0052", "R" },
122 { "0053", "S" },
123 { "0053_030C", "vS" },
124 { "0054", "T" },
125 { "0055", "U" },
126 { "0055_0300", "`U" },
127 { "0055_0301", "'U" },
128 { "0055_0302", "^U" },
129 { "0055_0308", ":U" },
130 { "0056", "V" },
131 { "0057", "W" },
132 { "0058", "X" },
133 { "0059", "Y" },
134 { "0059_0301", "'Y" },
135 { "0059_0308", ":Y" },
136 { "005A", "Z" },
137 { "005A_030C", "vZ" },
138 { "005B", "lB" },
139 //{ "005B", "[" },
140 { "005C", "rs" },
141 //{ "005C", "\\" },
142 { "005D", "rB" },
143 //{ "005D", "]" },
144 //{ "005E", "^" },
145 //{ "005E", "a^" },
146 { "005E", "ha" },
147 //{ "005F", "_" },
148 //{ "005F", "ru" },
149 { "005F", "ul" },
150 { "0060", "ga" },
151 { "0061", "a" },
152 { "0061_0300", "`a" },
153 { "0061_0301", "'a" },
154 { "0061_0302", "^a" },
155 { "0061_0303", "~a" },
156 { "0061_0308", ":a" },
157 { "0061_030A", "oa" },
158 { "0062", "b" },
159 { "0063", "c" },
160 { "0063_0301", "'c" },
161 { "0063_0327", ",c" },
162 { "0064", "d" },
163 { "0065", "e" },
164 { "0065_0300", "`e" },
165 { "0065_0301", "'e" },
166 { "0065_0302", "^e" },
167 { "0065_0308", ":e" },
168 { "0066", "f" },
169 { "0066_0066", "ff" },
170 { "0066_0066_0069", "Fi" },
171 { "0066_0066_006C", "Fl" },
172 { "0066_0069", "fi" },
173 { "0066_006C", "fl" },
174 { "0067", "g" },
175 { "0068", "h" },
176 { "0069", "i" },
177 { "0069_0300", "`i" },
178 { "0069_0301", "'i" },
179 { "0069_0302", "^i" },
180 { "0069_0308", ":i" },
181 { "006A", "j" },
182 { "006B", "k" },
183 { "006C", "l" },
184 { "006D", "m" },
185 { "006E", "n" },
186 { "006E_0303", "~n" },
187 { "006F", "o" },
188 { "006F_0300", "`o" },
189 { "006F_0301", "'o" },
190 { "006F_0302", "^o" },
191 { "006F_0303", "~o" },
192 { "006F_0308", ":o" },
193 { "0070", "p" },
194 { "0071", "q" },
195 { "0072", "r" },
196 { "0073", "s" },
197 { "0073_030C", "vs" },
198 { "0074", "t" },
199 { "0075", "u" },
200 { "0075_0300", "`u" },
201 { "0075_0301", "'u" },
202 { "0075_0302", "^u" },
203 { "0075_0308", ":u" },
204 { "0076", "v" },
205 { "0077", "w" },
206 { "0078", "x" },
207 { "0079", "y" },
208 { "0079_0301", "'y" },
209 { "0079_0308", ":y" },
210 { "007A", "z" },
211 { "007A_030C", "vz" },
212 { "007B", "lC" },
213 //{ "007B", "{" },
214 { "007C", "ba" },
215 //{ "007C", "or" },
216 //{ "007C", "|" },
217 { "007D", "rC" },
218 //{ "007D", "}" },
219 //{ "007E", "a~" },
220 { "007E", "ti" },
221 //{ "007E", "~" },
222 { "00A1", "r!" },
223 { "00A2", "ct" },
224 { "00A3", "Po" },
225 { "00A4", "Cs" },
226 { "00A5", "Ye" },
227 { "00A6", "bb" },
228 { "00A7", "sc" },
229 { "00A8", "ad" },
230 { "00A9", "co" },
231 { "00AA", "Of" },
232 { "00AB", "Fo" },
233 { "00AC", "no" },
234 //{ "00AC", "tno" },
235 // In groff, U+00AD is an input character only; it is not mapped to
236 // a glyph but to `\%'.
237 { "00AE", "rg" },
238 { "00AF", "a-" },
239 { "00B0", "de" },
240 { "00B1", "+-" },
241 //{ "00B1", "t+-" },
242 { "00B2", "S2" },
243 { "00B3", "S3" },
244 { "00B4", "aa" },
245 { "00B5", "mc" },
246 { "00B6", "ps" },
247 { "00B7", "pc" },
248 { "00B8", "ac" },
249 { "00B9", "S1" },
250 { "00BA", "Om" },
251 { "00BB", "Fc" },
252 { "00BC", "14" },
253 { "00BD", "12" },
254 { "00BE", "34" },
255 { "00BF", "r?" },
256 { "00C6", "AE" },
257 { "00D0", "-D" },
258 { "00D7", "mu" },
259 //{ "00D7", "tmu" },
260 { "00D8", "/O" },
261 { "00DE", "TP" },
262 { "00DF", "ss" },
263 { "00E6", "ae" },
264 { "00F0", "Sd" },
265 { "00F7", "di" },
266 //{ "00F7", "tdi" },
267 { "00F8", "/o" },
268 { "00FE", "Tp" },
269 { "0131", ".i" },
270 { "0132", "IJ" },
271 { "0133", "ij" },
272 { "0141", "/L" },
273 { "0142", "/l" },
274 { "0152", "OE" },
275 { "0153", "oe" },
276 { "0192", "Fn" },
277 { "02C7", "ah" },
278 { "02D8", "ab" },
279 { "02D9", "a." },
280 { "02DA", "ao" },
281 { "02DB", "ho" },
282 { "02DD", "a\"" },
283 { "0391", "*A" },
284 { "0392", "*B" },
285 { "0393", "*G" },
286 { "0394", "*D" },
287 { "0395", "*E" },
288 { "0396", "*Z" },
289 { "0397", "*Y" },
290 { "0398", "*H" },
291 { "0399", "*I" },
292 { "039A", "*K" },
293 { "039B", "*L" },
294 { "039C", "*M" },
295 { "039D", "*N" },
296 { "039E", "*C" },
297 { "039F", "*O" },
298 { "03A0", "*P" },
299 { "03A1", "*R" },
300 { "03A3", "*S" },
301 { "03A4", "*T" },
302 { "03A5", "*U" },
303 { "03A6", "*F" },
304 { "03A7", "*X" },
305 { "03A8", "*Q" },
306 { "03A9", "*W" },
307 { "03B1", "*a" },
308 { "03B2", "*b" },
309 { "03B3", "*g" },
310 { "03B4", "*d" },
311 { "03B5", "*e" },
312 { "03B6", "*z" },
313 { "03B7", "*y" },
314 { "03B8", "*h" },
315 { "03B9", "*i" },
316 { "03BA", "*k" },
317 { "03BB", "*l" },
318 { "03BC", "*m" },
319 { "03BD", "*n" },
320 { "03BE", "*c" },
321 { "03BF", "*o" },
322 { "03C0", "*p" },
323 { "03C1", "*r" },
324 { "03C2", "ts" },
325 { "03C3", "*s" },
326 { "03C4", "*t" },
327 { "03C5", "*u" },
328 { "03C6", "*f" },
329 { "03C7", "*x" },
330 { "03C8", "*q" },
331 { "03C9", "*w" },
332 { "03D1", "+h" },
333 { "03D5", "+f" },
334 { "03D6", "+p" },
335 { "03F5", "+e" },
336 //{ "2010", "-" },
337 { "2010", "hy" },
338 { "2013", "en" },
339 { "2014", "em" },
340 //{ "2018", "`" },
341 { "2018", "oq" },
342 //{ "2019", "'" },
343 { "2019", "cq" },
344 { "201A", "bq" },
345 { "201C", "lq" },
346 { "201D", "rq" },
347 { "201E", "Bq" },
348 { "2020", "dg" },
349 { "2021", "dd" },
350 { "2022", "bu" },
351 { "2030", "%0" },
352 { "2032", "fm" },
353 { "2033", "sd" },
354 { "2039", "fo" },
355 { "203A", "fc" },
356 { "203E", "rn" },
357 { "2044", "f/" },
358 { "20AC", "Eu" },
359 //{ "20AC", "eu" },
360 { "210F", "-h" },
361 //{ "210F", "hbar" },
362 { "2111", "Im" },
363 { "2118", "wp" },
364 { "211C", "Re" },
365 { "2122", "tm" },
366 { "2135", "Ah" },
367 { "215B", "18" },
368 { "215C", "38" },
369 { "215D", "58" },
370 { "215E", "78" },
371 { "2190", "<-" },
372 { "2191", "ua" },
373 { "2192", "->" },
374 { "2193", "da" },
375 { "2194", "<>" },
376 { "2195", "va" },
377 { "21B5", "CR" },
378 { "21D0", "lA" },
379 { "21D1", "uA" },
380 { "21D2", "rA" },
381 { "21D3", "dA" },
382 { "21D4", "hA" },
383 { "21D5", "vA" },
384 { "2200", "fa" },
385 { "2202", "pd" },
386 { "2203", "te" },
387 { "2205", "es" },
388 { "2207", "gr" },
389 { "2208", "mo" },
390 { "2208_0338", "nm" },
391 { "220B", "st" },
392 { "220F", "product" },
393 { "2210", "coproduct" },
394 { "2211", "sum" },
395 { "2212", "mi" },
396 //{ "2212", "\\-" },
397 { "2213", "-+" },
398 { "2217", "**" },
399 { "221A", "sr" },
400 { "221D", "pt" },
401 { "221E", "if" },
402 { "2220", "/_" },
403 { "2227", "AN" },
404 { "2228", "OR" },
405 { "2229", "ca" },
406 { "222A", "cu" },
407 { "222B", "is" },
408 //{ "222B", "integral" },
409 //{ "2234", "3d" },
410 { "2234", "tf" },
411 { "223C", "ap" },
412 { "2243", "|=" },
413 { "2245", "=~" },
414 //{ "2248", "~=" },
415 { "2248", "~~" },
416 { "2261", "==" },
417 { "2261_0338", "ne" },
418 { "2264", "<=" },
419 { "2265", ">=" },
420 { "226A", ">>" },
421 { "226B", "<<" },
422 { "2282", "sb" },
423 { "2282_0338", "nb" },
424 { "2283", "sp" },
425 { "2283_0338", "nc" },
426 { "2286", "ib" },
427 { "2287", "ip" },
428 { "2295", "c+" },
429 { "2297", "c*" },
430 { "22A5", "pp" },
431 { "22C5", "md" },
432 { "2308", "lc" },
433 { "2309", "rc" },
434 { "230A", "lf" },
435 { "230B", "rf" },
436 { "239B", "parenlefttp" },
437 { "239C", "parenleftex" },
438 { "239D", "parenleftbt" },
439 { "239E", "parenrighttp" },
440 { "239F", "parenrightex" },
441 { "23A0", "parenrightbt" },
442 //{ "23A1", "bracketlefttp" },
443 { "23A2", "bracketleftex" },
444 //{ "23A3", "bracketleftbt" },
445 //{ "23A4", "bracketrighttp" },
446 { "23A5", "bracketrightex" },
447 //{ "23A6", "bracketrightbt" },
448 { "23A7", "lt" },
449 //{ "23A7", "bracelefttp" },
450 { "23A8", "lk" },
451 //{ "23A8", "braceleftmid" },
452 { "23A9", "lb" },
453 //{ "23A9", "braceleftbt" },
454 { "23AA", "bv" },
455 //{ "23AA", "braceex" },
456 //{ "23AA", "braceleftex" },
457 //{ "23AA", "bracerightex" },
458 { "23AB", "rt" },
459 //{ "23AB", "bracerighttp" },
460 { "23AC", "rk" },
461 //{ "23AC", "bracerightmid" },
462 { "23AD", "rb" },
463 //{ "23AD", "bracerightbt" },
464 { "23AF", "an" },
465 { "2502", "br" },
466 { "25A1", "sq" },
467 { "25CA", "lz" },
468 { "25CB", "ci" },
469 { "261C", "lh" },
470 { "261E", "rh" },
471 { "2660", "SP" },
472 { "2663", "CL" },
473 { "2665", "HE" },
474 { "2666", "DI" },
475 { "2713", "OK" },
476 { "27E8", "la" },
477 { "27E9", "ra" },
480 // global constructor
481 static struct unicode_to_glyph_init { /* FIXME ugh, static ctor init */
482 unicode_to_glyph_init();
483 } _unicode_to_glyph_init;
485 unicode_to_glyph_init::unicode_to_glyph_init()
487 for (unsigned int i = 0;
488 i < sizeof(unicode_to_glyph_list)/sizeof(unicode_to_glyph_list[0]);
489 i++) {
490 unicode_to_glyph *utg = new unicode_to_glyph[1];
491 utg->value = (char *)unicode_to_glyph_list[i].value;
492 unicode_to_glyph_table.define(unicode_to_glyph_list[i].key, utg);
496 const char *unicode_to_glyph_name(const char *s)
498 unicode_to_glyph *result = unicode_to_glyph_table.lookup(s);
499 return result ? result->value : 0;
502 // s-it2-mode