Adding support for composite glyphs: \[xxx yyy ...] and the
[s-roff.git] / src / roff / troff / glyphuni.cc
blob79a01535c7a1ac91a33d8080a1a18185ca4b1e1b
1 // -*- C++ -*-
2 /* Copyright (C) 2002
3 Free Software Foundation, Inc.
4 Written by Werner Lemberg <wl@gnu.org>
6 This file is part of groff.
8 groff is free software; you can redistribute it and/or modify it under
9 the terms of the GNU General Public License as published by the Free
10 Software Foundation; either version 2, or (at your option) any later
11 version.
13 groff is distributed in the hope that it will be useful, but WITHOUT ANY
14 WARRANTY; without even the implied warranty of MERCHANTABILITY or
15 FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License
16 for more details.
18 You should have received a copy of the GNU General Public License along
19 with groff; see the file COPYING. If not, write to the Free Software
20 Foundation, 59 Temple Place - Suite 330, Boston, MA 02111-1307, USA. */
22 #include "lib.h"
23 #include "stringclass.h"
24 #include "ptable.h"
26 #include "unicode.h"
28 struct glyph_to_unicode {
29 char *value;
32 declare_ptable(glyph_to_unicode)
33 implement_ptable(glyph_to_unicode)
35 PTABLE(glyph_to_unicode) glyph_to_unicode_table;
37 struct {
38 const char *key;
39 char *value;
40 } glyph_to_unicode_list[] = {
41 { "!", "0021" },
42 { "\"", "0022" },
43 { "dq", "0022" },
44 { "#", "0023" },
45 { "sh", "0023" },
46 { "$", "0024" },
47 { "Do", "0024" },
48 { "%", "0025" },
49 { "&", "0026" },
50 { "aq", "0027" },
51 { "(", "0028" },
52 { ")", "0029" },
53 { "*", "002A" },
54 { "+", "002B" },
55 { "pl", "002B" },
56 { ",", "002C" },
57 { ".", "002E" },
58 { "/", "002F" },
59 { "sl", "002F" },
60 { "0", "0030" },
61 { "1", "0031" },
62 { "2", "0032" },
63 { "3", "0033" },
64 { "4", "0034" },
65 { "5", "0035" },
66 { "6", "0036" },
67 { "7", "0037" },
68 { "8", "0038" },
69 { "9", "0039" },
70 { ":", "003A" },
71 { ";", "003B" },
72 { "<", "003C" },
73 { "=", "003D" },
74 { "eq", "003D" },
75 { ">", "003E" },
76 { "?", "003F" },
77 { "@", "0040" },
78 { "at", "0040" },
79 { "A", "0041" },
80 { "B", "0042" },
81 { "C", "0043" },
82 { "D", "0044" },
83 { "E", "0045" },
84 { "F", "0046" },
85 { "G", "0047" },
86 { "H", "0048" },
87 { "I", "0049" },
88 { "J", "004A" },
89 { "K", "004B" },
90 { "L", "004C" },
91 { "M", "004D" },
92 { "N", "004E" },
93 { "O", "004F" },
94 { "P", "0050" },
95 { "Q", "0051" },
96 { "R", "0052" },
97 { "S", "0053" },
98 { "T", "0054" },
99 { "U", "0055" },
100 { "V", "0056" },
101 { "W", "0057" },
102 { "X", "0058" },
103 { "Y", "0059" },
104 { "Z", "005A" },
105 //{ "[", "005B" },
106 { "lB", "005B" },
107 //{ "\\", "005C" },
108 { "rs", "005C" },
109 //{ "]", "005D" },
110 { "rB", "005D" },
111 { "a^", "005E" },
112 { "^", "005E" },
113 { "ha", "005E" },
114 { "_", "005F" },
115 { "ru", "005F" },
116 { "ul", "005F" },
117 //{ "\\`", "0060" },
118 { "ga", "0060" },
119 { "a", "0061" },
120 { "b", "0062" },
121 { "c", "0063" },
122 { "d", "0064" },
123 { "e", "0065" },
124 { "f", "0066" },
125 { "g", "0067" },
126 { "h", "0068" },
127 { "i", "0069" },
128 { "j", "006A" },
129 { "k", "006B" },
130 { "l", "006C" },
131 { "m", "006D" },
132 { "n", "006E" },
133 { "o", "006F" },
134 { "p", "0070" },
135 { "q", "0071" },
136 { "r", "0072" },
137 { "s", "0073" },
138 { "t", "0074" },
139 { "u", "0075" },
140 { "v", "0076" },
141 { "w", "0077" },
142 { "x", "0078" },
143 { "y", "0079" },
144 { "z", "007A" },
145 { "lC", "007B" },
146 { "{", "007B" },
147 { "ba", "007C" },
148 { "or", "007C" },
149 { "|", "007C" },
150 { "rC", "007D" },
151 { "}", "007D" },
152 { "a~", "007E" },
153 { "~", "007E" },
154 { "ti", "007E" },
155 { "r!", "00A1" },
156 { "ct", "00A2" },
157 { "Po", "00A3" },
158 { "Cs", "00A4" },
159 { "Ye", "00A5" },
160 { "bb", "00A6" },
161 { "sc", "00A7" },
162 { "ad", "00A8" },
163 { "co", "00A9" },
164 { "Of", "00AA" },
165 { "Fo", "00AB" },
166 { "no", "00AC" },
167 { "shc", "00AD" },
168 { "rg", "00AE" },
169 { "a-", "00AF" },
170 { "de", "00B0" },
171 { "+-", "00B1" },
172 { "t+-", "00B1" },
173 { "S2", "00B2" },
174 { "S3", "00B3" },
175 { "aa", "00B4" },
176 //{ "\\'", "00B4" },
177 { "mc", "00B5" },
178 { "ps", "00B6" },
179 { "pc", "00B7" },
180 { "ac", "00B8" },
181 { "S1", "00B9" },
182 { "Om", "00BA" },
183 { "Fc", "00BB" },
184 { "14", "00BC" },
185 { "12", "00BD" },
186 { "34", "00BE" },
187 { "r?", "00BF" },
188 { "`A", "00C0" },
189 { "'A", "00C1" },
190 { "^A", "00C2" },
191 { "~A", "00C3" },
192 { ":A", "00C4" },
193 { "oA", "00C5" },
194 { "AE", "00C6" },
195 { ",C", "00C7" },
196 { "`E", "00C8" },
197 { "'E", "00C9" },
198 { "^E", "00CA" },
199 { ":E", "00CB" },
200 { "`I", "00CC" },
201 { "'I", "00CD" },
202 { "^I", "00CE" },
203 { ":I", "00CF" },
204 { "-D", "00D0" },
205 { "~N", "00D1" },
206 { "`O", "00D2" },
207 { "'O", "00D3" },
208 { "^O", "00D4" },
209 { "~O", "00D5" },
210 { ":O", "00D6" },
211 { "mu", "00D7" },
212 { "tmu", "00D7" },
213 { "/O", "00D8" },
214 { "`U", "00D9" },
215 { "'U", "00DA" },
216 { "^U", "00DB" },
217 { ":U", "00DC" },
218 { "'Y", "00DD" },
219 { "TP", "00DE" },
220 { "ss", "00DF" },
221 { "`a", "00E0" },
222 { "'a", "00E1" },
223 { "^a", "00E2" },
224 { "~a", "00E3" },
225 { ":a", "00E4" },
226 { "oa", "00E5" },
227 { "ae", "00E6" },
228 { ",c", "00E7" },
229 { "`e", "00E8" },
230 { "'e", "00E9" },
231 { "^e", "00EA" },
232 { ":e", "00EB" },
233 { "`i", "00EC" },
234 { "'i", "00ED" },
235 { "^i", "00EE" },
236 { ":i", "00EF" },
237 { "Sd", "00F0" },
238 { "~n", "00F1" },
239 { "`o", "00F2" },
240 { "'o", "00F3" },
241 { "^o", "00F4" },
242 { "~o", "00F5" },
243 { ":o", "00F6" },
244 { "di", "00F7" },
245 { "tdi", "00F7" },
246 { "/o", "00F8" },
247 { "`u", "00F9" },
248 { "'u", "00FA" },
249 { "^u", "00FB" },
250 { ":u", "00FC" },
251 { "'y", "00FD" },
252 { "Tp", "00FE" },
253 { ":y", "00FF" },
254 { ".i", "0131" },
255 { "/L", "0141" },
256 { "/l", "0142" },
257 { "OE", "0152" },
258 { "oe", "0153" },
259 { "vS", "0160" },
260 { "vs", "0161" },
261 { ":Y", "0178" },
262 { "vZ", "017D" },
263 { "vz", "017E" },
264 { "Fn", "0192" },
265 { "ah", "02C7" },
266 { "ab", "02D8" },
267 { "a.", "02D9" },
268 { "ao", "02DA" },
269 { "ho", "02DB" },
270 { "a\"", "02DD" },
271 { "*A", "0391" },
272 { "*B", "0392" },
273 { "*G", "0393" },
274 { "*D", "0394" },
275 { "*E", "0395" },
276 { "*Z", "0396" },
277 { "*Y", "0397" },
278 { "*H", "0398" },
279 { "*I", "0399" },
280 { "*K", "039A" },
281 { "*L", "039B" },
282 { "*M", "039C" },
283 { "*N", "039D" },
284 { "*C", "039E" },
285 { "*O", "039F" },
286 { "*P", "03A0" },
287 { "*R", "03A1" },
288 { "*S", "03A3" },
289 { "*T", "03A4" },
290 { "*U", "03A5" },
291 { "*F", "03A6" },
292 { "*X", "03A7" },
293 { "*Q", "03A8" },
294 { "*W", "03A9" },
295 { "*a", "03B1" },
296 { "*b", "03B2" },
297 { "*g", "03B3" },
298 { "*d", "03B4" },
299 { "*e", "03B5" },
300 { "*z", "03B6" },
301 { "*y", "03B7" },
302 { "*h", "03B8" },
303 { "*i", "03B9" },
304 { "*k", "03BA" },
305 { "*l", "03BB" },
306 { "*m", "03BC" },
307 { "*n", "03BD" },
308 { "*c", "03BE" },
309 { "*o", "03BF" },
310 { "*p", "03C0" },
311 { "*r", "03C1" },
312 { "ts", "03C2" },
313 { "*s", "03C3" },
314 { "*t", "03C4" },
315 { "*u", "03C5" },
316 { "*f", "03C6" },
317 { "*x", "03C7" },
318 { "*q", "03C8" },
319 { "*w", "03C9" },
320 { "+h", "03D1" },
321 { "+f", "03D5" },
322 { "+p", "03D6" },
323 { "-", "2010" },
324 { "hy", "2010" },
325 { "en", "2013" },
326 { "em", "2014" },
327 { "`", "2018" },
328 { "oq", "2018" },
329 { "'", "2019" },
330 { "cq", "2019" },
331 { "bq", "201A" },
332 { "lq", "201C" },
333 { "rq", "201D" },
334 { "Bq", "201E" },
335 { "dg", "2020" },
336 { "dd", "2021" },
337 { "bu", "2022" },
338 { "%0", "2030" },
339 { "fm", "2032" },
340 { "sd", "2033" },
341 { "fo", "2039" },
342 { "fc", "203A" },
343 { "rn", "203E" },
344 { "f/", "2044" },
345 { "eu", "20AC" },
346 { "Eu", "20AC" },
347 { "Im", "2111" },
348 { "wp", "2118" },
349 { "Re", "211C" },
350 { "tm", "2122" },
351 { "Ah", "2135" },
352 { "<-", "2190" },
353 { "ua", "2191" },
354 { "->", "2192" },
355 { "da", "2193" },
356 { "<>", "2194" },
357 { "lA", "21D0" },
358 { "uA", "21D1" },
359 { "rA", "21D2" },
360 { "dA", "21D3" },
361 { "hA", "21D4" },
362 { "fa", "2200" },
363 { "pd", "2202" },
364 { "te", "2203" },
365 { "es", "2205" },
366 { "gr", "2207" },
367 { "mo", "2208" },
368 { "nm", "2209" },
369 { "st", "220B" },
370 { "product", "220F" },
371 { "sum", "2211" },
372 //{ "\\-", "2212" },
373 { "mi", "2212" },
374 { "**", "2217" },
375 { "sr", "221A" },
376 { "pt", "221D" },
377 { "if", "221E" },
378 { "/_", "2220" },
379 { "AN", "2227" },
380 { "OR", "2228" },
381 { "ca", "2229" },
382 { "cu", "222A" },
383 { "is", "222B" },
384 { "tf", "2234" },
385 { "3d", "2234" },
386 { "ti", "223C" },
387 { "ap", "223C" },
388 { "=~", "2245" },
389 { "~~", "2248" },
390 { "~=", "2248" },
391 { "!=", "2260" },
392 { "==", "2261" },
393 { "<=", "2264" },
394 { ">=", "2265" },
395 { ">>", "226A" },
396 { "<<", "226B" },
397 { "sb", "2282" },
398 { "sp", "2283" },
399 { "nb", "2284" },
400 { "ib", "2286" },
401 { "ip", "2287" },
402 { "c+", "2295" },
403 { "c*", "2297" },
404 { "pp", "22A5" },
405 { "md", "22C5" },
406 { "lc", "2308" },
407 { "rc", "2309" },
408 { "lf", "230A" },
409 { "rf", "230B" },
410 { "la", "2329" },
411 { "ra", "232A" },
412 { "CR", "240D" },
413 { "an", "2500" },
414 { "br", "2502" },
415 { "bv", "2502" },
416 { "rk", "251D" },
417 { "lk", "2525" },
418 { "lt", "256D" },
419 { "rt", "256E" },
420 { "rb", "256F" },
421 { "lb", "2570" },
422 { "sq", "25A1" },
423 { "lz", "25CA" },
424 { "ci", "25EF" },
425 { "lh", "261C" },
426 { "rh", "261E" },
427 { "SP", "2660" },
428 { "CL", "2663" },
429 { "HE", "2665" },
430 { "DI", "2666" },
431 { "ff", "FB00" },
432 { "fi", "FB01" },
433 { "fl", "FB02" },
434 { "Fi", "FB03" },
435 { "Fl", "FB04" },
438 // global constructor
439 static struct glyph_to_unicode_init {
440 glyph_to_unicode_init();
441 } _glyph_to_unicode_init;
443 glyph_to_unicode_init::glyph_to_unicode_init() {
444 for (unsigned int i = 0;
445 i < sizeof(glyph_to_unicode_list)/sizeof(glyph_to_unicode_list[0]);
446 i++) {
447 glyph_to_unicode *gtu = new glyph_to_unicode;
448 gtu->value = glyph_to_unicode_list[i].value;
449 glyph_to_unicode_table.define(glyph_to_unicode_list[i].key, gtu);
453 const char *glyph_name_to_unicode(const char *s)
455 glyph_to_unicode *result = glyph_to_unicode_table.lookup(s);
456 return result ? result->value : 0;