Unicode/7bitrepl.lnx

   1 # Default 7bit replacements.
   2 #
   3 # Default 7bit replacements.  If the MIME name is set to us-ascii,
   4 # this will be identified with the "7 bit approximations" Display
   5 # character set.
   6 #
   7 # This table is very important and should not be excluded from the distribution
   8 # since this is a default fallback for any 8bit user's "display character set"
   9 # which (nearly) of 256 chars and could not map a rich Unicode repertoire.
  10 #
  11 # M.P.: unicode to ascii table. I took this file from lynx.
  12 # lynx/src/chrtrans/def7_uni.tbl
  13
  14 #The MIME name of this charset.
  15 Mus-ascii
  16
  17 # Shall this become the "default" translation table?  YES!
  18 # There has to be exactly one table marked as "default".
  19 D1
  20
  21
  22 # us-ascii characters should not normally pass here,
  23 # they are always processed directly but let declare them here:
  24 0x20-0x7e  idem
  25
  26
  27 # NO-BREAK SPACE,
  28 # should not happen (processed in the code):
  29 #U+00a0:NS
  30 U+00a1:!
  31 U+00a2:-c-
  32 U+00a3:-L-
  33 U+00a4:CUR
  34 U+00a5:YEN
  35 U+00a6:|
  36 U+00a7:S:
  37 U+00a8:"
  38 # COPYRIGHT SIGN:
  39 U+00a9:(c)
  40 U+00aa:-a
  41 U+00ab:<<
  42 U+00ac:NOT
  43 # SOFT HYPHEN,
  44 # should not happen (processed in the code):
  45 #U+00ad:-
  46 # XXX: The following is missing in original lynx, not sure if we should do
  47 # anything about it...? --pasky
  48 U+00ad:
  49 # REGISTERED SIGN:
  50 U+00ae:(R)
  51 U+00af:-
  52 U+00b0:DEG
  53 U+00b1:+-
  54 U+00b2:^2
  55 U+00b3:^3
  56 U+00b4:'
  57 # My -> u
  58 U+00b5:u
  59 U+00b6:P:
  60 U+00b7:.
  61 U+00b8:,
  62 U+00b9:^1
  63 U+00ba:-o
  64 U+00bb:>>
  65 U+00bc: 1/4
  66 U+00bd: 1/2
  67 U+00be: 3/4
  68 U+00bf:?
  69 0x41    U+00c0-U+00c3
  70 # &Auml;, not the best choice for some languages.
  71 U+00c4:Ae
  72 U+00c5:AA
  73 U+00c6:AE
  74 U+00c7:C,
  75 0x45    U+00c8-U+00cb
  76 0x49    U+00cc-U+00cf
  77 U+00d0:D-
  78 0x4e    U+00d1
  79 0x4f    U+00d2-U+00d5
  80 # &Ouml;, not the best choice for some languages.
  81 U+00d6:Oe
  82 U+00d7: *
  83 U+00d8:O/
  84 0x55    U+00d9-U+00db
  85 # &Uuml;, not the best choice for some languages.
  86 U+00dc:Ue
  87 0x59    U+00dd
  88 U+00de:TH
  89 U+00df:ss
  90 U+00e0:`a
  91 0x61    U+00e1-U+00e3
  92 # &auml;, not the best choice for some languages.
  93 U+00e4:ae
  94 U+00e5:aa
  95 U+00e6:ae
  96 U+00e7:c,
  97 0x65    U+00e8-U+00eb
  98 U+00ec:`i
  99 0x69    U+00ed-U+00ef
 100 U+00f0:d-
 101 0x6e    U+00f1
 102 0x6f    U+00f2-U+00f5
 103 # &ouml;, not the best choice for some languages.
 104 U+00f6:oe
 105 U+00f7:-:
 106 U+00f8:o/
 107 0x75    U+00f9-U+00fb
 108 # &uuml;, not the best choice for some languages.
 109 U+00fc:ue
 110 0x79    U+00fd
 111 U+00fe:th
 112 0x79    U+00ff
 113 # end of latin-1 repertoire
 114 0x41    U+0100  U+0102  U+0104                  # A
 115 0x61    U+0101  U+0103  U+0105                  # a
 116 0x43    U+0106  U+010a  U+010c                  # C
 117 # "Fundamento de Esperanto"
 118 U+0108:CH
 119 # The following line is an example for mapping several accented versions
 120 # of small letter 'c' to 'c':
 121 0x63    U+0107  U+010b  U+010d          # c
 122 # "Fundamento de Esperanto"
 123 U+0109:ch
 124 0x44    U+010e
 125 0x64    U+010f
 126 U+0110:D/
 127 U+0111:d/
 128 0x45    U+0112  U+0114  U+0116  U+0118  U+011a  # E
 129 0x65    U+0113  U+0115  U+0117  U+0119  U+011b  # e
 130 0x47    U+011e  U+0120  U+0122          # G
 131
 132 # "Fundamento de Esperanto"
 133 U+011c:GH
 134 0x67    U+011f  U+0121  U+0123          # g
 135 U+011d:gh
 136 U+0124:HH
 137 U+0125:hh
 138
 139 U+0126:H/
 140 0x48    U+0127 #        LATIN SMALL LETTER H BAR        -> H
 141 0x49    U+0128  U+012a  U+012c  U+012e  U+0130  # I
 142 0x69    U+0129  U+012b  U+012d  U+012f  U+0131  # i
 143 U+0132:IJ
 144 U+0133:ij
 145
 146 # "Fundamento de Esperanto"
 147 U+0134:JH
 148 U+0135:jh
 149
 150 0x4b    U+0136
 151 0x6b    U+0137
 152 U+0138:kk
 153 0x4c    U+0139  U+013b  U+013d                  # L
 154 0x6c    U+013a  U+013c  U+013e                  # l
 155 U+013f:L.
 156 U+0140:l.
 157 U+0141:L/
 158 U+0142:l/
 159 0x4e    U+0143  U+0145  U+0147                  # N
 160 0x6e    U+0144  U+0146  U+0148                  # n
 161 U+0149:'n
 162 U+014a:NG
 163 0x4e    U+014B #        LATIN SMALL LETTER ENG  -> N
 164 0x4f    U+014c  U+014e                          # O
 165 0x6f    U+014d  U+014f                          # o
 166 U+0150:O"
 167 U+0151:o"
 168 U+0152:OE
 169 U+0153:oe
 170 0x52    U+0154  U+0156  U+0158                  # R
 171 0x72    U+0155  U+0157  U+0159                  # r
 172
 173 # "Fundamento de Esperanto"
 174 0x53    U+015a  U+015e  U+0160          # S
 175 U+015c:SH
 176 0x73    U+015b  U+015f  U+0161          # s
 177 U+015d:sh
 178
 179 0x54    U+0162  U+0164                          # T
 180 0x74    U+0163  U+0165                          # t
 181 U+0166:T/
 182 U+0167:t/
 183 0x55    U+0168  U+016a  U+016e  U+0172          # U
 184 # "Fundamento"
 185 U+016c:U
 186 0x75    U+0169  U+016b  U+016f  U+0173  # u
 187 # "Fundamento"
 188 U+016d:u
 189 U+0170:U"
 190 U+0171:u"
 191 0x57    U+0174
 192 0x77    U+0175
 193 0x59    U+0176  U+0178
 194 0x79    U+0177
 195 0x5a    U+0179  U+017b  U+017d  U+021d
 196 0x7a    U+017a  U+017c  U+017e
 197 U+017f:s1
 198 U+0187:C2
 199 U+0188:c2
 200 U+0191:F2
 201 U+0192: f
 202 U+0198:K2
 203 U+0199:k2
 204 U+01a0:O9
 205 U+01a1:o9
 206 U+01a2:OI
 207 U+01a3:oi
 208 U+01a6:yr
 209 U+01af:U9
 210 U+01b0:u9
 211 U+01b5:Z/
 212 U+01b6:z/
 213 U+01b7:ED
 214 0x41    U+01cd
 215 0x61    U+01ce
 216 0x49    U+01cf
 217 0x69    U+01d0
 218 0x4f    U+01d1
 219 0x6f    U+01d2
 220 0x55    U+01d3
 221 0x75    U+01d4
 222 U+01d5:U:-
 223 U+01d6:u:-
 224 U+01d7:U:'
 225 U+01d8:u:'
 226 U+01d9:U:<
 227 U+01da:u:<
 228 U+01db:U:!
 229 U+01dc:u:!
 230 U+01de:A1
 231 U+01df:a1
 232 U+01e0:A7
 233 U+01e1:a7
 234 U+01e2:A3
 235 U+01e3:a3
 236 U+01e4:G/
 237 U+01e5:g/
 238 0x47    U+01e6
 239 0x67    U+01e7
 240 0x4b    U+01e8
 241 0x6b    U+01e9
 242 0x4f    U+01ea
 243 0x6f    U+01eb
 244 U+01ec:O1
 245 U+01ed:o1
 246 U+01ee:EZ
 247 U+01ef:ez
 248 0x6a    U+01f0
 249 0x47    U+01f4
 250 0x67    U+01f5
 251 U+01fa:AA'
 252 U+01fb:aa'
 253 U+01fc:AE'
 254 U+01fd:ae'
 255 U+01fe:O/'
 256 U+01ff:o/'
 257 U+0200:A!!
 258 U+0201:a!!
 259 U+0202:A)
 260 U+0203:a)
 261 U+0204:E!!
 262 U+0205:e!!
 263 U+0206:E)
 264 U+0207:e)
 265 U+0208:I!!
 266 U+0209:i!!
 267 U+020a:I)
 268 U+020b:i)
 269 U+020c:O!!
 270 U+020d:o!!
 271 U+020e:O)
 272 U+020f:o)
 273 U+0210:R!!
 274 U+0211:r!!
 275 U+0212:R)
 276 U+0213:r)
 277 U+0214:U!!
 278 U+0215:u!!
 279 U+0216:U)
 280 U+0217:u)
 281
 282 # IPA symbols, from
 283 #   Linkname: FAQ: Representing IPA Phonetics in ASCII
 284 #        URL: http://www.hpl.hp.com/personal/Evan_Kirshenbaum/IPA/faq.html
 285 #        (corrected in Russian Cyrillic area).
 286 #        (corrected in Greek area).
 287 #
 288 0x41    U+0251 #        LATIN SMALL LETTER SCRIPT A     -> A
 289 U+0252:A.
 290 U+0253:b`
 291 0x4f    U+0254 #        LATIN SMALL LETTER OPEN O       -> O
 292 U+0256:d.
 293 U+0257:d`
 294 U+0258:@<umd>
 295 0x40    U+0259 #        LATIN SMALL LETTER SCHWA        -> @
 296 0x52    U+025A #        LATIN SMALL LETTER SCHWA HOOK   -> R
 297 0x45    U+025B #        LATIN SMALL LETTER EPSILON      -> E
 298 U+025c:V"
 299 U+025d:R<umd>
 300 U+025e:O"
 301 0x4a    U+025F #        LATIN SMALL LETTER DOTLESS J BAR        -> J
 302 U+0260:g`
 303 0x67    U+0261 #        LATIN SMALL LETTER SCRIPT G
 304 0x47    U+0262 #        LATIN LETTER SMALL CAPITAL G
 305 0x51    U+0263 #        LATIN SMALL LETTER GAMMA        -> Q
 306 U+0264:o-
 307 U+0265:j<rnd>
 308 U+0266:h<?>
 309 U+0268:i"
 310 0x49    U+026A U+0269 # LATIN LETTER SMALL CAPITAL I, LATIN SMALL LETTER IOTA
 311 0x4c    U+026B #        LATIN SMALL LETTER L WITH MIDDLE TILDE
 312 0x4c    U+026C #        LATIN SMALL LETTER L BELT
 313 U+026d:l.
 314 U+026e:z<lat>
 315 U+026f:u-
 316 U+0270:j<vel>
 317 0x4d    U+0271 #        LATIN SMALL LETTER M HOOK
 318 U+0273:n.
 319 U+0274:n"
 320 U+0275:@.
 321 U+0276:&.
 322 0x55    U+0277 #        LATIN SMALL LETTER CLOSED OMEGA -> U
 323 0x72    U+0279 #        LATIN SMALL LETTER TURNED R     -> r
 324 U+027a:*<lat>
 325 U+027b:r.
 326 U+027d:*.
 327 0x2a    U+027E #        LATIN SMALL LETTER FISHHOOK R   -> *
 328 U+0280:r"
 329 0x52    U+0280 #        LATIN LETTER SMALL CAPITAL R    -> R
 330 U+0281:g"
 331 U+0282:s.
 332 0x53    U+0283 #        LATIN SMALL LETTER ESH  -> S
 333 U+0284:J`
 334 U+0287:t!
 335 U+0288:t.
 336 U+0289:u"
 337 0x55    U+028A #        LATIN SMALL LETTER UPSILON      -> U
 338 U+028b:r<lbd>
 339 0x56    U+028C #        LATIN SMALL LETTER TURNED V     -> V
 340 U+028d:w<vls>
 341 U+028e:l^
 342 U+028f:I.
 343 U+0290:z.
 344 U+0292:Z
 345 0x3f    U+0294 #        LATIN SMALL LETTER GLOTTAL STOP -> ?
 346 U+0295:H<vcd>
 347 U+0296:l!
 348 U+0297:c!
 349 U+0298:p!
 350 U+0299:b<trl>
 351 U+029b:G`
 352 0x6a    U+029d #        LATIN SMALL LETTER CROSSED-TAIL J
 353 U+029e:k!
 354 0x4c    U+029F #        LATIN LETTER SMALL CAPITAL L
 355 U+02a0:q`
 356 U+02a4:d3
 357 U+02a6:ts
 358 U+02a7:tS
 359 U+02b0:<h>
 360 U+02b1:<?>
 361 0x3b    U+02b2 U+0321
 362 U+02b3:<r>
 363 U+02b7:<w>
 364 U+02bb:;S
 365 0x60    U+02bc
 366 U+02c6:^
 367 U+02c7:'<
 368 U+02c8:|
 369 U+02c9:1-
 370 U+02cb:1!
 371 0x3a    U+02d0
 372 U+02d1::\\
 373 0x2b    U+02d6
 374 0x2d    U+02d7
 375 U+02d8:'(
 376 U+02d9:'.
 377 U+02da:'0
 378 U+02db:';
 379 U+02dc:~
 380 U+02dd:'"
 381 U+02e5:_T
 382 U+02e6:_H
 383 U+02e7:_M
 384 U+02e8:_L
 385 U+02e9:_B
 386 U+02ec:_v
 387 U+02ee:''
 388 0x60    U+0300
 389 0x27    U+0301
 390 0x5e    U+0302
 391 0x7e    U+0303  U+0334
 392 U+030b:''
 393 0x7c    U+030d
 394 U+030e:||
 395 U+030f:``
 396 0x2e    U+0322  U+0323
 397 U+0324:<?>
 398 U+0325:<o>
 399 0x2c    U+0326  U+0327
 400 0x2d    U+0329
 401 0x5b    U+032a
 402 U+032b:<w>
 403 U+0334:<H>
 404 0x2f    U+0337  U+0338
 405 U+0340:`
 406 U+0341:'
 407 U+0342:~
 408 U+0344:'%
 409 U+0345:j3
 410 U+0347:=
 411 U+0360:~~
 412 U+0374:'
 413 U+0375:,
 414 U+037a:j3
 415 U+037e:?%
 416 U+0384:'*
 417 U+0385:'%
 418 # Greek letters
 419 U+0386:A'
 420 U+0387:.*
 421 U+0388:E'
 422 U+0389:Y%
 423 U+038a:I'
 424 U+038c:O'
 425 U+038e:U%
 426 U+038f:W%
 427 U+0390:i3
 428 U+0391:A
 429 U+0392:B
 430 U+0393:G
 431 U+0394:D
 432 U+0395:E
 433 U+0396:Z
 434 U+0397:Y
 435 U+0398:TH
 436 U+0399:I
 437 U+039a:K
 438 U+039b:L
 439 U+039c:M
 440 U+039d:N
 441 U+039e:C
 442 U+039f:O
 443 U+03a0:P
 444 U+03a1:R
 445 U+03a3:S
 446 U+03a4:T
 447 U+03a5:U
 448 U+03a6:F
 449 U+03a7:X
 450 U+03a8:Q
 451 U+03a9:W*
 452 U+03aa:J
 453 U+03ab:V*
 454 U+03ac:a'
 455 U+03ad:e'
 456 U+03ae:y%
 457 U+03af:i'
 458 U+03b0:u3
 459 U+03b1:a
 460 U+03b2:b
 461 U+03b3:g
 462 U+03b4:d
 463 U+03b5:e
 464 U+03b6:z
 465 U+03b7:y
 466 U+03b8:th
 467 U+03b9:i
 468 U+03ba:k
 469 U+03bb:l
 470 U+03bc:m
 471 U+03bd:n
 472 U+03be:c
 473 U+03bf:o
 474 U+03c0:p
 475 U+03c1:r
 476 U+03c2:*s
 477 U+03c3:s
 478 U+03c4:t
 479 U+03c5:u
 480 U+03c6:f
 481 U+03c7:x
 482 U+03c8:q
 483 U+03c9:w
 484 U+03ca:j
 485 U+03cb:v*
 486 U+03cc:o'
 487 U+03cd:u%
 488 U+03ce:w%
 489 # Greek symbols
 490 U+03d0:beta
 491 U+03d1:theta
 492 U+03d2:upsi
 493 U+03d5:phi
 494 U+03d6:pi
 495 U+03d7:k.
 496 U+03da:T3
 497 U+03db:t3
 498 U+03dc:M3
 499 U+03dd:m3
 500 U+03de:K3
 501 U+03df:k3
 502 U+03e0:P3
 503 U+03e1:p3
 504 U+03f0:kappa
 505 U+03f1:rho
 506 U+03f3:J
 507 U+03f4:'%
 508 U+03f5:j3
 509 # Cyrillic capital letters
 510 U+0402:D%
 511 U+0403:G%
 512 U+0404:IE
 513 U+0405:DS
 514 U+0406:II
 515 U+0407:YI
 516 U+0408:J%
 517 U+0409:LJ
 518 U+040a:NJ
 519 U+040b:Ts
 520 U+040c:KJ
 521 U+040e:V%
 522 U+040f:DZ
 523 # Russian Cyrillic letters, transliterated
 524 U+0401:IO
 525 U+0410:A
 526 U+0411:B
 527 U+0412:V
 528 U+0413:G
 529 U+0414:D
 530 U+0415:E
 531 U+0416:ZH
 532 U+0417:Z
 533 U+0418:I
 534 U+0419:J
 535 U+041a:K
 536 U+041b:L
 537 U+041c:M
 538 U+041d:N
 539 U+041e:O
 540 U+041f:P
 541 U+0420:R
 542 U+0421:S
 543 U+0422:T
 544 U+0423:U
 545 U+0424:F
 546 U+0425:H
 547 U+0426:C
 548 U+0427:CH
 549 U+0428:SH
 550 U+0429:SCH
 551 U+042a:"
 552 U+042b:Y
 553 U+042c:'
 554 U+042d:`E
 555 U+042e:YU
 556 U+042f:YA
 557 U+0430:a
 558 U+0431:b
 559 U+0432:v
 560 U+0433:g
 561 U+0434:d
 562 U+0435:e
 563 U+0436:zh
 564 U+0437:z
 565 U+0438:i
 566 U+0439:j
 567 U+043a:k
 568 U+043b:l
 569 U+043c:m
 570 U+043d:n
 571 U+043e:o
 572 U+043f:p
 573 U+0440:r
 574 U+0441:s
 575 U+0442:t
 576 U+0443:u
 577 U+0444:f
 578 U+0445:h
 579 U+0446:c
 580 U+0447:ch
 581 U+0448:sh
 582 U+0449:sch
 583 U+044a:"
 584 U+044b:y
 585 U+044c:'
 586 U+044d:`e
 587 U+044e:yu
 588 U+044f:ya
 589 U+0451:io
 590 # end of Russian Cyrillic letters.
 591 # Cyrillic small letters (and some archaic)
 592 U+0452:d%
 593 U+0453:g%
 594 U+0454:ie
 595 U+0455:ds
 596 U+0456:ii
 597 U+0457:yi
 598 U+0458:j%
 599 U+0459:lj
 600 U+045a:nj
 601 U+045b:ts
 602 U+045c:kj
 603 U+045e:v%
 604 U+045f:dz
 605 U+0462:Y3
 606 U+0463:y3
 607 U+046a:O3
 608 U+046b:o3
 609 U+0472:F3
 610 U+0473:f3
 611 U+0474:V3
 612 U+0475:v3
 613 U+0480:C3
 614 U+0481:c3
 615 U+0490:G3
 616 U+0491:g3
 617 U+04d4:AE
 618 U+04d5:ae
 619 # These may make Yiddish slightly more readable, until we have
 620 # something better.
 621
 622 0x69    U+05b4  # i
 623 0x61    U+05b7  # a
 624 0x6f    U+05b8  # o
 625 0x75    U+05bc  # u
 626 0x68    U+05bf  # h
 627 0x3a    U+05c2  # :
 628
 629 0x76    U+05f0  # v
 630 U+05f1:oy
 631 U+05f2:ey
 632
 633 # U+05d0:A+
 634 0x23    U+05d0  # '#'
 635
 636 U+05d1:B+
 637 U+05d2:G+
 638 U+05d3:D+
 639 U+05d4:H+
 640 U+05d5:W+
 641 U+05d6:Z+
 642 U+05d7:X+
 643 U+05d8:Tj
 644 U+05d9:J+
 645 U+05da:K%
 646 U+05db:K+
 647 U+05dc:L+
 648 U+05dd:M%
 649 U+05de:M+
 650 U+05df:N%
 651 U+05e0:N+
 652 U+05e1:S+
 653 U+05e2:E+
 654 U+05e3:P%
 655 U+05e4:P+
 656 U+05e5:Zj
 657 U+05e6:ZJ
 658 U+05e7:Q+
 659 U+05e8:R+
 660 U+05e9:Sh
 661 U+05ea:T+
 662
 663 U+060c:,+
 664 U+061b:;+
 665 U+061f:?+
 666 U+0621:H'
 667 U+0622:aM
 668 U+0623:aH
 669 U+0624:wH
 670 U+0625:ah
 671 U+0626:yH
 672 U+0627:a+
 673 U+0628:b+
 674 U+0629:tm
 675 U+062a:t+
 676 U+062b:tk
 677 U+062c:g+
 678 U+062d:hk
 679 U+062e:x+
 680 U+062f:d+
 681 U+0630:dk
 682 U+0631:r+
 683 U+0632:z+
 684 U+0633:s+
 685 U+0634:sn
 686 U+0635:c+
 687 U+0636:dd
 688 U+0637:tj
 689 U+0638:zH
 690 U+0639:e+
 691 U+063a:i+
 692 U+0640:++
 693 U+0641:f+
 694 U+0642:q+
 695 U+0643:k+
 696 U+0644:l+
 697 U+0645:m+
 698 U+0646:n+
 699 U+0647:h+
 700 U+0648:w+
 701 U+0649:j+
 702 U+064a:y+
 703 U+064b::+
 704 U+064c:"+
 705 U+064d:=+
 706 U+064e:/+
 707 U+064f:'+
 708 U+0650:1+
 709 U+0651:3+
 710 U+0652:0+
 711 U+0660:0a
 712 U+0661:1a
 713 U+0662:2a
 714 U+0663:3a
 715 U+0664:4a
 716 U+0665:5a
 717 U+0666:6a
 718 U+0667:7a
 719 U+0668:8a
 720 U+0669:9a
 721 U+0670:aS
 722 U+067e:p+
 723 U+0681:hH
 724 U+0686:tc
 725 U+0698:zj
 726 U+06a4:v+
 727 U+06af:gf
 728 U+06f0:0a
 729 U+06f1:1a
 730 U+06f2:2a
 731 U+06f3:3a
 732 U+06f4:4a
 733 U+06f5:5a
 734 U+06f6:6a
 735 U+06f7:7a
 736 U+06f8:8a
 737 U+06f9:9a
 738
 739 # Replacement strings for Ethiopic characters
 740 U+1200:he
 741 U+1201:hu
 742 U+1202:hi
 743 U+1203:ha
 744 U+1204:hE
 745 0x68    U+1205  #:h
 746 U+1206:ho
 747 U+1208:le
 748 U+1209:lu
 749 U+120A:li
 750 U+120B:la
 751 U+120C:lE
 752 0x6c    U+120D  #:l
 753 U+120E:lo
 754 U+120F:lWa
 755 U+1210:He
 756 U+1211:Hu
 757 U+1212:Hi
 758 U+1213:Ha
 759 U+1214:HE
 760 0x48    U+1215  #:H
 761 U+1216:Ho
 762 U+1217:HWa
 763 U+1218:me
 764 U+1219:mu
 765 U+121A:mi
 766 U+121B:ma
 767 U+121C:mE
 768 0x6d    U+121D  #:m
 769 U+121E:mo
 770 U+121F:mWa
 771 U+1220:`se
 772 U+1221:`su
 773 U+1222:`si
 774 U+1223:`sa
 775 U+1224:`sE
 776 U+1225:`s
 777 U+1226:`so
 778 U+1227:`sWa
 779 U+1228:re
 780 U+1229:ru
 781 U+122A:ri
 782 U+122B:ra
 783 U+122C:rE
 784 0x72    U+122D  #:r
 785 U+122E:ro
 786 U+122F:rWa
 787 U+1230:se
 788 U+1231:su
 789 U+1232:si
 790 U+1233:sa
 791 U+1234:sE
 792 0x73    U+1235  #:s
 793 U+1236:so
 794 U+1237:sWa
 795 U+1238:xe
 796 U+1239:xu
 797 U+123A:xi
 798 U+123B:xa
 799 U+123C:xE
 800 U+123D:xa
 801 U+123E:xo
 802 U+123F:xWa
 803 U+1240:qe
 804 U+1241:qu
 805 U+1242:qi
 806 U+1243:qa
 807 U+1244:qE
 808 0x71    U+1245  #:q
 809 U+1246:qo
 810 U+1248:qWe
 811 U+124A:qWi
 812 U+124B:qWa
 813 U+124C:qWE
 814 U+124D:qW
 815 U+1250:Qe
 816 U+1251:Qu
 817 U+1252:Qi
 818 U+1253:Qa
 819 U+1254:QE
 820 0x51    U+1255  #:Q
 821 U+1256:Qo
 822 U+1258:QWe
 823 U+125A:QWi
 824 U+125B:QWa
 825 U+125C:QWE
 826 U+125D:QW
 827 U+1260:be
 828 U+1261:bu
 829 U+1262:bi
 830 U+1263:ba
 831 U+1264:bE
 832 0x62    U+1265  #:b
 833 U+1266:bo
 834 U+1267:bWa
 835 U+1268:ve
 836 U+1269:vu
 837 U+126A:vi
 838 U+126B:va
 839 U+126C:vE
 840 0x76    U+126D  #:v
 841 U+126E:vo
 842 U+126F:vWa
 843 U+1270:te
 844 U+1271:tu
 845 U+1272:ti
 846 U+1273:ta
 847 U+1274:tE
 848 0x74    U+1275  #:t
 849 U+1276:to
 850 U+1277:tWa
 851 U+1278:ce
 852 U+1279:cu
 853 U+127A:ci
 854 U+127B:ca
 855 U+127C:cE
 856 0x63    U+127D  #:c
 857 U+127E:co
 858 U+127F:cWa
 859 U+1280:`he
 860 U+1281:`hu
 861 U+1282:`hi
 862 U+1283:`ha
 863 U+1284:`hE
 864 U+1285:`h
 865 U+1286:`ho
 866 U+1288:hWe
 867 U+128A:hWi
 868 U+128B:hWa
 869 U+128C:hWE
 870 U+128D:hW
 871 U+1290:na
 872 U+1291:nu
 873 U+1292:ni
 874 U+1293:na
 875 U+1294:nE
 876 0x6e    U+1295  #:n
 877 U+1296:no
 878 U+1297:nWa
 879 U+1298:Ne
 880 U+1299:Nu
 881 U+129A:Ni
 882 U+129B:Na
 883 U+129C:NE
 884 0x4e    U+129D  #:N
 885 U+129E:No
 886 U+129F:NWa
 887 0x65    U+12A0  #:e
 888 0x75    U+12A1  #:u
 889 0x69    U+12A2  #:i
 890 0x61    U+12A3  #:a
 891 0x45    U+12A4  #:E
 892 0x49    U+12A5  #:I
 893 0x6f    U+12A6  #:o
 894 U+12A7:e3
 895 U+12A8:ke
 896 U+12A9:ku
 897 U+12AA:ki
 898 U+12AB:ka
 899 U+12AC:kE
 900 0x6b    U+12AD  #:k
 901 U+12AE:ko
 902 U+12B0:kWe
 903 U+12B2:kWi
 904 U+12B3:kWa
 905 U+12B4:kWE
 906 U+12B5:kW
 907 U+12B8:Ke
 908 U+12B9:Ku
 909 U+12BA:Ki
 910 U+12BB:Ka
 911 U+12BC:KE
 912 0x4b    U+12BD  #:K
 913 U+12BE:Ko
 914 U+12C0:KWe
 915 U+12C2:KWi
 916 U+12C3:KWa
 917 U+12C4:KWE
 918 U+12C5:KW
 919 U+12C8:we
 920 U+12C9:wu
 921 U+12CA:wi
 922 U+12CB:wa
 923 U+12CC:wE
 924 0x77    U+12CD  #:w
 925 U+12CE:wo
 926 U+12D0:`e
 927 U+12D1:`u
 928 U+12D2:`i
 929 U+12D3:`a
 930 U+12D4:`E
 931 U+12D5:`I
 932 U+12D6:`o
 933 U+12D8:ze
 934 U+12D9:zu
 935 U+12DA:zi
 936 U+12DB:za
 937 U+12DC:zE
 938 0x7a    U+12DD  #:z
 939 U+12DE:zo
 940 U+12DF:zWa
 941 U+12E0:Ze
 942 U+12E1:Zu
 943 U+12E2:Zi
 944 U+12E3:Za
 945 U+12E4:ZE
 946 0x5a    U+12E5  #:Z
 947 U+12E6:Zo
 948 U+12E7:ZWa
 949 U+12E8:ye
 950 U+12E9:yu
 951 U+12EA:yi
 952 U+12EB:ya
 953 U+12EC:yE
 954 0x79    U+12ED  #:y
 955 U+12EE:yo
 956 U+12EF:yWa
 957 U+12F0:de
 958 U+12F1:du
 959 U+12F2:di
 960 U+12F3:da
 961 U+12F4:dE
 962 0x64    U+12F5  #:d
 963 U+12F6:do
 964 U+12F7:dWa
 965 U+12F8:De
 966 U+12F9:Du
 967 U+12FA:Di
 968 U+12FB:Da
 969 U+12FC:DE
 970 0x44    U+12FD  #:D
 971 U+12FE:Do
 972 U+12FF:DWa
 973 U+1300:je
 974 U+1301:ju
 975 U+1302:ji
 976 U+1303:ja
 977 U+1304:jE
 978 0x6a    U+1305  #:j
 979 U+1306:jo
 980 U+1307:jWa
 981 U+1308:ga
 982 U+1309:gu
 983 U+130A:gi
 984 U+130B:ga
 985 U+130C:gE
 986 0x67    U+130D  #:g
 987 U+130E:go
 988 U+1310:gWu
 989 U+1312:gWi
 990 U+1313:gWa
 991 U+1314:gWE
 992 U+1315:gW
 993 U+1318:Ge
 994 U+1319:Gu
 995 U+131A:Gi
 996 U+131B:Ga
 997 U+131C:GE
 998 0x47    U+131D  #:G
 999 U+131E:Go
1000 U+131F:GWa
1001 U+1320:Te
1002 U+1321:Tu
1003 U+1322:Ti
1004 U+1323:Ta
1005 U+1324:TE
1006 0x54    U+1325  #:T
1007 U+1326:To
1008 U+1327:TWa
1009 U+1328:Ce
1010 U+1329:Ca
1011 U+132A:Cu
1012 U+132B:Ca
1013 U+132C:CE
1014 0x43    U+132D  #:C
1015 U+132E:Co
1016 U+132F:CWa
1017 U+1330:Pe
1018 U+1331:Pu
1019 U+1332:Pi
1020 U+1333:Pa
1021 U+1334:PE
1022 0x50    U+1335  #:P
1023 U+1336:Po
1024 U+1337:PWa
1025 U+1338:SWe
1026 U+1339:SWu
1027 U+133A:SWi
1028 U+133B:SWa
1029 U+133C:SWE
1030 U+133D:SW
1031 U+133E:SWo
1032 U+133F:SWa
1033 U+1340:`Sa
1034 U+1341:`Su
1035 U+1342:`Si
1036 U+1343:`Sa
1037 U+1344:`SE
1038 U+1345:`S
1039 U+1346:`So
1040 U+1348:fa
1041 U+1349:fu
1042 U+134A:fi
1043 U+134B:fa
1044 U+134C:fE
1045 0x6f    U+134D  #:f
1046 U+134E:fo
1047 U+134F:fWa
1048 U+1350:pe
1049 U+1351:pu
1050 U+1352:pi
1051 U+1353:pa
1052 U+1354:pE
1053 0x70    U+1355  #:p
1054 U+1356:po
1055 U+1357:pWa
1056 U+1358:mYa
1057 U+1359:rYa
1058 U+135A:fYa
1059 # ETHIOPIC SPACE U+1360 mapped to ASCII space
1060 0x20    U+1360
1061 0x3a    U+1361  #::
1062 U+1362:::
1063 0x2c    U+1363  #:,
1064 U+1364:;
1065 U+1365:-:
1066 U+1366::-
1067 U+1367:`?
1068 U+1368::|:
1069 U+1369:`1
1070 U+136A:`2
1071 U+136B:`3
1072 U+136C:`4
1073 U+136D:`5
1074 U+136E:`6
1075 U+136F:`7
1076 U+1370:`8
1077 U+1371:`9
1078 U+1372:`10
1079 U+1373:`20
1080 U+1374:`30
1081 U+1375:`40
1082 U+1376:`50
1083 U+1377:`60
1084 U+1378:`70
1085 U+1379:`80
1086 U+137A:`90
1087 U+137B:`100
1088 U+137C:`10000
1089
1090
1091 U+1e00:A-0
1092 U+1e01:a-0
1093 U+1e02:B.
1094 U+1e03:b.
1095 U+1e04:B-.
1096 U+1e05:b-.
1097 U+1e06:B_
1098 U+1e07:b_
1099 U+1e08:C,'
1100 U+1e09:c,'
1101 U+1e0a:D.
1102 U+1e0b:d.
1103 U+1e0c:D-.
1104 U+1e0d:d-.
1105 U+1e0e:D_
1106 U+1e0f:d_
1107 U+1e10:D,
1108 U+1e11:d,
1109 U+1e12:D->
1110 U+1e13:d->
1111 U+1e14:E-!
1112 U+1e15:e-!
1113 U+1e16:E-'
1114 U+1e17:e-'
1115 U+1e18:E->
1116 U+1e19:e->
1117 U+1e1a:E-?
1118 U+1e1b:e-?
1119 U+1e1c:E,(
1120 U+1e1d:e,(
1121 U+1e1e:F.
1122 U+1e1f:f.
1123 U+1e20:G-
1124 U+1e21:g-
1125 U+1e22:H.
1126 U+1e23:h.
1127 U+1e24:H-.
1128 U+1e25:h-.
1129 U+1e26:H:
1130 U+1e27:h:
1131 U+1e28:H,
1132 U+1e29:h,
1133 U+1e2a:H-(
1134 U+1e2b:h-(
1135 U+1e2c:I-?
1136 U+1e2d:i-?
1137 U+1e2e:I:'
1138 U+1e2f:i:'
1139 U+1e30:K'
1140 U+1e31:k'
1141 U+1e32:K-.
1142 U+1e33:k-.
1143 U+1e34:K_
1144 U+1e35:k_
1145 U+1e36:L-.
1146 U+1e37:l-.
1147 U+1e38:L--.
1148 U+1e39:l--.
1149 U+1e3a:L_
1150 U+1e3b:l_
1151 U+1e3c:L->
1152 U+1e3d:l->
1153 U+1e3e:M'
1154 U+1e3f:m'
1155 U+1e40:M.
1156 U+1e41:m.
1157 U+1e42:M-.
1158 U+1e43:m-.
1159 U+1e44:N.
1160 U+1e45:n.
1161 U+1e46:N-.
1162 U+1e47:n-.
1163 U+1e48:N_
1164 U+1e49:n_
1165 U+1e4a:N->
1166 U+1e4b:n->
1167 U+1e4c:O?'
1168 U+1e4d:o?'
1169 U+1e4e:O?:
1170 U+1e4f:o?:
1171 U+1e50:O-!
1172 U+1e51:o-!
1173 U+1e52:O-'
1174 U+1e53:o-'
1175 U+1e54:P'
1176 U+1e55:p'
1177 U+1e56:P.
1178 U+1e57:p.
1179 U+1e58:R.
1180 U+1e59:r.
1181 U+1e5a:R-.
1182 U+1e5b:r-.
1183 U+1e5c:R--.
1184 U+1e5d:r--.
1185 U+1e5e:R_
1186 U+1e5f:r_
1187 U+1e60:S.
1188 U+1e61:s.
1189 U+1e62:S-.
1190 U+1e63:s-.
1191 U+1e64:S'.
1192 U+1e65:s'.
1193 U+1e66:S<.
1194 U+1e67:s<.
1195 U+1e68:S.-.
1196 U+1e69:s.-.
1197 U+1e6a:T.
1198 U+1e6b:t.
1199 U+1e6c:T-.
1200 U+1e6d:t-.
1201 U+1e6e:T_
1202 U+1e6f:t_
1203 U+1e70:T->
1204 U+1e71:t->
1205 U+1e72:U--:
1206 U+1e73:u--:
1207 U+1e74:U-?
1208 U+1e75:u-?
1209 U+1e76:U->
1210 U+1e77:u->
1211 U+1e78:U?'
1212 U+1e79:u?'
1213 U+1e7a:U-:
1214 U+1e7b:u-:
1215 U+1e7c:V?
1216 U+1e7d:v?
1217 U+1e7e:V-.
1218 U+1e7f:v-.
1219 U+1e80:W!
1220 U+1e81:w!
1221 U+1e82:W'
1222 U+1e83:w'
1223 U+1e84:W:
1224 U+1e85:w:
1225 U+1e86:W.
1226 U+1e87:w.
1227 U+1e88:W-.
1228 U+1e89:w-.
1229 U+1e8a:X.
1230 U+1e8b:x.
1231 U+1e8c:X:
1232 U+1e8d:x:
1233 U+1e8e:Y.
1234 U+1e8f:y.
1235 U+1e90:Z>
1236 U+1e91:z>
1237 U+1e92:Z-.
1238 U+1e93:z-.
1239 U+1e94:Z_
1240 U+1e95:z_
1241 U+1e96:h_
1242 U+1e97:t:
1243 U+1e98:w0
1244 U+1e99:y0
1245 U+1ea0:A-.
1246 U+1ea1:a-.
1247 U+1ea2:A2
1248 U+1ea3:a2
1249 U+1ea4:A>'
1250 U+1ea5:a>'
1251 U+1ea6:A>!
1252 U+1ea7:a>!
1253 U+1ea8:A>2
1254 U+1ea9:a>2
1255 U+1eaa:A>?
1256 U+1eab:a>?
1257 U+1eac:A>-.
1258 U+1ead:a>-.
1259 U+1eae:A('
1260 U+1eaf:a('
1261 U+1eb0:A(!
1262 U+1eb1:a(!
1263 U+1eb2:A(2
1264 U+1eb3:a(2
1265 U+1eb4:A(?
1266 U+1eb5:a(?
1267 U+1eb6:A(-.
1268 U+1eb7:a(-.
1269 U+1eb8:E-.
1270 U+1eb9:e-.
1271 U+1eba:E2
1272 U+1ebb:e2
1273 U+1ebc:E?
1274 U+1ebd:e?
1275 U+1ebe:E>'
1276 U+1ebf:e>'
1277 U+1ec0:E>!
1278 U+1ec1:e>!
1279 U+1ec2:E>2
1280 U+1ec3:e>2
1281 U+1ec4:E>?
1282 U+1ec5:e>?
1283 U+1ec6:E>-.
1284 U+1ec7:e>-.
1285 U+1ec8:I2
1286 U+1ec9:i2
1287 U+1eca:I-.
1288 U+1ecb:i-.
1289 U+1ecc:O-.
1290 U+1ecd:o-.
1291 U+1ece:O2
1292 U+1ecf:o2
1293 U+1ed0:O>'
1294 U+1ed1:o>'
1295 U+1ed2:O>!
1296 U+1ed3:o>!
1297 U+1ed4:O>2
1298 U+1ed5:o>2
1299 U+1ed6:O>?
1300 U+1ed7:o>?
1301 U+1ed8:O>-.
1302 U+1ed9:o>-.
1303 U+1eda:O9'
1304 U+1edb:o9'
1305 U+1edc:O9!
1306 U+1edd:o9!
1307 U+1ede:O92
1308 U+1edf:o92
1309 U+1ee0:O9?
1310 U+1ee1:o9?
1311 U+1ee2:O9-.
1312 U+1ee3:o9-.
1313 U+1ee4:U-.
1314 U+1ee5:u-.
1315 U+1ee6:U2
1316 U+1ee7:u2
1317 U+1ee8:U9'
1318 U+1ee9:u9'
1319 U+1eea:U9!
1320 U+1eeb:u9!
1321 U+1eec:U92
1322 U+1eed:u92
1323 U+1eee:U9?
1324 U+1eef:u9?
1325 U+1ef0:U9-.
1326 U+1ef1:u9-.
1327 U+1ef2:Y!
1328 U+1ef3:y!
1329 U+1ef4:Y-.
1330 U+1ef5:y-.
1331 U+1ef6:Y2
1332 U+1ef7:y2
1333 U+1ef8:Y?
1334 U+1ef9:y?
1335 0x61    U+1f00
1336 U+1f01:ha
1337 U+1f02:`a
1338 U+1f03:h`a
1339 U+1f04:a'
1340 U+1f05:ha'
1341 U+1f06:a~
1342 U+1f07:ha~
1343 0x41    U+1f08
1344 U+1f09:hA
1345 U+1f0a:`A
1346 U+1f0b:h`A
1347 U+1f0c:A'
1348 U+1f0d:hA'
1349 U+1f0e:A~
1350 U+1f0f:hA~
1351 U+1f11:he
1352 U+1f19:hE
1353 U+1f31:hi
1354 U+1f39:hI
1355 U+1f41:ho
1356 U+1f49:hO
1357 U+1f51:hu
1358 U+1f59:hU
1359 U+1fbf:,,
1360 U+1fc0:?*
1361 U+1fc1:?:
1362 U+1fcd:,!
1363 U+1fce:,'
1364 U+1fcf:?,
1365 U+1fdd:;!
1366 U+1fde:;'
1367 U+1fdf:?;
1368 U+1fe5:rh
1369 U+1fec:Rh
1370 U+1fed:!:
1371 U+1fef:!*
1372 U+1ffe:;;
1373 # General punctuation:
1374 0x20    U+2000 U+2002   U+2004-U+2009   # spaces
1375 U+2001:
1376 U+2003:
1377 U+200e:(->)
1378 U+200f:(<-)
1379 U+200a:
1380 0x2d    U+2010 U+2011 U+2013 U+2015     # hyphen-like
1381 U+2014:--
1382 U+2016:||
1383 U+2017:=2
1384 0x60    U+2018          # left single quotation mark  <`>
1385 0x27    U+2019-U+201b   # various single quotation marks <'>
1386 0x22    U+201c-U+201f   # various double quotation marks <">
1387 U+2020:/-
1388 U+2021:/=
1389 U+2022: o
1390 0x2e    U+2024
1391 U+2025:..
1392 U+2026:...
1393 U+2027:.
1394 U+2028:\015
1395 U+2029:\015\012
1396
1397 # Dont wanna see these:
1398 # POP DIRECTIONAL FORMATTING      202C
1399 U+202c:
1400 # LEFT-TO-RIGHT OVERRIDE  202D
1401 U+202d:
1402
1403 U+202f:
1404 U+2030: 0/00
1405 U+2032:'
1406 U+2033:''
1407 U+2034:'''
1408 U+2035:`
1409 U+2036:``
1410 U+2037:```
1411 U+2038:Ca
1412 U+2039:<
1413 U+203a:>
1414 U+203b::X
1415 U+203c:!!
1416 U+203e:'-
1417 0x2d   U+2043  # HYPHEN BULLET ?
1418 U+2044:/
1419 U+2048:?!
1420 U+2049:!?
1421 # end of General punctuation.
1422 U+2070:^0
1423 U+2074:^4
1424 U+2075:^5
1425 U+2076:^6
1426 U+2077:^7
1427 U+2078:^8
1428 U+2079:^9
1429 U+207a:^+
1430 U+207b:^-
1431 U+207c:^=
1432 U+207d:^(
1433 U+207e:^)
1434 U+207f:^n
1435 U+2080:_0
1436 U+2081:_1
1437 U+2082:_2
1438 U+2083:_3
1439 U+2084:_4
1440 U+2085:_5
1441 U+2086:_6
1442 U+2087:_7
1443 U+2088:_8
1444 U+2089:_9
1445 U+208a:_+
1446 U+208b:_-
1447 U+208c:_=
1448 U+208d:(
1449 U+208e:)
1450 # Old euro currency sign glyph:
1451 #U+20A0:CE
1452 U+20a3:Ff
1453 U+20a4:Li
1454 U+20a7:Pt
1455 U+20a9:W=
1456 # New euro currency sign glyph:
1457 U+20AC:EUR
1458 U+2100:a/c
1459 U+2101:a/s
1460 U+2103:oC
1461 U+2105:c/o
1462 U+2106:c/u
1463 U+2109:oF
1464 0x67    U+210a
1465 0x68    U+210e
1466 U+210f:"hbar
1467 U+2111:Im
1468 U+2113:l
1469 U+2116:No.
1470 U+2117:PO
1471 U+2118:P
1472 U+211C:Re
1473 U+211e:Rx
1474 U+2120:(SM)
1475 U+2121:TEL
1476 # TRADE MARK SIGN:
1477 U+2122:(TM)
1478 U+2126:Ohm
1479 0x4b    U+212A  # Kelvin sign - K
1480 U+212b:Ang.
1481 U+212E:est.
1482 0x6f    U+2134
1483 U+2135:Aleph
1484 U+2136:Bet
1485 U+2137:Gimel
1486 U+2138:Dalet
1487 U+2153: 1/3
1488 U+2154: 2/3
1489 U+2155: 1/5
1490 U+2156: 2/5
1491 U+2157: 3/5
1492 U+2158: 4/5
1493 U+2159: 1/6
1494 U+215a: 5/6
1495 U+215b: 1/8
1496 U+215c: 3/8
1497 U+215d: 5/8
1498 U+215e: 7/8
1499 U+215f: 1/
1500 U+2160:I
1501 U+2161:II
1502 U+2162:III
1503 U+2163:IV
1504 U+2164:V
1505 U+2165:VI
1506 U+2166:VII
1507 U+2167:VIII
1508 U+2168:IX
1509 U+2169:X
1510 U+216a:XI
1511 U+216b:XII
1512 U+216c:L
1513 U+216d:C
1514 U+216e:D
1515 U+216f:M
1516 U+2170:i
1517 U+2171:ii
1518 U+2172:iii
1519 U+2173:iv
1520 U+2174:v
1521 U+2175:vi
1522 U+2176:vii
1523 U+2177:viii
1524 U+2178:ix
1525 U+2179:x
1526 U+217a:xi
1527 U+217b:xii
1528 U+217c:l
1529 U+217d:c
1530 U+217e:d
1531 U+217f:m
1532 U+2180:1000RCD
1533 U+2181:5000R
1534 U+2182:10000R
1535 U+2190:<-
1536 U+2191:-^
1537 U+2192:->
1538 U+2193:-v
1539 U+2194:<->
1540 U+2195:UD
1541 U+2196:<!!
1542 U+2197://>
1543 U+2198:!!>
1544 U+2199:<//
1545 U+21a8:UD-
1546 U+21B5:RET
1547 U+21c0:>V
1548 U+21d0:<=
1549 U+21d1:^^
1550 U+21d2:=>
1551 U+21d3:vv
1552 U+21d4:<=>
1553 U+2200:FA
1554 U+2202:\partial
1555 U+2203:TE
1556 U+2205:{}
1557 U+2206:Delta
1558 U+2207:Nabla
1559 U+2208:(-
1560 U+2209:!(-
1561 U+220a:(-
1562 U+220b:-)
1563 U+220c:!-)
1564 U+220d:-)
1565 U+220e: qed
1566 U+220f:\prod
1567 U+2211:\sum
1568 U+2212: -
1569 U+2213:-/+
1570 U+2214:.+
1571 0x2f    U+2215
1572 U+2216: -
1573 U+2217:*
1574 U+2218:Ob
1575 U+2219:sb
1576 U+221a: SQRT
1577 U+221b: ROOT3
1578 U+221c: ROOT4
1579 U+221d:0(
1580 U+221e:infty
1581 U+221f:-L
1582 U+2220:-V
1583 U+2225:PP
1584 U+2226: !PP
1585 U+2227:AND
1586 U+2228:OR
1587 U+2229:(U
1588 U+222a:)U
1589 U+222b:"int
1590 U+222c:DI
1591 U+222e:Io
1592 U+2234:.:
1593 U+2235::.
1594 U+2236::R
1595 U+2237:::
1596 U+223c:?1
1597 U+223e:CG
1598 U+2243:?-
1599 U+2245:?=
1600 # ALMOST EQUAL TO:
1601 U+2248:~=
1602 U+2249: !~=
1603 U+224c:=?
1604 U+2253:HI
1605 U+2254::=
1606 U+2255:=:
1607 U+2260:!=
1608 U+2261:=3
1609 U+2262: !=3
1610 U+2264:=<
1611 U+2265:>=
1612 U+2266:.LE.
1613 U+2267:.GE.
1614 U+2268:.LT.NOT.EQ.
1615 U+2269:.GT.NOT.EQ.
1616 U+226a:<<
1617 U+226b:>>
1618 U+226e:!<
1619 U+226f:!>
1620 U+2276: <>
1621 U+2277: ><
1622 U+2282:(C
1623 U+2283:)C
1624 U+2284: !(C
1625 U+2285: !)C
1626 U+2286:(_
1627 U+2287:)_
1628 U+2295:(+)
1629 U+2296:(-)
1630 U+2297:(x)
1631 U+2298:(/)
1632 U+2299:(.)
1633 U+229A:(o)
1634 U+229B:(*)
1635 U+229C:(=)
1636 U+229D:(-)
1637 U+229E:[+]
1638 U+229F:[-]
1639 U+22A0:[x]
1640 U+22A1:[.]
1641 U+22a5:-T
1642 U+22A7: MODELS
1643 U+22A8: TRUE
1644 U+22A9: FORCES
1645 U+22AC: !PROVES
1646 U+22AD: NOT TRUE
1647 U+22AE: !FORCES
1648 U+22B2: NORMAL SUBGROUP OF
1649 U+22B3: CONTAINS AS NORMAL SUBGROUP
1650 U+22B4: NORMAL SUBGROUP OF OR EQUAL TO
1651 U+22B5: CONTAINS AS NORMAL SUBGROUP OR EQUAL TO
1652 U+22B8: MULTIMAP
1653 U+22BA: INTERCALATE
1654 U+22BB: XOR
1655 U+22BC: NAND
1656 U+22C5: DOT
1657 U+22d6:<.
1658 U+22d7:>.
1659 U+22d8:<<<
1660 U+22d9:>>>
1661 U+22ee::3
1662 U+22ef:.3
1663 U+2302:Eh
1664 U+2307:~~
1665 U+2308:<7
1666 U+2309:>7
1667 U+230a:7<
1668 U+230b:7>
1669 U+2310:NI
1670 U+2312:(A
1671 U+2315:TR
1672 U+2318:88
1673 U+2320:Iu
1674 U+2321:Il
1675 U+2322::(
1676 U+2323::)
1677 U+2324:|^|
1678 U+2327:[X]
1679 U+2329:</
1680 U+232a:/>
1681 U+2423:Vs
1682 U+2440:1h
1683 U+2441:3h
1684 U+2442:2h
1685 U+2443:4h
1686 U+2446:1j
1687 U+2447:2j
1688 U+2448:3j
1689 U+2449:4j
1690 U+2460:1-o
1691 U+2461:2-o
1692 U+2462:3-o
1693 U+2463:4-o
1694 U+2464:5-o
1695 U+2465:6-o
1696 U+2466:7-o
1697 U+2467:8-o
1698 U+2468:9-o
1699 U+2469:10-o
1700 U+246a:11-o
1701 U+246b:12-o
1702 U+246c:13-o
1703 U+246d:14-o
1704 U+246e:15-o
1705 U+246f:16-o
1706 U+2470:17-o
1707 U+2471:18-o
1708 U+2472:19-o
1709 U+2473:20-o
1710 U+2474:(1)
1711 U+2475:(2)
1712 U+2476:(3)
1713 U+2477:(4)
1714 U+2478:(5)
1715 U+2479:(6)
1716 U+247a:(7)
1717 U+247b:(8)
1718 U+247c:(9)
1719 U+247d:(10)
1720 U+247e:(11)
1721 U+247f:(12)
1722 U+2480:(13)
1723 U+2481:(14)
1724 U+2482:(15)
1725 U+2483:(16)
1726 U+2484:(17)
1727 U+2485:(18)
1728 U+2486:(19)
1729 U+2487:(20)
1730 U+2488:1.
1731 U+2489:2.
1732 U+248a:3.
1733 U+248b:4.
1734 U+248c:5.
1735 U+248d:6.
1736 U+248e:7.
1737 U+248f:8.
1738 U+2490:9.
1739 U+2491:10.
1740 U+2492:11.
1741 U+2493:12.
1742 U+2494:13.
1743 U+2495:14.
1744 U+2496:15.
1745 U+2497:16.
1746 U+2498:17.
1747 U+2499:18.
1748 U+249a:19.
1749 U+249b:20.
1750 U+249c:(a)
1751 U+249d:(b)
1752 U+249e:(c)
1753 U+249f:(d)
1754 U+24a0:(e)
1755 U+24a1:(f)
1756 U+24a2:(g)
1757 U+24a3:(h)
1758 U+24a4:(i)
1759 U+24a5:(j)
1760 U+24a6:(k)
1761 U+24a7:(l)
1762 U+24a8:(m)
1763 U+24a9:(n)
1764 U+24aa:(o)
1765 U+24ab:(p)
1766 U+24ac:(q)
1767 U+24ad:(r)
1768 U+24ae:(s)
1769 U+24af:(t)
1770 U+24b0:(u)
1771 U+24b1:(v)
1772 U+24b2:(w)
1773 U+24b3:(x)
1774 U+24b4:(y)
1775 U+24b5:(z)
1776 U+24b6:A-o
1777 U+24b7:B-o
1778 U+24b8:C-o
1779 U+24b9:D-o
1780 U+24ba:E-o
1781 U+24bb:F-o
1782 U+24bc:G-o
1783 U+24bd:H-o
1784 U+24be:I-o
1785 U+24bf:J-o
1786 U+24c0:K-o
1787 U+24c1:L-o
1788 U+24c2:M-o
1789 U+24c3:N-o
1790 U+24c4:O-o
1791 U+24c5:P-o
1792 U+24c6:Q-o
1793 U+24c7:R-o
1794 U+24c8:S-o
1795 U+24c9:T-o
1796 U+24ca:U-o
1797 U+24cb:V-o
1798 U+24cc:W-o
1799 U+24cd:X-o
1800 U+24ce:Y-o
1801 U+24cf:Z-o
1802 U+24d0:a-o
1803 U+24d1:b-o
1804 U+24d2:c-o
1805 U+24d3:d-o
1806 U+24d4:e-o
1807 U+24d5:f-o
1808 U+24d6:g-o
1809 U+24d7:h-o
1810 U+24d8:i-o
1811 U+24d9:j-o
1812 U+24da:k-o
1813 U+24db:l-o
1814 U+24dc:m-o
1815 U+24dd:n-o
1816 U+24de:o-o
1817 U+24df:p-o
1818 U+24e0:q-o
1819 U+24e1:r-o
1820 U+24e2:s-o
1821 U+24e3:t-o
1822 U+24e4:u-o
1823 U+24e5:v-o
1824 U+24e6:w-o
1825 U+24e7:x-o
1826 U+24e8:y-o
1827 U+24e9:z-o
1828 U+24ea:0-o
1829 U+2500:-
1830 U+2501:=
1831 U+2502:|
1832 U+2503:|
1833 U+2504:-
1834 U+2505:=
1835 U+2506:|
1836 U+2507:|
1837 U+2508:-
1838 U+2509:=
1839 U+250a:|
1840 U+250b:|
1841 0x2b    U+250c-U+256c   # box drawings, use +
1842 U+2571:/
1843 U+2572:\
1844 U+2580:TB
1845 U+2584:LB
1846 U+2588:FB
1847 U+258c:lB
1848 U+2590:RB
1849 U+2591:.S
1850 U+2592::S
1851 U+2593:?S
1852 U+25a0:fS
1853 U+25a1:OS
1854 U+25a2:RO
1855 U+25a3:Rr
1856 U+25a4:RF
1857 U+25a5:RY
1858 U+25a6:RH
1859 U+25a7:RZ
1860 U+25a8:RK
1861 U+25a9:RX
1862 U+25aa:sB
1863 U+25ac:SR
1864 U+25ad:Or
1865 U+25b2:^
1866 U+25b3:uT
1867 U+25b6:|>
1868 U+25b7:Tr
1869 U+25ba:|>
1870 U+25bc:v
1871 U+25bd:dT
1872 U+25c0:<|
1873 U+25c1:Tl
1874 U+25c4:<|
1875 U+25c6:Db
1876 U+25c7:Dw
1877 U+25ca:LZ
1878 U+25cb:0m
1879 U+25ce:0o
1880 U+25cf:0M
1881 U+25d0:0L
1882 U+25d1:0R
1883 U+25d8:Sn
1884 U+25d9:Ic
1885 U+25e2:Fd
1886 U+25e3:Bd
1887 U+25ef:Ci
1888 U+2605:*2
1889 U+2606:*1
1890 U+260e:TEL
1891 U+260f:tel
1892 U+261c:<--
1893 U+261e:-->
1894 U+2621:CAUTION
1895 U+2627:XP
1896 U+2639::-(
1897 U+263a::-)
1898 U+263b:(-:
1899 U+263c:SU
1900 U+2640:f.
1901 U+2642:m.
1902 U+2660:cS
1903 U+2661:cH
1904 U+2662:cD
1905 U+2663:cC
1906 U+2664:cS-
1907 U+2665:cH-
1908 U+2666:cD-
1909 U+2667:cC-
1910 U+2669:Md
1911 U+266a:M8
1912 U+266b:M2
1913 U+266c:M16
1914 U+266d:b
1915 U+266e:Mx
1916 U+266f:#
1917 0x58    U+2713  U+2717  # check marks -> x
1918 U+2720:-X
1919 #  CJK area:
1920 0x20    U+3000  # ideographic space
1921 U+3001:,_
1922 U+3002:._
1923 U+3003:+"
1924 U+3004:JIS
1925 U+3005:*_
1926 U+3006:;_
1927 U+3007:0_
1928 U+300a:<+
1929 U+300b:>+
1930 U+300c:<'
1931 U+300d:>'
1932 U+300e:<"
1933 U+300f:>"
1934 U+3010:("
1935 U+3011:)"
1936 U+3012:=T
1937 U+3013:=_
1938 U+3014:('
1939 U+3015:)'
1940 U+3016:(I
1941 U+3017:)I
1942 U+301a:[[
1943 U+301b:]]
1944 U+301c:-?
1945 U+3020:=T:)
1946 0x20    U+303f
1947 U+3041:A5
1948 U+3042:a5
1949 U+3043:I5
1950 U+3044:i5
1951 U+3045:U5
1952 U+3046:u5
1953 U+3047:E5
1954 U+3048:e5
1955 U+3049:O5
1956 U+304a:o5
1957 U+304b:ka
1958 U+304c:ga
1959 U+304d:ki
1960 U+304e:gi
1961 U+304f:ku
1962 U+3050:gu
1963 U+3051:ke
1964 U+3052:ge
1965 U+3053:ko
1966 U+3054:go
1967 U+3055:sa
1968 U+3056:za
1969 U+3057:si
1970 U+3058:zi
1971 U+3059:su
1972 U+305a:zu
1973 U+305b:se
1974 U+305c:ze
1975 U+305d:so
1976 U+305e:zo
1977 U+305f:ta
1978 U+3060:da
1979 U+3061:ti
1980 U+3062:di
1981 U+3063:tU
1982 U+3064:tu
1983 U+3065:du
1984 U+3066:te
1985 U+3067:de
1986 U+3068:to
1987 U+3069:do
1988 U+306a:na
1989 U+306b:ni
1990 U+306c:nu
1991 U+306d:ne
1992 U+306e:no
1993 U+306f:ha
1994 U+3070:ba
1995 U+3071:pa
1996 U+3072:hi
1997 U+3073:bi
1998 U+3074:pi
1999 U+3075:hu
2000 U+3076:bu
2001 U+3077:pu
2002 U+3078:he
2003 U+3079:be
2004 U+307a:pe
2005 U+307b:ho
2006 U+307c:bo
2007 U+307d:po
2008 U+307e:ma
2009 U+307f:mi
2010 U+3080:mu
2011 U+3081:me
2012 U+3082:mo
2013 U+3083:yA
2014 U+3084:ya
2015 U+3085:yU
2016 U+3086:yu
2017 U+3087:yO
2018 U+3088:yo
2019 U+3089:ra
2020 U+308a:ri
2021 U+308b:ru
2022 U+308c:re
2023 U+308d:ro
2024 U+308e:wA
2025 U+308f:wa
2026 U+3090:wi
2027 U+3091:we
2028 U+3092:wo
2029 U+3093:n5
2030 U+3094:vu
2031 U+309b:"5
2032 U+309c:05
2033 U+309d:*5
2034 U+309e:+5
2035 U+30a1:a6
2036 U+30a2:A6
2037 U+30a3:i6
2038 U+30a4:I6
2039 U+30a5:u6
2040 U+30a6:U6
2041 U+30a7:e6
2042 U+30a8:E6
2043 U+30a9:o6
2044 U+30aa:O6
2045 U+30ab:Ka
2046 U+30ac:Ga
2047 U+30ad:Ki
2048 U+30ae:Gi
2049 U+30af:Ku
2050 U+30b0:Gu
2051 U+30b1:Ke
2052 U+30b2:Ge
2053 U+30b3:Ko
2054 U+30b4:Go
2055 U+30b5:Sa
2056 U+30b6:Za
2057 U+30b7:Si
2058 U+30b8:Zi
2059 U+30b9:Su
2060 U+30ba:Zu
2061 U+30bb:Se
2062 U+30bc:Ze
2063 U+30bd:So
2064 U+30be:Zo
2065 U+30bf:Ta
2066 U+30c0:Da
2067 U+30c1:Ti
2068 U+30c2:Di
2069 U+30c3:TU
2070 U+30c4:Tu
2071 U+30c5:Du
2072 U+30c6:Te
2073 U+30c7:De
2074 U+30c8:To
2075 U+30c9:Do
2076 U+30ca:Na
2077 U+30cb:Ni
2078 U+30cc:Nu
2079 U+30cd:Ne
2080 U+30ce:No
2081 U+30cf:Ha
2082 U+30d0:Ba
2083 U+30d1:Pa
2084 U+30d2:Hi
2085 U+30d3:Bi
2086 U+30d4:Pi
2087 U+30d5:Hu
2088 U+30d6:Bu
2089 U+30d7:Pu
2090 U+30d8:He
2091 U+30d9:Be
2092 U+30da:Pe
2093 U+30db:Ho
2094 U+30dc:Bo
2095 U+30dd:Po
2096 U+30de:Ma
2097 U+30df:Mi
2098 U+30e0:Mu
2099 U+30e1:Me
2100 U+30e2:Mo
2101 U+30e3:YA
2102 U+30e4:Ya
2103 U+30e5:YU
2104 U+30e6:Yu
2105 U+30e7:YO
2106 U+30e8:Yo
2107 U+30e9:Ra
2108 U+30ea:Ri
2109 U+30eb:Ru
2110 U+30ec:Re
2111 U+30ed:Ro
2112 U+30ee:WA
2113 U+30ef:Wa
2114 U+30f0:Wi
2115 U+30f1:We
2116 U+30f2:Wo
2117 U+30f3:N6
2118 U+30f4:Vu
2119 U+30f5:KA
2120 U+30f6:KE
2121 U+30f7:Va
2122 U+30f8:Vi
2123 U+30f9:Ve
2124 U+30fa:Vo
2125 U+30fb:.6
2126 U+30fc:-6
2127 U+30fd:*6
2128 U+30fe:+6
2129 U+3105:b4
2130 U+3106:p4
2131 U+3107:m4
2132 U+3108:f4
2133 U+3109:d4
2134 U+310a:t4
2135 U+310b:n4
2136 U+310c:l4
2137 U+310d:g4
2138 U+310e:k4
2139 U+310f:h4
2140 U+3110:j4
2141 U+3111:q4
2142 U+3112:x4
2143 U+3113:zh
2144 U+3114:ch
2145 U+3115:sh
2146 U+3116:r4
2147 U+3117:z4
2148 U+3118:c4
2149 U+3119:s4
2150 U+311a:a4
2151 U+311b:o4
2152 U+311c:e4
2153 U+311d:eh4
2154 U+311e:ai
2155 U+311f:ei
2156 U+3120:au
2157 U+3121:ou
2158 U+3122:an
2159 U+3123:en
2160 U+3124:aN
2161 U+3125:eN
2162 U+3126:er
2163 U+3127:i4
2164 U+3128:u4
2165 U+3129:iu
2166 U+312a:v4
2167 U+312b:nG
2168 U+312c:gn
2169 U+321c:(JU)
2170 U+3220:1c
2171 U+3221:2c
2172 U+3222:3c
2173 U+3223:4c
2174 U+3224:5c
2175 U+3225:6c
2176 U+3226:7c
2177 U+3227:8c
2178 U+3228:9c
2179 U+3229:10c
2180 U+327f:KSC
2181 U+33c2:am
2182 U+33d8:pm
2183 #
2184 #
2185 #There are four special ranges of characters that are represented only by
2186 #their start and end characters <...>
2187 #
2188 #   The CJK Ideographs Area (U+4E00 - U+9FFF)
2189 #   The Hangul Syllables Area (U+AC00 - U+D7A3)
2190 #   The Surrogates Area (U+D800 - U+DFFF)
2191 #   The Private Use Area (U+E000 - U+F8FF)
2192 #
2193 #
2194 U+fb00:ff
2195 U+fb01:fi
2196 U+fb02:fl
2197 U+fb03:ffi
2198 U+fb04:ffl
2199 U+fb05:St
2200 U+fb06:st
2201 U+fe7d:3+;
2202 U+fe82:aM.
2203 U+fe84:aH.
2204 U+fe88:ah.
2205 U+fe8d:a+-
2206 U+fe8e:a+.
2207 U+fe8f:b+-
2208 U+fe90:b+.
2209 U+fe91:b+,
2210 U+fe92:b+;
2211 U+fe93:tm-
2212 U+fe94:tm.
2213 U+fe95:t+-
2214 U+fe96:t+.
2215 U+fe97:t+,
2216 U+fe98:t+;
2217 U+fe99:tk-
2218 U+fe9a:tk.
2219 U+fe9b:tk,
2220 U+fe9c:tk;
2221 U+fe9d:g+-
2222 U+fe9e:g+.
2223 U+fe9f:g+,
2224 U+fea0:g+;
2225 U+fea1:hk-
2226 U+fea2:hk.
2227 U+fea3:hk,
2228 U+fea4:hk;
2229 U+fea5:x+-
2230 U+fea6:x+.
2231 U+fea7:x+,
2232 U+fea8:x+;
2233 U+fea9:d+-
2234 U+feaa:d+.
2235 U+feab:dk-
2236 U+feac:dk.
2237 U+fead:r+-
2238 U+feae:r+.
2239 U+feaf:z+-
2240 U+feb0:z+.
2241 U+feb1:s+-
2242 U+feb2:s+.
2243 U+feb3:s+,
2244 U+feb4:s+;
2245 U+feb5:sn-
2246 U+feb6:sn.
2247 U+feb7:sn,
2248 U+feb8:sn;
2249 U+feb9:c+-
2250 U+feba:c+.
2251 U+febb:c+,
2252 U+febc:c+;
2253 U+febd:dd-
2254 U+febe:dd.
2255 U+febf:dd,
2256 U+fec0:dd;
2257 U+fec1:tj-
2258 U+fec2:tj.
2259 U+fec3:tj,
2260 U+fec4:tj;
2261 U+fec5:zH-
2262 U+fec6:zH.
2263 U+fec7:zH,
2264 U+fec8:zH;
2265 U+fec9:e+-
2266 U+feca:e+.
2267 U+fecb:e+,
2268 U+fecc:e+;
2269 U+fecd:i+-
2270 U+fece:i+.
2271 U+fecf:i+,
2272 U+fed0:i+;
2273 U+fed1:f+-
2274 U+fed2:f+.
2275 U+fed3:f+,
2276 U+fed4:f+;
2277 U+fed5:q+-
2278 U+fed6:q+.
2279 U+fed7:q+,
2280 U+fed8:q+;
2281 U+fed9:k+-
2282 U+feda:k+.
2283 U+fedb:k+,
2284 U+fedc:k+;
2285 U+fedd:l+-
2286 U+fede:l+.
2287 U+fedf:l+,
2288 U+fee0:l+;
2289 U+fee1:m+-
2290 U+fee2:m+.
2291 U+fee3:m+,
2292 U+fee4:m+;
2293 U+fee5:n+-
2294 U+fee6:n+.
2295 U+fee7:n+,
2296 U+fee8:n+;
2297 U+fee9:h+-
2298 U+feea:h+.
2299 U+feeb:h+,
2300 U+feec:h+;
2301 U+feed:w+-
2302 U+feee:w+.
2303 U+feef:j+-
2304 U+fef0:j+.
2305 U+fef1:y+-
2306 U+fef2:y+.
2307 U+fef3:y+,
2308 U+fef4:y+;
2309 U+fef5:lM-
2310 U+fef6:lM.
2311 U+fef7:lH-
2312 U+fef8:lH.
2313 U+fef9:lh-
2314 U+fefa:lh.
2315 U+fefb:la-
2316 U+fefc:la.
2317
2318 # the reverse byte-order-mark: zero-width non-break space
2319 U+feff:
2320
2321 0x21-0x7e       U+ff01-U+ff5e
2322 0x2e    U+ff61
2323 0x22    U+ff62  U+ff63
2324 0x2c    U+ff64
2325
2326 # Symbols for C0 and C1 control characters, in case they get through...
2327 U+0000:NUL
2328 U+0001:SH
2329 U+0002:SX
2330 U+0003:EX
2331 U+0004:ET
2332 U+0005:ENQ
2333 U+0006:AK
2334 U+0007:BL
2335 U+0008:BS
2336 U+0009:HT
2337 U+000a:LF
2338 U+000b:VT
2339 U+000c:FF
2340 U+000d:CR
2341 U+000e:SO
2342 U+000f:SI
2343 U+0010:DL
2344 U+0011:DC1
2345 U+0012:DC2
2346 U+0013:DC3
2347 U+0014:DC4
2348 U+0015:NAK
2349 U+0016:SYN
2350 U+0017:EB
2351 U+0018:CN
2352 U+0019:EM
2353 U+001a:SB
2354 U+001b:ESC
2355 U+001c:FS
2356 U+001d:GS
2357 U+001e:RS
2358 U+001f:US
2359 U+007f:DT
2360 # Most of these characters (80-9F) may be inflicted on us
2361 # by MS FrontPages which uses Unicode notation such as &#153;
2362 # but there are no assigned letters in Unicode 128-159 range.
2363 # It is assumed in the code that those codepoints are from windows-1252.
2364 #U+0080:PA
2365 #U+0081:HO
2366 #U+0082:BH
2367 #U+0083:NH
2368 #U+0084:IN
2369 #U+0085:NL
2370 U+0085:\012
2371 #U+0086:SA
2372 #U+0087:ES
2373 #U+0088:HS
2374 #U+0089:HJ
2375 #U+008a:VS
2376 #U+008b:PD
2377 #U+008c:PU
2378 #U+008d:RI
2379 #U+008e:SS2
2380 #U+008f:SS3
2381 #U+0090:DCS
2382 #U+0091:P1
2383 #U+0092:P2
2384 #U+0093:TS
2385 #U+0094:CC
2386 #U+0095:MW
2387 #U+0096:SG
2388 #U+0097:EG
2389 #U+0098:SS
2390 #U+0099:GC
2391 #U+009a:SC
2392 #U+009b:CSI
2393 #U+009c:ST
2394 #U+009d:OC
2395 #U+009e:PM
2396 #U+009f:AC
2397
2398 # Let's try to show a question mark for character that cannot
2399 # be shown.  U+fffd is used for invalid characters.
2400 # It works, but let's stick with UHHH representation. - FM
2401 #U+fffd "?"