tagging release
[dasher.git] / Data / system.rc / alphabet.persian.xml
blob70b7fe20b9f5ba447cd7293695d2ab8dd3eb5a44
1 <?xml version="1.0"?>
2 <!DOCTYPE alphabets SYSTEM "alphabet.dtd">
3 <?xml-stylesheet type="text/xsl" href="alphabet-nest.xsl"?>
4 <!-- Author: David MacKay and Behdad  -->
5 <alphabets>
6 <alphabet name="Persian (Nested groups) with punctuation and numerals">
7 <orientation type="RL"/>
8 <encoding type="Western"/>
9 <palette>European/Asian</palette>
10 <train>training_persian_IR.txt</train>
11 <space d="&#x25a1;" t=" " b="9" note="box" />
12 <paragraph d="&#182;" b="9"/>
13 <control d="Control" t="" b="8"/>
14 <group name="Persian letters" b="0">
15 <group name="Vowels etc" b="110">
16 <s d="&#x25cc;&#x064E;" t="&#x064E;"  b="90"  note="fatha"  />
17 <s d="&#x25cc;&#x0650;" t="&#x0650;"  b="91" note="kasra"  />
18 <s d="&#x25cc;&#x064F;" t="&#x064F;"  b="92"  note="damma"  />
19 <s d="&#x25cc;&#x0651;" t="&#x0651;"  b="93" note="shadda"  />
20 <s d="&#x25cc;&#x0652;" t="&#x0652;"  b="94"  note="sukun"  />
21 <s d="&#x25cc;&#x064B;" t="&#x064B;"  b="90" note="FATHATAN"  />
22 <s d="&#x25cc;&#x064D;" t="&#x064D;"  b="91"  note="kasratan"  />
23 <s d="&#x25cc;&#x064C;" t="&#x064C;"  b="92" note="dammatan"  />
24 <s d="&#x25cc;&#x0653;" t="&#x0653;"  b="93"  note="maddah above" />
25 <s d="&#x25cc;&#x0654;" t="&#x0654;"  b="94" note="hamza above" />
26 <s d="&#x25cc;&#x0655;" t="&#x0655;"  b="90" note="hamza below" />
27 <s d="&#x25cc;&#x0670;" t="&#x0670;"  b="91" note="superscript alef" />
28 </group>
29 <group name="Hamza" b="60">
30 <s d="&#x0621;" t="&#x0621;" b="70" note="HAMZA  "  />
31 </group>
32 <group  b="60" name="alef" >
33 <s d="&#x0622;" t="&#x0622;" b="80" note="ALEF WITH MADDA ABOVE  "  />
34 <s d="&#x0627;" t="&#x0627;" b="70" note="ALEF  "  />
35 <s d="&#x0623;" t="&#x0623;" b="80" note="ALEF WITH HAMZA ABOVE  "  />
36 </group>
37 <group b="61" >
38 <s d="&#x0628;" t="&#x0628;" b="81" note="BEH  "  />
39 <s d="&#x067e;" t="&#x067e;" b="71" note="PEH  "  />
40 <s d="&#x062A;" t="&#x062A;" b="81" note="TEH  "  />
41 <s d="&#x062B;" t="&#x062B;" b="71" note="THEH  "  />
42 </group>
43 <group b="62" >
44 <s d="&#x062C;" t="&#x062C;" b="82" note="JEEM  "  />
45 <s d="&#x0686;" t="&#x0686;" b="72" note="TCHEH "  />
46 <s d="&#x062D;" t="&#x062D;" b="82" note="HAH  "  />
47 <s d="&#x062E;" t="&#x062E;" b="72" note="KHAH  "  />
48 </group>
49 <group b="63" >
50 <s d="&#x062F;" t="&#x062F;" b="73" note="DAL  "  />
51 <s d="&#x0630;" t="&#x0630;" b="83" note="THAL  "  />
52 <s d="&#x0631;" t="&#x0631;" b="73" note="REH  "  />
53 <s d="&#x0632;" t="&#x0632;" b="83" note="ZAIN  "  />
54 <s d="&#x0698;" t="&#x0698;" b="73" note="JEH "  />
55 </group>
56 <group b="64" >
57 <s d="&#x0633;" t="&#x0633;" b="84" note="SEEN  "  />
58 <s d="&#x0634;" t="&#x0634;" b="74" note="SHEEN  "  />
59 </group>
60 <group b="65" >
61 <s d="&#x0635;" t="&#x0635;" b="75" note="SAD  "  />
62 <s d="&#x0636;" t="&#x0636;" b="85" note="DAD  "  />
63 <s d="&#x0637;" t="&#x0637;" b="75" note="TAH  "  />
64 <s d="&#x0638;" t="&#x0638;" b="85" note="ZAH  "  />
65 </group>
66 <group b="66" >
67 <s d="&#x0639;" t="&#x0639;" b="86" note="AIN  "  />
68 <s d="&#x063A;" t="&#x063A;" b="76" note="GHAIN  "  />
69 <s d="&#x0641;" t="&#x0641;" b="86" note="FEH  "  />
70 <s d="&#x0642;" t="&#x0642;" b="76" note="QAF  "  />
71 </group>
72 <group b="67" >
73 <s d="&#x06A9;" t="&#x06A9;" b="77" note="KAF (unicode LETTER KEHEH)"  />
74 <s d="&#x06af;" t="&#x06af;" b="87" note="GAF  "  />
75 </group>
76 <group b="68" >
77 <s d="&#x0644;" t="&#x0644;" b="78" note=" LAM  "  />
78 <s d="&#x0645;" t="&#x0645;" b="88" note=" MEEM  "  />
79 <s d="&#x0646;" t="&#x0646;" b="78" note=" NOON  "  />
80 </group>
81 <group b="69" >
82 <s d="&#x0648;" t="&#x0648;" b="79" note=" WAW  "  />
83 <s d="&#x0624;" t="&#x0624;" b="89" note=" WAW WITH HAMZA ABOVE  "  />
84 <s d="&#x0647;&#x200d;" t="&#x0647;" b="79" note=" HEH (with non-joiner added to the canvas glyph) "  />
85 <s d="&#x06CC;" t="&#x06CC;" b="89" note="ARABIC LETTER FARSI YEH "  />
86 <s d="&#x0626;" t="&#x0626;" b="79" note=" YEH WITH HAMZA ABOVE  "  />
87 </group>
88 </group>
89 <group name="Arabic letters" b="115">
90 <s b="99" t="&#x0640;" d="&#x0640;" note="ARABIC TATWEEL joining character"/>
91 <s d="&#x0625;" t="&#x0625;" b="70" note="ALEF WITH HAMZA BELOW  "  />
92 <s d="&#x0671;" t="&#x0671;" b="80" note="ALEF WASLA  "  />
93 <s d="&#x0643;" t="&#x0643;" b="77" note="ARABIC KAF perhaps omit this"/>
94 <s d="&#x0629;" t="&#x0629;" b="79" note=" TEH MARBUTA  "  />
95 <s d="&#x0649;&#x200d;" t="&#x0649;" b="89" note=" ALEF MAKSURA (Looks like YEH!)"  />
96 <s d="&#x064A;" t="&#x064A;" b="79" note=" YEH  "  />
97 </group>
98 <group name="Persian numbers" b="113">
99 <s d="&#x06F1;" t="&#x06F1;"  b="105"  note="ONE"/>
100 <s d="&#x06F2;" t="&#x06F2;"  b="106" note="TWO"/>
101 <s d="&#x06F3;" t="&#x06F3;"  b="107"  note="THREE"/>
102 <s d="&#x06F4;" t="&#x06F4;"  b="108" note="FOUR"/>
103 <s d="&#x06F5;" t="&#x06F5;"  b="109"  note="FIVE"/>
104 <s d="&#x06F6;" t="&#x06F6;"  b="105" note="SIX"/>
105 <s d="&#x06F7;" t="&#x06F7;"  b="106"  note="SEVEN"/>
106 <s d="&#x06F8;" t="&#x06F8;"  b="107" note="EIGHT"/>
107 <s d="&#x06F9;" t="&#x06F9;"  b="108"  note="NINE"/>
108 <s d="&#x06F0;" t="&#x06F0;"  b="109" note="ZERO"/>
109 <s d="&#x066b;" t="&#x066b;"  b="104" note="decimal point"/>
110 <s d="&#x066c;" t="&#x066c;"  b="102" note="thousands"/>
111 </group>
112 <group name="ASCII Punctuation" b="114">
113 <s b="9"  d="&#x25CA;" t="&#x9;" note="TAB (represented by a diamond)"/>
114 <s b="99" d="~" t="~"/>
115 <s b="98" d="@" t="@"/>
116 <s b="95" d="#" t="#"/>
117 <s b="96" d="$" t="$"/>
118 <s b="90" d="%" t="%"/>
119 <s b="95" d="^" t="^"/>
120 <s b="97" d="&amp;" t="&amp;"/> 
121 <s b="91" d="*" t="*"/>
122 <s b="100" d="-" t="-"/>
123 <s b="96" d="_" t="_"/>
124 <s b="98" d="\" t="\"/>
125 <s b="97" d="|" t="|"/>
126 </group>
127 <group name="Persian Punctuation" b="112">
128 <s b="90"    d="&#xfdfc;" t="&#xfdfc;"  note="currency"/>
129 <s b="91" d="&#x066A;" t="&#x066A;" note="Arabic percent"/>
130 <s b="92" d="+" t="+"/>
131 <s b="93" d="&#x2212;" t="&#x2212;" note="minus"/>
132 <s b="94" d="&#x00d7;" t="&#x00d7;" note="times"/>
133 <s b="90" d="&#x00f7;" t="&#x00f7;" note="divide"/>
134 <s b="91" d="=" t="="/>
135 <s b="92" d="/" t="/" note="keep in persian as separator"/>
136 <s b="109" d="&#x200F;&lt;&#x200F;" t="&lt;"/>
137 <s b="105" d="&#x200F;&gt;&#x200F;" t="&gt;"/>
138 <s b="107" d="&#x200F;{&#x200F;" t="{"/>
139 <s b="108" d="&#x200F;}&#x200F;" t="}"/>
140 <s b="105" d="&#x200F;[&#x200F;" t="["/>
141 <s b="106" d="&#x200F;]&#x200F;" t="]"/>
142 <s b="106" d="&#x200F;(&#x200F;" t="("/>
143 <s b="107" d="&#x200F;)&#x200F;" t=")"/>
144 <s d="&#x200F;&#x2039;&#x200F;" t="&#x2039;" note="French opening single quotation mark" />
145 <s d="&#x200F;&#x203A;&#x200F;" t="&#x203A;" note="French opening single quotation mark" />
146 <s d="&#x200F;&#x00AB;&#x200F;" t="&#x00AB;" note="French left double quotation mark" />
147 <s d="&#x200F;&#x00BB;&#x200F;" t="&#x00BB;" note="French right double quotation mark" />
148 <s b="100" d="&#x2010;" t="&#x2010;"/>
149 <s b="100" d="!" t="!"/>
150 <s b="101" d="&#x061F;" t="&#x061F;"  note="Arabic question mark"/>
151 <s b="101" d=":" t=":"/>
152 <s b="102" d="&#x061B;" t="&#x061B;"  note="Arabic semicolon"/>
153 <s b="103"  d="&#x060C;" t="&#x060C;"  note="Arabic comma"/>
154 <s b="104" d="." t="."/>
155 </group>
156 <group name="Joiners" b="111">
157 <s b="73" t="&#x200c;" d="&#x2225;" note="Zero width non-joiner"/>
158 <s b="74" t="&#x200d;" d="&#x2195;" note="Zero width joiner"/>
159 </group>
160 </alphabet>
161 </alphabets>