tests pass, find the right nodes more explicitly
[bioperl-run.git] / t / data / protpars.phy
blobe3632bc72ef82a63a45e62a44dc08eeb213d4ce7
1  3 5127
2 SINFRUP001   ---------- ------DDQV VLQCTASVLK EQIKLCLSCE GFGNRLCFLE 
3 SINFRUP002   ---------- ------DDQV VLQCTASVLK EQIKLCLSCE GFGNRLCFLE 
4 ENSP000003   -MGDAEGEDE VQFLRTDDEV VLQCSATVLK EQLKLCLAAE GFGNRLCFLE 
6              TTSNAQNVPP DLAICTFILE QSLSVRALQE MLANTVEMTE AVDLDKWSSQ 
7              TTSNAQNVPP DLAICTFILE QSLSVRALQE MLANTVEMTE AVDLDKWSSQ 
8              PTSNAQNVPP DLAICCFVLE QSLSVRALQE MLANT----- -VEAGVESSQ 
10              GGGHRTLLYG HAILLRHNHS GMYLSCLTTS RSLTDKLAFD VGLQEDSTGE 
11              GGGHRTLLYG HAILLRHNHS GMYLSCLTTS RSLTDKLAFD VGLQEDSTGE 
12              GGGHRTLLYG HAILLRHAHS RMYLSCLTTS RSMTDKLAFD VGLQEDATGE 
14              ACWWTIHPAS KQRSEGEKVR VGDDLILVSV SSERYLHLSY ASGDLMVDAS 
15              ACWWTIHPAS KQRSEGEKVR VGDDLILVSV SSERYLHLSY ASGDLMVDAS 
16              ACWWTMHPAS KQRSEGEKVR VGDDIILVSV SSERYLHLST ASGELQVDAS 
18              FMQTLWNMNP ISSGCELAEG FLTGGHVLRL FHGHMDECLA IATPEEGEEK 
19              FMQTLWNMNP ISSGCELAEG FLTGGHVLRL FHGHMDECLA IATPEEGEEK 
20              FMQTLWNMNP ICSRCE--EG FVTGGHVLRL FHGHMDECLT ISPADS-DDQ 
22              RRMAHYEGGS VCSQARSLWR LEPLRISWSG SHMKWGQSFR IRHITTGRYL 
23              RRMAHYEGGS VCSQARSLWR LEPLRISWSG SHMKWGQSFR IRHITTGRYL 
24              RRLVYYEGGA VCTHARSLWR LEPLRISWSG SHLRWGQPLR VRHVTTGQYL 
26              CLDEEKGLLV VDPERANTKL SAFCFRASKE KVDVAQKRDV EGMGIPEIKY 
27              CLDEEKGLLV VDPERANTKL SAFCFRASKE KVDVAQKRDV EGMGIPEIKY 
28              ALTEDQGLVV VDASKAHTKA TSFCFRISKE KLDVAPKRDV EGMGPPEIKY 
30              GESMCFVQHV STGLWLTYAS LDAKAARLGM MKRKVILHQE GHMDDALTVS 
31              GESMCFVQHV STGLWLTYAS LDAKAARLGM MKRKVILHQE GHMDDALTVS 
32              GESLCFVQHV ASGLWLTYAA PDPKALRLGV LKKKAMLHQE GHMDDALSLT 
34              RSQTEESQAA RMIYSTVGLF RQFIKGLDTL TGKNKSPGAL S---LPLEGV 
35              RSQTEESQAA RMIYSTVGLF RQFIKGLDTL TGKNKSPGAL S---LPLEGV 
36              RCQQEESQAA RMIHSTNGLY NQFIKSLDSF SGKPRGSGPP AGTALPIEGV 
38              ILSLQDLIFY FRPPDEELEH EEKQTKLRSL RNRQNLFQEE GMITIVLECI 
39              ILSLQDLIFY FRPPDEELEH EEKQTKLRSL RNRQNLFQEE GMITIVLECI 
40              ILSLQDLIIY FEPPSEDLQH EEKQSKLRSL RNRQSLFQEE GMLSMVLNCI 
42              DRLNVYNTAA HFSEFAGEEA AESWKEIVNL LYELLASLIR GNRSNCALFC 
43              DRLNVYNTAA HFSEFAGEEA AESWKEIVNL LYELLASLIR GNRSNCALFC 
44              DRLNVYTTAA HFAEFAGEEA AESWKEIVNL LYELLASLIR GNRSNCALFS 
46              DNLDWLVSKL DRLEASSGIL EVLYCVLIES PEVLNIIQEN HIKSIISLLD 
47              DNLDWLVSKL DRLEASSGIL EVLYCVLIES PEVLNIIQEN HIKSIISLLD 
48              TNLDWLVSKL DRLEASSGIL EVLYCVLIES PEVLNIIQEN HIKSIISLLD 
50              KHGRNHKVLD VLRSLCVCNG VAVRSNQNLI TENLLPGRDL LLQTNIVNYV 
51              KHGRNHKVLD VLRSLCVCNG VAVRSNQNLI TENLLPGRDL LLQTNIVNYV 
52              KHGRNHKVLD VLCSLCVCNG VAVRSNQDLI TENLLPGREL LLQTNLINYV 
54              TSVRPNIFLG TCEGSTQYKK WYYEVMVDHV EAFVTAQATH LRVGWAMTEG 
55              TSVRPNIFLG TCEGSTQYKK WYYEVMVDHV EAFVTAQATH LRVGWAMTEG 
56              TSIRPNIFVG RAEGTTQYSK WYFEVMVDEV TPFLTAQATH LRVGWALTEG 
58              YSPYPGGGEG WGGNGVGDDL YSYSFDGLHL WSGTVPRQVA SPNAHTLAAD 
59              YSPYPGGGEG WGGNGVGDDL YSYSFDGLHL WSGTVPRQVA SPNAHTLAAD 
60              YTPYPGAGEG WGGNGVGDDL YSYGFDGLHL WTGHVARPVT SPGQHLLAPE 
62              DVVSCCLDLS VPSISFRING HPVQGMFENF NVDSLFFPVI SFSAGVKARF 
63              DVVSCCLDLS VPSISFRING HPVQGMFENF NVDSLFFPVI SFSAGVKARF 
64              DVISCCLDLS VPSISFRING CPVQGVFESF NLDGLFFPVV SFSAGVKVRF 
66              LLGGRHGDFK FMPPPGYAPC YEALLPRERM RIEPIKEYKH DFNGVRNLLG 
67              LLGGRHGDFK FMPPPGYAPC YEALLPRERM RIEPIKEYKH DFNGVRNLLG 
68              LLGGRHGEFK FLPPPGYAPC HEAVLPRERL HLEPIKEYRR EGPRGPHLVG 
70              PTLSLTHTSF TPCPVDTVQI VLPPHLERIR EKLAENIHEL WAVTRIEQGW 
71              PTLSLTHTSF TPCPVDTVQI VLPPHLERIR EKLAENIHEL WAVTRIEQGW 
72              PSRCLSHTDF VPCPVDTVQI VLPPHLERIR EKLAENIHEL WALTRIEQGW 
74              TYGSFRDDNK KLHPCLVDFQ SLPEPERNYN LQMSAETLKC VCAV---A-- 
75              TYGSFRDDNK KLHPCLVDFQ SLPEPERNYN LQMSAETLKC VCAV---A-- 
76              TYGPVRDDNK RLHPCLVDFH SLPEPERNYN LQMSGETLKT LLALGCHVGM 
78              ------ETLH DCVSSR-YVM SNAYKPAPLD LSHVKLTPNQ NQLVEKLAEN 
79              ------ETLH DCVSSR-YVM SNAYKPAPLD LSHVKLTPNQ NQLVEKLAEN 
80              ADEKAEDNLK KTKLPKTYMM SNGYKPAPLD LSHVRLTPAQ TTLVDRLAEN 
82              GHNVWARDRV RQGWTYSIVQ DILNKRNPRL VPYILLDERT KKTNRDSVNN 
83              GHNVWARDRV RQGWTYSIVQ DILNKRNPRL VPYILLDERT KKTNRDSVNN 
84              GHNVWARDRV GQGWSYSAVQ DIPARRNPRL VPYRLLDEAT KRSNRDSLCQ 
86              AVRTLIGYGY NIEPPDQEST GHGLENTRGD KVRIFRAEKS YAVTQGKWYF 
87              AVRTLIGYGY NIEPPDQEST GHGLENTRGD KVRIFRAEKS YAVTQGKWYF 
88              AVRTLLGYGY NIEPPDQEPS Q-VENQSRCD RVRIFRAEKS YTVQSGRWYF 
90              EFEAVTTGEM RVGWARPNVH SDTELGADEL AYVFNGNKA- --------QR 
91              EFEAVTTGEM RVGWARPNVH SDTELGADEL AYVFNGNKA- --------QR 
92              EFEAVTTGEM RVGWARPELR PDVELGADEL AYVFNGHRG- --------QR 
94              WHIGNEPFGR QWQSGDVVGC MIDLTEMNIM FTLNGEMLIS DSGSEMAFKD 
95              WHIGNEPFGR QWQSGDVVGC MIDLTEMNIM FTLNGEMLIS DSGSEMAFKD 
96              WHLGSEPFGR PWQPGDVVGC MIDLTENTII FTLNGEVLMS DSGSETAFRE 
98              IEIGEGFIPV CTLGLSQVGR INLGQNVSSL RYFAICGLQE GFEPFAINMK 
99              IEIGEGFIPV CTLGLSQVGR INLGQNVSSL RYFAICGLQE GFEPFAINMK 
100              IEIGDGFLPV CSLGPGQVGH LNLGQDVSSL RFFAICGLQE GFEPFAINMQ 
102              RDTTMWFSKS LPQFVPVPAD HNHIEVSRVD GTVDSAPCLK LTHKTYGSQN 
103              RDTTMWFSKS LPQFVPVPAD HNHIEVSRVD GTVDSAPCLK LTHKTYGSQN 
104              RPVTTWFSKG LPQFEPVPLE HPHYEVSRVD GTVDTPPCLR LTHRTWGSQN 
106              ANTDMLFLRL SMPIQFHATF KVPAGTTPLT RALTIP---E DVAVVEPDSE 
107              ANTDMLFLRL SMPIQFHATF KVPAGTTPLT RALTIP---E DVAVVEPDSE 
108              SLVEMLFLRL SLPVQFHQHF RCTAGATPLA PPGLQPPAED EARAAEPDPD 
110              FEVLKKSASR KEQEEDKKEP SVPKEI---- --------L- -AENEKDTMS 
111              FEVLKKSASR KEQEEDKKEP SVPKEI---- --------L- -AENEKDTMS 
112              YENLRRSAGG WSEAENGKEG TAKEGAPGGT PQAGGEAQPA RAENEKDATT 
114              EKGKKRGFFS KAKKAAMTPL A-----PPPP PTVPRLVEDV VPDD-RDDPE 
115              EKGKKRGFFS KAKKAAMTPL A-----PPPP PTVPRLVEDV VPDD-RDDPE 
116              EKNKKRGFLF KAKKVAMMTQ P------PAT PTLPRLPHDV VPADNRDDPE 
118              IILSTTTYYY SVRIFAGQEP SGVWVGWVTP DYHQYDQTFD LSKVRSVTVT 
119              IILSTTTYYY SVRIFAGQEP SGVWVGWVTP DYHQYDQTFD LSKVRSVTVT 
120              IILNTTTYYY SVRVFAGQEP SCVWAGWVTP DYHQHDMSFD LSKVRVVTVT 
122              VGDDKGNIYN SMKRSNCYMV WGDDLVS-NH QTRFSQEDMV IGCLVDLATG 
123              VGDDKGNIYN SMKRSNCYMV WGDDLVS-NH QTRFSQEDMV IGCLVDLATG 
124              MGDEQGNVHS SLKCSNCYMV WGGDFVSPGQ QGRISHTDLV IGCLVDLATG 
126              LMTFTANGKE INTFYQVEPN TKLFPAVFVQ PLSQNMVQLE LGKLKNIMPI 
127              LMTFTANGKE INTFYQVEPN TKLFPAVFVQ PLSQNMVQLE LGKLKNIMPI 
128              LMTFTANGKE SNTFFQVEPN TKLFPAVFVL PTHQNVIQFE LGKQKNIMPL 
130              SAAMFRSERN NPVPQCPPRL DVQMLTPVIW SRMPNRFLNP DVGRVSERLG 
131              SAAMFRSERN NPVPQCPPRL DVQMLTPVIW SRMPNRFLNP DVGRVSERLG 
132              SAAMFQSERK NPAPQCPPRL EMQMLMPVSW SRMPNHFLQV ETRRAGERLG 
134              WVVECTEPLI MMALHIPEEN RCIDILELSE RQDLMKFHYH TLMLYCAVCA 
135              WVVECTEPLI MMALHIPEEN RCIDILELSE RQDLMKFHYH TLMLYCAVCA 
136              WAVQCQEPLT MMALHIPEEN RCMDILELSE RLDLQRFHSH TLRLYRAVCA 
138              LGNNRVAHAL CSHVDESQLF YATENTYLPG PLRSGYYDLL ISIHLESAKR 
139              LGNNRVAHAL CSHVDESQLF YATENTYLPG PLRSGYYDLL ISIHLESAKR 
140              LGNNRVAHAL CSHVDQAQLL HALEDAHLPG PLRAGYYDLL ISIHLESACR 
142              ARLGTNREFI VPMTEETLSI KLYPDAV--- ---KAHSLPG VGLTTCLRPK 
143              ARLGTNREFI VPMTEETLSI KLYPDAV--- ---KAHSLPG VGLTTCLRPK 
144              SRRSMLSEYI VPLTPETRAI TLFPPGRSTE NGHPRHGLPG VGVTTSLRPP 
146              LHFS------ SINFVGTDLD LYTLSPVFPL QELKNRAISM LTEAVLDGSQ 
147              LHFS------ SINFVGTDLD LYTLSPVFPL QELKNRAISM LTEAVLDGSQ 
148              HHFSPPCFVA ALPAAGAAEA PARLSPAIPL EALRDKALRM LGEAVRDGGQ 
150              AMRDPVGGSV EFHFVPILKL ISTLLIMGIF NDDDTKHILK MIDPNVFSGK 
151              AMRDPVGGSV EFHFVPILKL ISTLLIMGIF NDDDTKHILK MIDPNVFSGK 
152              HARDPVGGSV EFQFVPVLKL VSTLLVMGIF GDEDVKQILK MIEPEVFTEE 
154              DDEE------ ETDKPVEGGP AEGEGDKAKG EESEEAAELE D---EGVGKV 
155              DDEE------ ETDKPVEGGP AEGEGDKAKG EESEEAAELE D---EGVGKV 
156              EEEE------ --DEEEEGEE EDEEE----- ---------K E---EDEEET 
158              DGEKMEEEKE AEVVAVDLKD EEEGLEEGLL QMKLPESVKL QMCTLLQFFC 
159              DGEKMEEEKE AEVVAVDLKD EEEGLEEGLL QMKLPESVKL QMCTLLQFFC 
160              AQEKEDEEKE EEEAAE--GE KEEGLEEGLL QMKLPESVKL QMCHLLEYFC 
162              DCELRHRVEA IVAYSDKFVH NIQDNQRIRY NQLMRAFTMS AAETARKTRE 
163              DCELRHRVEA IVAYSDKFVH NIQDNQRIRY NQLMRAFTMS AAETARKTRE 
164              DQELQHRVES LAAFAERYVD KLQANQRSRY GLLIKAFSMT AAETARRTRE 
166              FRSPPQDQVL LLTNFKHSLE EEECPVPDNV RETLKEFHND LLLHCGIHIE 
167              FRSPPQDQVL LLTNFKHSLE EEECPVPDNV RETLKEFHND LLLHCGIHIE 
168              FRSPPQEQIN MLLQFKDGTD EEDCPLPEEI RQDLLDFHQD LLAHCGIQLD 
170              EEPVEEEVDT SLRGRLLSLV DKIKSIRGKK TEEKPE-VEE ETKPSTLQEL 
171              EEPVEEEVDT SLRGRLLSLV DKIKSIRGKK TEEKPE-VEE ETKPSTLQEL 
172              GEEEEPEEET TLGSRLMSLL EKVRLVKKKE EKPEEERSAE ESKPRSLQEL 
174              ISHTMIHWAQ ESFIQNPELV RLMFSLLHRQ YDGLGELIRA LPKAYAINAV 
175              ISHTMIHWAQ ESFIQNPELV RLMFSLLHRQ YDGLGELIRA LPKAYAINAV 
176              VSHMVVRWAQ EDFVQSPELV RAMFSLLHRQ YDGLGELLRA LPRAYTISPS 
178              SVQDTMDLLE CLGQIRSLLI VQMGPEEERL MIQSIGNIMN NKVFYQHPNL 
179              SVQDTMDLLE CLGQIRSLLI VQMGPEEERL MIQSIGNIMN NKVFYQHPNL 
180              SVEDTMSLLE CLGQIRSLLI VQMGPQEENL MIQSIGNIMN NKVFYQHPNL 
182              MRALGMHETV MEVMVNVLGG GGDSKEIRFP QMVTNCCRFL CYFCRISRQN 
183              MRALGMHETV MEVMVNVLGG GGDSKEIRFP QMVTNCCRFL CYFCRISRQN 
184              MRALGMHETV MEVMVNVLGG G-ESKEIRFP KMVTSCCRFL CYFCRISRQN 
186              QRSMFDHLSY LLQNSSIGLG MRGSTPLDVA AASCIDNNEL ALALQEQDLE 
187              QRSMFDHLSY LLQNSSIGLG MRGSTPLDVA AASCIDNNEL ALALQEQDLE 
188              QRSMFDHLSY LLENSGIGLG MQGSTPLDVA AASVIDNNEL ALALQEQDLE 
190              MVVTYLAGCG LQMCPMLLSK CYPDIGWNPC GGERYLDFLR FAVFVNGESV 
191              MVVTYLAGCG LQMCPMLLSK CYPDIGWNPC GGERYLDFLR FAVFVNGESV 
192              KVVSYLAGCG LQSCPMLVAK GYPDIGWNPC GGERYLDFLR FAVFVNGESV 
194              EENANVVVRL LIRRPECFGP ALRGEGGNGL LAAMEEAIKI SEDPARDGPT 
195              EENANVVVRL LIRRPECFGP ALRGEGGNGL LAAMEEAIKI SEDPARDGPT 
196              EENANVVVRL LIRKPECFGP ALRGEGGSGL LAAIEEAIRI SEDPARDGPG 
198              VKKDRRF-MF GGEEQQEENR VHLGNAIMSF YSALIDLLGR CAPEMHLIQA 
199              VKKDRRF-MF GGEEQQEENR VHLGNAIMSF YSALIDLLGR CAPEMHLIQA 
200              IRRDRRR-EH FGEEPPEENR VHLGHAIMSF YAALIDLLGR CAPEMHLIQA 
202              GKGEALRIRA ILRSLVPIED LVGVISLPVQ IPSYGKDSQI VEPKMSASFV 
203              GKGEALRIRA ILRSLVPIED LVGVISLPVQ IPSYGKDSQI VEPKMSASFV 
204              GKGEALRIRA ILRSLVPLED LVGIISLPLQ IPTLGKDGAL VQPKMSASFV 
206              PDHKASMVLF LDRVYGIDNQ DFLLHVLEVG FLPDMRAAAS LDTVAFSTTE 
207              PDHKASMVLF LDRVYGIDNQ DFLLHVLEVG FLPDMRAAAS LDTVAFSTTE 
208              PDHKASMVLF LDRVYGIENQ DFLLHVLDVG FLPDMRAAAS LDTATFSTTE 
210              MALALNRYLC SAVLPLLTKC APLFAGTDHR AIMIDSMLHT IYRLSRGRAL 
211              MALALNRYLC SAVLPLLTKC APLFAGTDHR AIMIDSMLHT IYRLSRGRAL 
212              MALALNRYLC LAVLPLITKC APLFAGTEHR AIMVDSMLHT VYRLSRGRSL 
214              TKAQRDVIEE CLMSLCKYLR PSMLQHLLRR LVFDVPILNE YAKMPLKLLT 
215              TKAQRDVIEE CLMSLCKYLR PSMLQHLLRR LVFDVPILNE YAKMPLKLLT 
216              TKAQRDVIED CLMSLCRYIR PSMLQHLLRR LVFDVPILNE FAKMPLKLLT 
218              NHYERCWKYY CLPNGWANFG VTSEEELHLS RKLFWGIFES LAHKKFDAEL 
219              NHYERCWKYY CLPNGWANFG VTSEEELHLS RKLFWGIFES LAHKKFDAEL 
220              NHYERCWKYY CLPTGWANFG VTSEEELHLT RKLFWGIFDS LAHKKYDPEL 
222              FKIAMPCLCA IAGAIPPDYV DASYSSHTEK KASVDAEGNF DPKPVETTNT 
223              FKIAMPCLCA IAGAIPPDYV DASYSSHTEK KASVDAEGNF DPKPVETTNT 
224              YRMAMPCLCA IAGALPPDYV DASYSSKAEK KATVDAEGNF DPRPVETLNV 
226              IIPERLDAFI NKYAEHTHDK WAFEKIQNNW TYGEVLDEDA KTHPMLRPYK 
227              IIPERLDAFI NKYAEHTHDK WAFEKIQNNW TYGEVLDEDA KTHPMLRPYK 
228              IIPEKLDSFI NKFAEYTHEK WAFDKIQNNW SYGENIDEEL KTHPMLRPYK 
230              TFSEKDKEIY RWPIKESIKA MLAWEWTLEK ARDGEGEVEK KAATRKISQT 
231              TFSEKDKEIY RWPIKESIKA MLAWEWTLEK ARDGEGEVEK KAATRKISQT 
232              TFSEKDKEIY RWPIKESLKA MIAWEWTIEK AREGEEEKTE KKKTRKISQS 
234              AQATYDPSHG YSPQPIDISG MTLSRELQSM AEQLAENYHN TWGRKKKVEL 
235              AQATYDPSHG YSPQPIDISG MTLSRELQSM AEQLAENYHN TWGRKKKVEL 
236              AQ-TYDPREG YNPQPPDLSA VTLSRELQAM AEQLAENYHN TWGRKKKQEL 
238              QSKGGGTHPL LVPYDTLTAK EKARDREKAQ DLLKFLQLNG YAVTR--GMK 
239              QSKGGGTHPL LVPYDTLTAK EKARDREKAQ DLLKFLQLNG YAVTR--GMK 
240              EAKGGGTHPL LVPYDTLTAK EKARDREKAQ ELLKFLQMNG YAVTRHAGLK 
242              DMEQDISSIE KRFAYGFLQK LLKWMDIAQE FIAHLEAVVS SGRVEKSPHE 
243              DMEQDISSIE KRFAYGFLQK LLKWMDIAQE FIAHLEAVVS SGRVEKSPHE 
244              DMELDSSSIE KRFAFGFLQQ LLRWMDISQE FIAHLEAVVS SGRVEKSPHE 
246              QEIKFFAKIL LPLVNQYFKN HCLYFLSTPA KVLGSGGHSS NKEKEMIASI 
247              QEIKFFAKIL LPLVNQYFKN HCLYFLSTPA KVLGSGGHSS NKEKEMIASI 
248              QEIKFFAKIL LPLINQYFTN HCLYFLSTPA KVLGSGGHAS NKEKEMITSL 
250              FCKLAALVRH RVSLFGTDAS AVVNCLHILS RSLDARTVMK SGPEIVKAGL 
251              FCKLAALVRH RVSLFGTDAS AVVNCLHILS RSLDARTVMK SGPEIVKAGL 
252              FCKLAALVRH RVSLFGTDAP AVVNCLHILA RSLDARTVMK SGPEIVKAGL 
254              RQFFESAADD IEKMVENLKL GKVSSRNQ-V KGVSQNINYT TIALLPVLTS 
255              RQFFESAADD IEKMVENLKL GKVSSRNQ-V KGVSQNINYT TIALLPVLTS 
256              RSFFESASED IEKMVENLRL GKVSQARTQV KGVGQNLTYT TVALLPVLTT 
258              LFDHIAQHQF GDDVILDDLQ ISCYRIMCSI YSLGTVKTPH AEKQRPALGE 
259              LFDHIAQHQF GDDVILDDLQ ISCYRIMCSI YSLGTVKTPH AEKQRPALGE 
260              LFQHIAQHQF GDDVILDDVQ VSCYRTLCSI YSLGTTKNTY VEKLRPALGE 
262              CLAHLAAAMP VAFLEPTLNE FNTFSVYTTK TPRERSILGL PSQVEELCPD 
263              CLAHLAAAMP VAFLEPTLNE FNTFSVYTTK TPRERSILGL PSQVEELCPD 
264              CLARLAAAMP VAFLEPQLNE YNACSVYTTK SPRERAILGL PNSVEEMCPD 
266              IPELEVLMKD IHDLAESGAR YTEMPHVIEI TLPMLCNYLP RWWERGLEN- 
267              IPELEVLMKD IHDLAESGAR YTEMPHVIEI TLPMLCNYLP RWWERGLEN- 
268              IPVLERLMAD IGGLAESGAR YTEMPHVIEI TLPMLCSYLP RWWERGPEAP 
270              ---FPEQEGQ ICTSVTSEQL NQLLGSIMKI VVNNLGIDEA SWMKRLAVFA 
271              ---FPEQEGQ ICTSVTSEQL NQLLGSIMKI VVNNLGIDEA SWMKRLAVFA 
272              PSALPAGAPP PCTAVTSDHL NSLLGNILRI IVNNLGIDEA SWMKRLAVFA 
274              QPIVSRAKPE MLKSHFIPTM EKLKKRCGKV VAEEDHLRME GKTEVDSENG 
275              QPIVSRAKPE MLKSHFIPTM EKLKKRCGKV VAEEDHLRME GKTEVDSENG 
276              QPIVSRARPE LLQSHFIPTI GRLRKRAGKV VSEEEQLRLE AKAEAQEGEL 
278              TIRDEFAVLC RDLYALYPLL IRYVDNSRAR WLTNPDPDAE ELFRMVGEVF 
279              TIRDEFAVLC RDLYALYPLL IRYVDNSRAR WLTNPDPDAE ELFRMVGEVF 
280              LVRDEFSVLC RDLYALYPLL IRYVDNNRAQ WLTEPNPSAE ELFRMVGEIF 
282              IFWSKSHNFK REEQNFVVMN EINNMSFLTA DSKSKMSKS- --------GG 
283              IFWSKSHNFK REEQNFVVMN EINNMSFLTA DSKSKMSKS- --------GG 
284              IYWSKSHNFK REEQNFVVQN EINNMSFLTA DNKSKMAKVG ACPVSPQSGG 
286              SEQERTKKKR RGDRYSVQTS LIVAALKKLL PIGLNMCSPA DQELINLAKI 
287              SEQERTKKKR RGDRYSVQTS LIVAALKKLL PIGLNMCSPA DQELINLAKI 
288              SDQERTKKKR RGDRYSVQTS LIVATLKKML PIGLNMCAPT DQDLITLAKT 
290              RYSLKDTDEE VREFLHNNLH LQGKVE-DPA MRWQMSLYKE MAGKAEDAED 
291              RYSLKDTDEE VREFLHNNLH LQGKVE-DPA MRWQMSLYKE MAGKAEDAED 
292              RYALKDTDEE VREFLHNNLH LQGKVEGSPS LRWQMALYRG VPGREEDADD 
294              PEKVVKRVQE VSAVLYHIEV TEHPFKSKKM VWHKLLSKQR RRAVVACFRM 
295              PEKVVKRVQE VSAVLYHIEV TEHPFKSKKM VWHKLLSKQR RRAVVACFRM 
296              PEKIVRRVQE VSAVLYYLDQ TEHPYKSKKA VWHKLLSKQR RRAVVACFRM 
298              TPLYNIITHR ATNMFLDAYK RNWLETEGYS FEDKMIDDLS VSLDHIRSE- 
299              TPLYNIITHR ATNMFLDAYK RNWLETEGYS FEDKMIDDLS VSLDHIRSE- 
300              TPLYNLPTHR ACNMFLESYK AAWILTEDHS FEDRMIDDLS KAGEQEEEEE 
302              ----KKPDPL HQLILHFSRT ALTEKMKLDV DHLYMSYADI MAKGFSVSPP 
303              ----KKPDPL HQLILHFSRT ALTEKMKLDV DHLYMSYADI MAKGFSVSPP 
304              EVEEKKPDPL HQLVLHFSRT ALTEKSKLDE DYLYMAYADI MAKSCHLEEG 
306              CSASQ----- --------EK EMEKQRLLYQ QSRLHNRGAA EMVLQMISAC 
307              CSASQ----- --------EK EMEKQRLLYQ QSRLHNRGAA EMVLQMISAC 
308              GENGE---AE EEVEVSFEEK QMEKQRLLYQ QARLHTRGAA EMVLQMISAC 
310              KGEPGAMVSS TLKLGISILN GGNSDVQQKM LDYLKDKKDV GFFLSIQSLM 
311              KGEPGAMVSS TLKLGISILN GGNSDVQQKM LDYLKDKKDV GFFLSIQSLM 
312              KGETGAMVSS TLKLGISILN GGNAEVQQKM LDYLKDKKEV GFFQSIQALM 
314              QTCSVLDLNA FERQNKAEGL GMVSEEGTNE KVMADDEFTC DLFRFLQLLC 
315              QTCSVLDLNA FERQNKAEGL GMVSEEGTNE KVMADDEFTC DLFRFLQLLC 
316              QTCSVLDLNA FERQNKAEGL GMVNEDGTGE KVMADDEFTQ DLFRFLQLLC 
318              EGHNNDFQNY LRTQTGSTTT INVIICTVDY LLRLQESISD FYWYYSGKDI 
319              EGHNNDFQNY LRTQTGSTTT INVIICTVDY LLRLQESISD FYWYYSGKDI 
320              EGHNNDFQNY LRTQTGNTTT INIIICTVDY LLRLQESISD FYWYYSGKDV 
322              IDEPGKRNFS KAMNVAKQVF NSLTEYIQGP CTGNQQSLAH SRLWDAVVGF 
323              IDEPGKRNFS KAMNVAKQVF NSLTEYIQGP CTGNQQSLAH SRLWDAVVGF 
324              IEEQGKRNFS KAMSVAKQVF NSLTEYIQGP CTGNQQSLAH SRLWDAVVGF 
326              LHVFAHMMMK LAQ------- --DSSQIGLL KELLDLQKDM VVMLLSLLEG 
327              LHVFAHMMMK LAQ------- --DSSQIGLL KELLDLQKDM VVMLLSLLEG 
328              LHVFAHMMMK LAQ------- --DSSQIELL KELLDLQKDM VVMLLSLLEG 
330              NVVNGTIAKQ MVDMLVESSS NVEMILKFFD MFLKLKDIVA SDAFRDYVTD 
331              NVVNGTIAKQ MVDMLVESSS NVEMILKFFD MFLKLKDIVA SDAFRDYVTD 
332              NVVNGMIARQ MVDMLVESSS NVEMILKFFD MFLKLKDIVG SEAFQDYVTD 
334              PRGLISKKDF SKAMDSQKQY TPAEIQFLLS CSEADENEMI NFEEFADRFQ 
335              PRGLISKKDF SKAMDSQKQY TPAEIQFLLS CSEADENEMI NFEEFADRFQ 
336              PRGLISKKDF QKAMDSQKQF SGPEIQFLLS CSEADENEMI NCEEFANRFQ 
338              EPAKDIGFNI AVLLTNLSEH VPHDTRLQNF LEQAESVLNY FRPFLGRIEI 
339              EPAKDIGFNI AVLLTNLSEH VPHDTRLQNF LEQAESVLNY FRPFLGRIEI 
340              EPARDIGFNV AVLLTNLSEH VPHDPRLHNF LELAESILEY FRPYLGRIEI 
342              MGASRKIERI YFEISEANRN QWEMPQVRES KRQFIFDVVN EGGESEKMEM 
343              MGASRKIERI YFEISEANRN QWEMPQVRES KRQFIFDVVN EGGESEKMEM 
344              MGASRRIERI YFEISETNRA QWEMPQVKES KRQFIFDVVN EGGEAEKMEL 
346              FVNFCEDTIF EMNIA---AH A--------- ---------- ---------- 
347              FVNFCEDTIF EMNIA---AH A--------- ---------- ---------- 
348              FVSFCEDTIF EMQIAAQISE PEGEPETDED EGAGAAEAGA EGAEEGAAGL 
350              -----PESTS AFADFLKSVV NFFNMFTFRN LRRRYRRFRK MTVKEMVIGL 
351              -----PESTS AFADFLKSVV NFFNMFTFRN LRRRYRRFRK MTVKEMVIGL 
352              EGTAATAAAG ATARVVAAAG RALRGLSYRS LRRRVRRLRR LTAREAATAV 
354              ATFVYTVVMG ILMFVYSICK GFFTLIWKVL FGGGLVESAK KMTVTDILAS 
355              ATFVYTVVMG ILMFVYSICK GFFTLIWKVL FGGGLVESAK KMTVTDILAS 
356              AALLWAAVTR AGAAGAGAAA GALGLLWGSL FGGGLVEGAK KVTVTELLAG 
358              MPDPTQDEVH GELPPEPGSR EDQD--TEGG ADLLDPVGGE EEEEDSEERE 
359              MPDPTQDEVH GELPPEPGSR EDQD--TEGG ADLLDPVGGE EEEEDSEERE 
360              MPDPTSDEVH GEQPAGPGGD ADGEGASEGA GDAAEG-AGD EEEAVHEAGP 
362              GGRLPGFNTP ---------- GGLGDFGETT PEEPPTPEGT PLLKRKLVSR 
363              GGRLPGFNTP ---------- GGLGDFGETT PEEPPTPEGT PLLKRKLVSR 
364              GGADGAVAVT DGGPFRPEGA GGLGDMGDTT PAEPPTPEGS PILKRKLGVD 
366              HNQIGGQGEE ENAEHEEPPQ ETEKADTENG EKAKKPEAEP EVKEEEPVEE 
367              HNQIGGQGEE ENAEHEEPPQ ETEKADTENG EKAKKPEAEP EVKEEEPVEE 
368              GVEEE--LPP EPEPEPEPEL EPEKADAENG EKEEV----P EPTPEP---- 
370              EEITVKAKAK KSKKPVEEGF ELWNELEIQR VKFMNYLSRN FYNLRYLALF 
371              EEITVKAKAK KSKKPVEEGF ELWNELEIQR VKFMNYLSRN FYNLRYLALF 
372              PKKQAPPSPP PKKE--EAGG EFWGELEVQR VKFLNYLSRN FYTLRFLALF 
374              IAFALNFILL FYKVSDSPP- GEED-----F EGSGLFEGSG LFEGSGVQED 
375              IAFALNFILL FYKVSDSPP- GEED-----F EGSGLFEGSG LFEGSGVQED 
376              LAFAINFILL FYKVSDSPP- GEDD-----M EGSAAGDVSG AGSG-GSSGW 
378              GSGLDDGGED DDEEGPLYYF LEESTGYMEP AMAFLSIVHT IISFLCIIGY 
379              GSGLDDGGED DDEEGPLYYF LEESTGYMEP AMAFLSIVHT IISFLCIIGY 
380              GLGAGEEAEG DEDENMVYYF LEESTGYMEP ALRCLSLLHT LVAFLCIIGY 
382              NCLKVPLVIF KREKELARKL EFDGVYVTEQ PEDDDIKGQW DRLVLNTPSF 
383              NCLKVPLVIF KREKELARKL EFDGVYVTEQ PEDDDIKGQW DRLVLNTPSF 
384              NCLKVPLVIF KREKELARKL EFDGLYITEQ PEDDDVKGQW DRLVLNTPSF 
386              PNNYWDKFVK RKVLDKYGDI YGRERIAELL GMDLASLDVS AMTHEKKPEP 
387              PNNYWDKFVK RKVLDKYGDI YGRERIAELL GMDLASLDVS AMTHEKKPEP 
388              PSNYWDKFVK RKVLDKHGDI YGRERIAELL GMDLATLEIT AHNERK-PNP 
390              DTSMFSWITS IDIKYQIWKF GVVFTDNTFL YLVWYFLMSI LGHYNNFFFA 
391              DTSMFSWITS IDIKYQIWKF GVVFTDNTFL YLVWYFLMSI LGHYNNFFFA 
392              PPGLLTWLMS IDVKYQIWKF GVIFTDNSFL YLGWYMVMSL LGHYNNFFFA 
394              AHLLDIAMGV KTLRTILSSV THNGKQLMMT VGLLAVVVYL YTVVAFNFFR 
395              AHLLDIAMGV KTLRTILSSV THNGKQLMMT VGLLAVVVYL YTVVAFNFFR 
396              AHLLDIAMGV KTLRTILSSV THNGKQLVMT VGLLAVVVYL YTVVAFNFFR 
398              KFYNKSEDED EPDMKCDDMM TCYLFHMYVG VRAGGGIGDE IEDPAGDEYE 
399              KFYNKSEDED EPDMKCDDMM TCYLFHMYVG VRAGGGIGDE IEDPAGDEYE 
400              KFYNKSEDED EPDMKCDDMM TCYLFHMYVG VRAGGGIGDE IEDPAGDEYE 
402              LYRVVFDITF FFFVIVILLA IIQGLIIDAF GELRDQQEQV REDMETKCFI 
403              LYRVVFDITF FFFVIVILLA IIQGLIIDAF GELRDQQEQV REDMETKCFI 
404              LYRVVFDITF FFFVIVILLA IIQGLIIDAF GELRDQQEQV KEDMETKCFI 
406              CGIGSDYFDT TPHGFETHTL EEHNLANYMF FLMYLINKDE TEHTGQESYV 
407              CGIGSDYFDT TPHGFETHTL EEHNLANYMF FLMYLINKDE TEHTGQESYV 
408              CGIGSDYFDT TPHGFETHTL EEHNLANYMF FLMYLINKDE TEHTGQESYV 
410              WKMYQERCWD FFPAGDCFRK QYEDQL- 
411              WKMYQERCWD FFPAGDCFRK QYEDQL- 
412              WKMYQERCWD FFPAGDCFRK QYEDQLS