sync last commit
[bioperl-live.git] / t / data / catalase-webblast.BLASTP
blob0992c10290254f4ce4edb5a03d8bf3e6dd0a140b
1 BLASTP 2.2.10 [Oct-19-2004]
3 Altschul, Stephen F., Thomas L. Madden, Alejandro A. Schäffer, 
4 Jinghui Zhang, Zheng Zhang, Webb Miller, and David J. Lipman 
5 (1997), "Gapped BLAST and PSI-BLAST: a new generation of 
6 protein database search programs",  Nucleic Acids Res. 25:3389-3402.
7 RID: 1118324516-16598-103707467515.BLASTQ1
8 Query= anid_AN8553.1 hypothetical protein 51885 54086 +
9           (528 letters)
10 Database: All non-redundant GenBank CDS
11 translations+PDB+SwissProt+PIR+PRF excluding environmental samples 
12            2,506,223 sequences; 849,940,114 total letters
14                                                                    Score     E
15 Sequences producing significant alignments:                        (Bits)  Value
17 gi|40747822|gb|EAA66978.1|  hypothetical protein AN8553.2 [Asp...  1085    0.0   
18 gi|66846787|gb|EAL87118.1|  catalase, putative [Aspergillus fumig   785    0.0   
19 gi|38326687|gb|AAR17472.1|  catalase [Cochliobolus heterostrophus   716    0.0   
20 gi|42553486|gb|EAA76329.1|  hypothetical protein FG06596.1 [Gi...   584    2e-166
21 gi|2776|emb|CAA39856.1|  catalase [Pichia angusta] >gi|231690|...   336    1e-91 
22 gi|49651945|emb|CAG78888.1|  unnamed protein product [Yarrowia...   331    3e-90 
23 gi|56541435|dbj|BAD77826.1|  catalase [Candida dubliniensis]        323    7e-88 
24 gi|40738591|gb|EAA57781.1|  hypothetical protein AN5918.2 [Asp...   323    9e-88 
25 gi|46440608|gb|EAK99912.1|  hypothetical protein CaO19.6229 [C...   323    9e-88 
26 gi|56541439|dbj|BAD77828.1|  catalase [Candida tropicalis]          321    3e-87 
27 ALIGNMENTS
28 >gi|40747822|gb|EAA66978.1| hypothetical protein AN8553.2 [Aspergillus nidulans FGSC A4]
29  gi|49125822|ref|XP_412690.1| hypothetical protein AN8553.2 [Aspergillus nidulans FGSC A4]
30           Length=528
32  Score = 1085 bits (2807),  Expect = 0.0
33  Identities = 528/528 (100%), Positives = 528/528 (100%), Gaps = 0/528 (0%)
35 Query  1    MVTTAQSQCRHATEVRPPEACLWPQTRFFFRNSSTSTGRSCWSAWFILANSSGGSGAFGH  60
36             MVTTAQSQCRHATEVRPPEACLWPQTRFFFRNSSTSTGRSCWSAWFILANSSGGSGAFGH
37 Sbjct  1    MVTTAQSQCRHATEVRPPEACLWPQTRFFFRNSSTSTGRSCWSAWFILANSSGGSGAFGH  60
39 Query  61   FEVTKDVSDLTKAHFLRSPGIKTPVFIRFSTVTLGREYPDLARNPRGFAVKFYTGEGNYD  120
40             FEVTKDVSDLTKAHFLRSPGIKTPVFIRFSTVTLGREYPDLARNPRGFAVKFYTGEGNYD
41 Sbjct  61   FEVTKDVSDLTKAHFLRSPGIKTPVFIRFSTVTLGREYPDLARNPRGFAVKFYTGEGNYD  120
43 Query  121  IVGLNFPVFFCRDPIQGPDVIRSQYRNPQNFLLDHNSLFDLLANTPEGNHAGMMFFSDHG  180
44             IVGLNFPVFFCRDPIQGPDVIRSQYRNPQNFLLDHNSLFDLLANTPEGNHAGMMFFSDHG
45 Sbjct  121  IVGLNFPVFFCRDPIQGPDVIRSQYRNPQNFLLDHNSLFDLLANTPEGNHAGMMFFSDHG  180
47 Query  181  TPAGWQNIHGYGCHTFKWVNAEGKFVYIKYHFLADHGQKQFNADEALRYGGEDPDYSKRE  240
48             TPAGWQNIHGYGCHTFKWVNAEGKFVYIKYHFLADHGQKQFNADEALRYGGEDPDYSKRE
49 Sbjct  181  TPAGWQNIHGYGCHTFKWVNAEGKFVYIKYHFLADHGQKQFNADEALRYGGEDPDYSKRE  240
51 Query  241  LWRTIENGKELSWTAYVQVMKPEDADPEKLGFDPFDVTKVWPKKQFPLQEFGKLTLNKNP  300
52             LWRTIENGKELSWTAYVQVMKPEDADPEKLGFDPFDVTKVWPKKQFPLQEFGKLTLNKNP
53 Sbjct  241  LWRTIENGKELSWTAYVQVMKPEDADPEKLGFDPFDVTKVWPKKQFPLQEFGKLTLNKNP  300
55 Query  301  ENFHRDVEQAAFSPGSMVPGIEDSPDPLLQFRMFFYRDAQYHRIGVNLHQVPVNCPFMAS  360
56             ENFHRDVEQAAFSPGSMVPGIEDSPDPLLQFRMFFYRDAQYHRIGVNLHQVPVNCPFMAS
57 Sbjct  301  ENFHRDVEQAAFSPGSMVPGIEDSPDPLLQFRMFFYRDAQYHRIGVNLHQVPVNCPFMAS  360
59 Query  361  SYSSLNFDGQLRVDANHAMNPQYAPNSFVHKFRTDTAEAPYQLADGTVSRKSHFFHEGKA  420
60             SYSSLNFDGQLRVDANHAMNPQYAPNSFVHKFRTDTAEAPYQLADGTVSRKSHFFHEGKA
61 Sbjct  361  SYSSLNFDGQLRVDANHAMNPQYAPNSFVHKFRTDTAEAPYQLADGTVSRKSHFFHEGKA  420
63 Query  421  SEYDQPRELYERVMDEKARQHLHTNTARLLKLVEYPKIQAKYLGQLLRISEKYARGVYDL  480
64             SEYDQPRELYERVMDEKARQHLHTNTARLLKLVEYPKIQAKYLGQLLRISEKYARGVYDL
65 Sbjct  421  SEYDQPRELYERVMDEKARQHLHTNTARLLKLVEYPKIQAKYLGQLLRISEKYARGVYDL  480
67 Query  481  LPEKKFGFDEVQSFakgaevagkeakFRPNMPTDKLLGLCPAMAVYGP  528
68             LPEKKFGFDEVQSFAKGAEVAGKEAKFRPNMPTDKLLGLCPAMAVYGP
69 Sbjct  481  LPEKKFGFDEVQSFAKGAEVAGKEAKFRPNMPTDKLLGLCPAMAVYGP  528
72 >gi|66846787|gb|EAL87118.1| catalase, putative [Aspergillus fumigatus Af293]
73           Length=573
75  Score =  785 bits (2027),  Expect = 0.0
76  Identities = 383/473 (80%), Positives = 421/473 (89%), Gaps = 9/473 (1%)
78 Query  54   GSGAFGHFEVTKDVSDLTKAHFLRSPGIKTPVFIRFSTVTLGREYPDLARNPRGFAVKFY  113
79             GSGAFG+FE TKDVS LTKAHFLRS G++TPVF RFSTVTLGRE+PD ARNPRGFAVKFY
80 Sbjct  108  GSGAFGYFETTKDVSSLTKAHFLRSVGVRTPVFARFSTVTLGREFPDEARNPRGFAVKFY  167
82 Query  114  TGEGNYDIVGLNFPVFFCRDPIQGPDVIRSQYRNPQNFLLDHNSLFDLLANTPEGNHAGM  173
83             TGEGNYDIVGLNFPVFFCRDPIQGPDVIRSQYRNPQNFLLDHNSLFDLLANTPEGNHAGM
84 Sbjct  168  TGEGNYDIVGLNFPVFFCRDPIQGPDVIRSQYRNPQNFLLDHNSLFDLLANTPEGNHAGM  227
86 Query  174  MFFSDHGTPAGWQNIHGYGCHTFKWVNAEGKFVYIKYHFLADHGQKQFNADEALRYGGED  233
87             MFFSDHGTP GW+N+HGYGCHTFK VN  G+FVYIKYHF+AD GQKQ  ADEA++  GED
88 Sbjct  228  MFFSDHGTPVGWRNLHGYGCHTFK-VNKRGEFVYIKYHFIADRGQKQSTADEAIQMCGED  286
90 Query  234  PDYSKRELWRTIENGKELSWTAYVQVMKPEDADPEKLGFDPFDVTKVWPKKQFPLQEFGK  293
91             PD+SKR+L++ IE G+++SWTA+VQ+MKPE+ADP KLGFDPFDVTK        L EFGK
92 Sbjct  287  PDFSKRDLYQAIEKGEKISWTAHVQIMKPEEADPTKLGFDPFDVTK--------LHEFGK  338
94 Query  294  LTLNKNPENFHRDVEQAAFSPGSMVPGIEDSPDPLLQFRMFFYRDAQYHRIGVNLHQVPV  353
95             L LNKNPENFHRDVEQAAFSPGSMVPGIEDSPDPLLQFRMFFYRDAQYHRIGVNLHQ+PV
96 Sbjct  339  LVLNKNPENFHRDVEQAAFSPGSMVPGIEDSPDPLLQFRMFFYRDAQYHRIGVNLHQIPV  398
98 Query  354  NCPFMASSYSSLNFDGQLRVDANHAMNPQYAPNSFVHKFRTDTAEAPYQLADGTVSRKSH  413
99             NCPFMASSYSSLNFDG LRVDANHAMNPQYAPNSFVHKFR DTAEAPYQLAD TVSRKSH
100 Sbjct  399  NCPFMASSYSSLNFDGPLRVDANHAMNPQYAPNSFVHKFRPDTAEAPYQLADNTVSRKSH  458
102 Query  414  FFHEGKASEYDQPRELYERVMDEKARQHLHTNTARLLKLVEYPKIQAKYLGQLLRISEKY  473
103             F+HEGK SEYDQPR LY++VMD + R+HLH NTAR+LK+VEYP+IQ +YL QL  I+ +Y
104 Sbjct  459  FYHEGKLSEYDQPRALYQKVMDARGREHLHCNTARMLKVVEYPEIQLRYLTQLYCIAPEY  518
106 Query  474  ARGVYDLLPEKKFGFDEVQSFakgaevagkeakFRPNMPTDKLLGLCPAMAVY  526
107             ARGVYDLLPE+KF F +V++ A+GAE  GKEAKFRP+  TD L G CPA  VY
108 Sbjct  519  ARGVYDLLPEQKFDFSQVKAQAQGAERVGKEAKFRPSKDTDILAGKCPATPVY  571
111 >gi|38326687|gb|AAR17472.1| catalase [Cochliobolus heterostrophus]
112           Length=547
114  Score =  716 bits (1849),  Expect = 0.0
115  Identities = 339/473 (71%), Positives = 398/473 (84%), Gaps = 7/473 (1%)
117 Query  54   GSGAFGHFEVTKDVSDLTKAHFLRSPGIKTPVFIRFSTVTLGREYPDLARNPRGFAVKFY  113
118             GSGAFG+FE TKDV+ LTKA FL++ G KTP+FIRFSTVT GREYPD ARNPRGFA+KFY
119 Sbjct  80   GSGAFGYFETTKDVTHLTKADFLKTVGEKTPIFIRFSTVTPGREYPDEARNPRGFAIKFY  139
121 Query  114  TGEGNYDIVGLNFPVFFCRDPIQGPDVIRSQYRNPQNFLLDHNSLFDLLANTPEGNHAGM  173
122             TGEGNYDIVGLNFPVFFCRDPIQGPDVIRSQ+RNP+NFL D++++FDLLANTPEGNHAG+
123 Sbjct  140  TGEGNYDIVGLNFPVFFCRDPIQGPDVIRSQWRNPKNFLFDYDAIFDLLANTPEGNHAGL  199
125 Query  174  MFFSDHGTPAGWQNIHGYGCHTFKWVNAEGKFVYIKYHFLADHGQKQFNADEALRYGGED  233
126             MFFSDHGTP GW+  HGYGCHTFKWVN +G+FVYIKYHF+A+HGQKQF  ++A +  GED
127 Sbjct  200  MFFSDHGTPQGWRFNHGYGCHTFKWVNKDGQFVYIKYHFVAEHGQKQFTQEQATQMCGED  259
129 Query  234  PDYSKRELWRTIENGKELSWTAYVQVMKPEDADPEKLGFDPFDVTKVWPKKQFPLQEFGK  293
130             PDYSKR+L+ TIENG+E+ W A+VQVM PE+ADP+KLGFDPFDVTKVWP+KQFP+QEFG+
131 Sbjct  260  PDYSKRDLYETIENGEEVVWKAHVQVMSPEEADPDKLGFDPFDVTKVWPRKQFPMQEFGR  319
133 Query  294  LTLNKNPENFHRDVEQAAFSPGSMVPGIEDSPDPLLQFRMFFYRDAQYHRIGVNLHQVPV  353
134             L LNKNPENFHRDVEQAAFSPGSMVPG+EDSPDPLLQFRMFFYRDAQYHRIGVNLHQ+PV
135 Sbjct  320  LVLNKNPENFHRDVEQAAFSPGSMVPGVEDSPDPLLQFRMFFYRDAQYHRIGVNLHQIPV  379
137 Query  354  NCPFMASSYSSLNFDGQLRVDANHAMNPQYAPNSFVHKFRTDTAEAPYQLADGTVSRKSH  413
138             NCPFMA S++SLNFDGQ+RVDANHA N  YAPNSF HKFR D AEAPYQ+ D  +SRKSH
139 Sbjct  380  NCPFMAKSFASLNFDGQMRVDANHAGNKPYAPNSFAHKFRPDVAEAPYQVNDNIMSRKSH  439
141 Query  414  FFHEGKASEYDQPRELYERVMDEKARQHLHTNTARLLKLVEYPKIQAKYLGQLLRISEKY  473
142             ++HEGK +EYDQ +EL+ RVM  + +Q+   NTA +LK V YP+IQ   +G  L      
143 Sbjct  440  YWHEGKKNEYDQAKELWSRVMSVQEKQNTIKNTANMLKFVRYPEIQQYNIGTDL------  493
145 Query  474  ARGVYDLLPEKKFGFDEVQSFakgaevagkeakFRPNMPTDKLLGLCPAMAVY  526
146             +RG+YDLLP+  F F EV+  +  A    KE KFR ++  ++L G  P+M VY
147 Sbjct  494  SRGIYDLLPKPAFDFSEVEELSHTAHEWYKEKKFR-SIDGERLTGFPPSMPVY  545
150 >gi|42553486|gb|EAA76329.1| hypothetical protein FG06596.1 [Gibberella zeae PH-1]
151  gi|46124437|ref|XP_386772.1| hypothetical protein FG06596.1 [Gibberella zeae PH-1]
152           Length=539
154  Score =  584 bits (1506),  Expect = 2e-166
155  Identities = 281/481 (58%), Positives = 338/481 (70%), Gaps = 57/481 (11%)
157 Query  52   SGGSGAFGHFEVTKDVSDLTKAHFLRSPGIKTPVFIRFSTVTLGREYPDLARNPRGFAVK  111
158             S G+GAFG+FE T+DV++LTKA+FL S G KTPVF+RFST TLGRE+PD +RNPRGFA+K
159 Sbjct  112  SCGAGAFGYFECTRDVTELTKANFLSSVGEKTPVFVRFSTATLGREFPDASRNPRGFAIK  171
161 Query  112  FYTGEGNYDIVGLNFPVFFCRDPIQGPDVIRSQYRNPQNFLLDHNSLFDLLANTPEGNHA  171
162             FYT EGNYDIVGLNFPVFFCRDPIQGPDVIRSQ RNP NFLLDH++LFD LAN PE NHA
163 Sbjct  172  FYTKEGNYDIVGLNFPVFFCRDPIQGPDVIRSQSRNPSNFLLDHDALFDFLANNPEANHA  231
165 Query  172  GMMFFSDHGTPAGWQNIHGYGCHTFKWVNAEGKFVYIKYHFLADHGQKQFNADEALRYGG  231
166             G+M FSDHGTP GW+  HGYGCHTFKWVNA+G+F+Y+KYHF+A HGQKQF   EA++  G
167 Sbjct  232  GIMLFSDHGTPQGWRFSHGYGCHTFKWVNADGEFMYVKYHFIAKHGQKQFADSEAMQMCG  291
169 Query  232  EDPDYSKRELWRTIENGKELSWTAYVQVMKPEDADPEKLGFDPFDVTKVWPKKQFPLQEF  291
170             EDPDYSKR+LW  IE G+++ W  +VQ+M P  ADP+ LGFDPFD TK+WP+ +F ++E 
171 Sbjct  292  EDPDYSKRDLWEAIEKGEDIEWMVHVQIMDPRQADPDTLGFDPFDATKIWPRSEFRMKEL  351
173 Query  292  GKLTLNKNPENFHRDVEQAAFSPGSMVPGIEDSPDPLLQFRMFFYRDAQYHRIGVNLHQV  351
174             G+L LNKNPENFHRDVEQA FSPGSMVPGIEDSPDPLLQFRMF YRDAQYHR+G NLHQ+
175 Sbjct  352  GRLVLNKNPENFHRDVEQAVFSPGSMVPGIEDSPDPLLQFRMFLYRDAQYHRVGTNLHQI  411
177 Query  352  PVNCPFMASSYSSLNFDGQLRVDANHAMNPQYAPNSFVHKFRTDTAEAPYQLADGTVSRK  411
178             PVNCPFMA SY+S  FDG + VD + A + QY  NSF HKFR DT EAPY++ D  +   
179 Sbjct  412  PVNCPFMAKSYAS-PFDGPMHVDTDRAGSKQYPLNSFAHKFRPDTDEAPYEVNDNFI---  467
181 Query  412  SHFFHEGKASEYDQPRELYERVMDEKARQHLHTNTARLLKLVEYPKIQAKYLGQLLRISE  471
182                                                              KYL Q+  IS 
183 Sbjct  468  -------------------------------------------------KYLAQVYIISV  478
185 Query  472  KYARGVYDLLPEKKFGFDEVQSFakgaevagkeakFRP----NMPTDKLLGLCPAMAVYG  527
186              YA+G+Y+LL E +F F +V+   +       +  ++     + P  KL+G  P +AVY 
187 Sbjct  479  DYAQGIYNLLDEPRFEFSKVKKLGETKFAEAADDWYKEPKFRDKPGSKLVGYPPEIAVYQ  538
189 Query  528  P  528
190             P
191 Sbjct  539  P  539
194 >gi|2776|emb|CAA39856.1| catalase [Pichia angusta]
195  gi|231690|sp|P30263|CATA_PICAN Peroxisomal catalase
196  gi|228770|prf||1811225A catalase
197           Length=507
199  Score =  336 bits (862),  Expect = 1e-91
200  Identities = 163/331 (49%), Positives = 216/331 (65%), Gaps = 2/331 (0%)
202 Query  54   GSGAFGHFEVTKDVSDLTKAHFLRSPGIKTPVFIRFSTVTLGREYPDLARNPRGFAVKFY  113
203             G+GA+G FEVT D++D+  A FL + G KT +F RFSTV   +   D AR+PRGFA KFY
204 Sbjct  68   GAGAYGVFEVTDDITDVCSAKFLDTVGKKTRIFTRFSTVGGEKGSADTARDPRGFATKFY  127
206 Query  114  TGEGNYDIVGLNFPVFFCRDPIQGPDVIRSQYRNPQNFLLDHNSLFDLLANTPEGNHAGM  173
207             T +GN D+V  N P+FF RDPI+ P  I +Q RNP   L D N  +D L    E  H  M
208 Sbjct  128  TEDGNLDLVYNNTPIFFIRDPIKFPHFIHTQKRNPATNLKDPNMFWDYLTANDESLHQVM  187
210 Query  174  MFFSDHGTPAGWQNIHGYGCHTFKWVNAEGKFVYIKYHFLADHGQKQFNADEALRYGGED  233
211               FS+ GTPA ++ ++GY  HT+KW N++G++VY++ HF+A+ G      +EA R  GED
212 Sbjct  188  YLFSNRGTPASYRTMNGYSGHTYKWYNSKGEWVYVQVHFIANQGVHNLLDEEAGRLAGED  247
214 Query  234  PDYSKRELWRTIENGKELSWTAYVQVMKPEDADPEKLGFDPFDVTKVWPKKQFPLQEFGK  293
215             PD+S R+LW  IE G   SW  Y+Q M  E +  +KL F  FD+TKVWP K FPL+ FG+
216 Sbjct  248  PDHSTRDLWEAIEKGDYPSWECYIQTMTLEQS--KKLPFSVFDLTKVWPHKDFPLRHFGR  305
218 Query  294  LTLNKNPENFHRDVEQAAFSPGSMVPGIEDSPDPLLQFRMFFYRDAQYHRIGVNLHQVPV  353
219              TLN+NP+N++ + EQ AFSP   VPG+E S DP+LQ R+F Y D   HR+G N HQ+PV
220 Sbjct  306  FTLNENPKNYYAETEQIAFSPSHTVPGMEPSNDPVLQSRLFSYPDTHRHRLGPNYHQIPV  365
222 Query  354  NCPFMASSYSSLNFDGQLRVDANHAMNPQYA  384
223             NCP  + S++ +N DG + VD N    P YA
224 Sbjct  366  NCPLKSGSFNPINRDGPMCVDGNLGGTPNYA  396
227 >gi|49651945|emb|CAG78888.1| unnamed protein product [Yarrowia lipolytica CLIB99]
228  gi|50557334|ref|XP_506075.1| hypothetical protein [Yarrowia lipolytica]
229           Length=492
231  Score =  331 bits (849),  Expect = 3e-90
232  Identities = 189/438 (43%), Positives = 251/438 (57%), Gaps = 28/438 (6%)
234 Query  54   GSGAFGHFEVTKDVSDLTKAHFLRSPGIKTPVFIRFSTVTLGREYPDLARNPRGFAVKFY  113
235             GSGA+G FEVT D++DL  A FL   G KT  F RFSTV   +   D AR+PRGFA KFY
236 Sbjct  60   GSGAYGEFEVTDDITDLNCADFLSKIGKKTKTFTRFSTVGGEKGSADAARDPRGFATKFY  119
238 Query  114  TGEGNYDIVGLNFPVFFCRDPIQGPDVIRSQYRNPQNFLLDHNSLFDLLANTPEGNHAGM  173
239             T EGN D V  N PVFF RDP + P  I +Q RNP+  L D   ++D +AN  E  H  M
240 Sbjct  120  TDEGNIDWVYNNTPVFFIRDPSKFPVFIHTQKRNPETNLKDATMMWDYIANNQECCHQIM  179
242 Query  174  MFFSDHGTPAGWQNIHGYGCHTFKWVNAEGKFVYIKYHFLADHGQKQFNADEALRYGGED  233
243             + FSD GTPA ++ ++GY  HT+KW+  +G F Y++ H   D G K    DEA+   G +
244 Sbjct  180  VLFSDRGTPANYRQMNGYSGHTYKWIKKDGSFNYVQIHMKTDQGIKNLTNDEAVALSGTN  239
246 Query  234  PDYSKRELWRTIENGKELSWTAYVQVMKPEDADPEKLGFDPFDVTKVWPKKQFPLQEFGK  293
247             PD+++ +L+ +I++G   SWT YVQV  PE A  EKL +  FD+TKVWP  QFPL+ FGK
248 Sbjct  240  PDHAQEDLFNSIKSGSFPSWTCYVQVCTPEQA--EKLKWSVFDLTKVWPHDQFPLRRFGK  297
250 Query  294  LTLNKNPENFHRDVEQAAFSPGSMVPGIEDSPDPLLQFRMFFYRDAQYHRIGVNLHQVPV  353
251             LTLNKN +N+  + EQAAFSP + VPG E S DP+LQ R+F Y D Q HR+G N  Q+PV
252 Sbjct  298  LTLNKNVQNYFAETEQAAFSPSNTVPGWETSADPVLQSRLFSYPDTQRHRLGTNFAQIPV  357
254 Query  354  NCPFMASSYSSLNFDGQLRVDANHAMNPQYAPNSFVHKFRTDTAEAPYQLADGTVSRKSH  413
255             NCP+ A  ++  + DGQ+ V+ N    P Y P+SF           P Q        + H
256 Sbjct  358  NCPYHA--HTPYHRDGQMAVNGNSGSLPNY-PSSF----------EPLQYRQDINLHEKH  404
258 Query  414  FFHEGKASEY-----------DQPRELYERV-MDEKARQHLHTNTARLLKLVEYPKIQAK  461
259                 G+A  Y            QP EL++ +      ++HL  N A  L     P++Q K
260 Sbjct  405  EKWVGEAVAYQWVVGTDGVDFQQPAELWKVLGKTPDQQEHLVYNIAVSLSGAR-PEVQDK  463
262 Query  462  YLGQLLRISEKYARGVYD  479
263               G   ++   + + V D
264 Sbjct  464  TFGMFDKVDAHFGKLVRD  481
267 >gi|56541435|dbj|BAD77826.1| catalase [Candida dubliniensis]
268           Length=485
270  Score =  323 bits (829),  Expect = 7e-88
271  Identities = 166/390 (42%), Positives = 239/390 (61%), Gaps = 6/390 (1%)
273 Query  54   GSGAFGHFEVTKDVSDLTKAHFLRSPGIKTPVFIRFSTVTLGREYPDLARNPRGFAVKFY  113
274             GSGA+G FEVT D++D+  A FL + G KT VF RFSTV       D AR+PRGFA KFY
275 Sbjct  56   GSGAYGVFEVTDDITDVCAAKFLDTVGKKTRVFTRFSTVGGELGSADTARDPRGFATKFY  115
277 Query  114  TGEGNYDIVGLNFPVFFCRDPIQGPDVIRSQYRNPQNFLLDHNSLFDLLANTPEGNHAGM  173
278             T EGN D+V  N PVFF RDP + P  I +Q RNP+  L D N  +D L +  E  H  M
279 Sbjct  116  TEEGNLDLVYNNTPVFFIRDPSKFPHFIHTQKRNPETHLKDANMFWDYLTSNEESIHQVM  175
281 Query  174  MFFSDHGTPAGWQNIHGYGCHTFKWVNAEGKFVYIKYHFLADHGQKQFNADEALRYGGED  233
282             + FSD GTPA ++ ++GY  HT+KW N +G++ Y++ HF++D G K    +EA    G +
283 Sbjct  176  ILFSDRGTPASYREMNGYSGHTYKWSNKKGEWFYVQVHFISDQGIKTLTNEEAGALAGSN  235
285 Query  234  PDYSKRELWRTIENGKELSWTAYVQVMKPEDADPEKLGFDPFDVTKVWPKKQFPLQEFGK  293
286             PDY++ +L++ I  G   SWTAY+Q M   +A+ ++  F  FD+TKVWP K++PL+ FGK
287 Sbjct  236  PDYAQEDLFKNIAAGNYPSWTAYIQTM--TEAEAKEADFSVFDLTKVWPHKKYPLRRFGK  293
289 Query  294  LTLNKNPENFHRDVEQAAFSPGSMVPGIEDSPDPLLQFRMFFYRDAQYHRIGVNLHQVPV  353
290              TLN+NP+N+  +VEQAAFSP   VP +E S DP+LQ R+F Y D   HR+G N  Q+PV
291 Sbjct  294  FTLNENPKNYFAEVEQAAFSPAHTVPYMEPSADPVLQSRLFSYADTHRHRLGTNYTQIPV  353
293 Query  354  NCPFMASSYSSLNFDGQLRVDANHAMNPQYAPNSFVHKFRTDTAEAPYQLADGTVSRKSH  413
294             NCP   + ++    DG + V+ N   +P Y  +    +F+  + +   ++ +G     + 
295 Sbjct  354  NCPVTGAVFNPHMRDGAMTVNGNLGSHPNYLASDKPVEFKQFSLQEDQEVWNGAA---TP  410
297 Query  414  FFHEGKASEYDQPRELYERVMDEKARQHLH  443
298             F  +   +++ Q +EL+ +V+     Q  H
299 Sbjct  411  FHWKATPADFKQAQELW-KVLKRYPNQQEH  439
302 >gi|40738591|gb|EAA57781.1| hypothetical protein AN5918.2 [Aspergillus nidulans FGSC A4]
303  gi|49097190|ref|XP_410055.1| hypothetical protein AN5918.2 [Aspergillus nidulans FGSC A4]
304           Length=501
306  Score =  323 bits (828),  Expect = 9e-88
307  Identities = 162/336 (48%), Positives = 214/336 (63%), Gaps = 6/336 (1%)
309 Query  54   GSGAFGHFEVTKDVSDLTKAHFLRSPGIKTPVFIRFSTVTLGREYPDLARNPRGFAVKFY  113
310             G+GA+G FEVT D+SD+T    L+  G KT  F+RFSTV   +  PD AR+PRGFA KFY
311 Sbjct  69   GAGAYGEFEVTDDISDITVIDMLKGVGKKTKTFVRFSTVGGEKGSPDSARDPRGFACKFY  128
313 Query  114  TGEGNYDIVGLNFPVFFCRDPIQGPDVIRSQYRNPQNFLLDHNSLFDLLANTPEGNHAGM  173
314             T EGN+D V  N PVFF RDP + P  I +Q RNPQ  L D    +D L+   E  H  M
315 Sbjct  129  TEEGNWDWVFNNTPVFFLRDPSKFPMFIHTQKRNPQTNLKDATMFWDYLSTHQEAVHQVM  188
317 Query  174  MFFSDHGTPAGWQNIHGYGCHTFKWVNAEGKFVYIKYHFLADHGQKQFNADEALRYGGED  233
318               FSD GTP  +++++GY  HT+KW+  +G F Y++ H   D G K F   EA R   E+
319 Sbjct  189  HLFSDRGTPYSYRHMNGYSGHTYKWIKPDGTFNYVQLHLKTDQGNKTFTDAEATRLAAEN  248
321 Query  234  PDYSKRELWRTIENGKELSWTAYVQVMKPEDADPEKLGFDPFDVTKVWPKKQFPLQEFGK  293
322             PD+  ++L+  I  G+  SWT YVQ + PE A  EK  ++ FD+TKVWP+ + PL+ FG+
323 Sbjct  249  PDWHTQDLFNAIARGEYPSWTCYVQTLSPEQA--EKFRWNIFDLTKVWPQSEVPLRRFGR  306
325 Query  294  LTLNKNPENFHRDVEQAAFSPGSMVPGIEDSPDPLLQFRMFFYRDAQYHRIGV-NLHQVP  352
326              TLNKNPEN+  +VEQAAFSP  +VPG+E S DP+LQ R+F Y D   HR+G  N   +P
327 Sbjct  307  FTLNKNPENYFAEVEQAAFSPSHLVPGVEPSADPVLQARLFSYPDTHRHRLGTSNYQSIP  366
329 Query  353  VNCPFMASSYSSLNFDGQLRVDANHAMNPQYAPNSF  388
330             VNCP  A  ++  + DG + V+ NH  NP Y P++F
331 Sbjct  367  VNCPLRA--FTPFHRDGAMSVNGNHGANPNY-PSTF  399
334 >gi|46440608|gb|EAK99912.1| hypothetical protein CaO19.6229 [Candida albicans SC5314]
335  gi|46440519|gb|EAK99824.1| hypothetical protein CaO19.13609 [Candida albicans SC5314]
336  gi|2317282|dbj|BAA21767.1| catalase [Candida albicans]
337           Length=485
339  Score =  323 bits (828),  Expect = 9e-88
340  Identities = 165/390 (42%), Positives = 239/390 (61%), Gaps = 6/390 (1%)
342 Query  54   GSGAFGHFEVTKDVSDLTKAHFLRSPGIKTPVFIRFSTVTLGREYPDLARNPRGFAVKFY  113
343             GSGA+G FEVT D++D+  A FL + G KT +F RFSTV       D AR+PRGFA KFY
344 Sbjct  56   GSGAYGVFEVTDDITDICAAKFLDTVGKKTRIFTRFSTVGGELGSADTARDPRGFATKFY  115
346 Query  114  TGEGNYDIVGLNFPVFFCRDPIQGPDVIRSQYRNPQNFLLDHNSLFDLLANTPEGNHAGM  173
347             T EGN D+V  N PVFF RDP + P  I +Q RNP+  L D N  +D L +  E  H  M
348 Sbjct  116  TEEGNLDLVYNNTPVFFIRDPSKFPHFIHTQKRNPETHLKDANMFWDYLTSNEESIHQVM  175
350 Query  174  MFFSDHGTPAGWQNIHGYGCHTFKWVNAEGKFVYIKYHFLADHGQKQFNADEALRYGGED  233
351             + FSD GTPA ++ ++GY  HT+KW N +G++ Y++ HF++D G K    +EA    G +
352 Sbjct  176  VLFSDRGTPASYREMNGYSGHTYKWSNKKGEWFYVQVHFISDQGIKTLTNEEAGALAGSN  235
354 Query  234  PDYSKRELWRTIENGKELSWTAYVQVMKPEDADPEKLGFDPFDVTKVWPKKQFPLQEFGK  293
355             PDY++ +L++ I  G   SWTAY+Q M   +A+ ++  F  FD+TKVWP K++PL+ FGK
356 Sbjct  236  PDYAQEDLFKNIAAGNYPSWTAYIQTM--TEAEAKEAEFSVFDLTKVWPHKKYPLRRFGK  293
358 Query  294  LTLNKNPENFHRDVEQAAFSPGSMVPGIEDSPDPLLQFRMFFYRDAQYHRIGVNLHQVPV  353
359              TLN+NP+N+  +VEQAAFSP   VP +E S DP+LQ R+F Y D   HR+G N  Q+PV
360 Sbjct  294  FTLNENPKNYFAEVEQAAFSPAHTVPYMEPSADPVLQSRLFSYADTHRHRLGTNYTQIPV  353
362 Query  354  NCPFMASSYSSLNFDGQLRVDANHAMNPQYAPNSFVHKFRTDTAEAPYQLADGTVSRKSH  413
363             NCP   + ++    DG + V+ N   +P Y  +    +F+  + +   ++ +G     + 
364 Sbjct  354  NCPVTGAVFNPHMRDGAMTVNGNLGSHPNYLASDKPVEFKQFSLQEDQEVWNGAA---TP  410
366 Query  414  FFHEGKASEYDQPRELYERVMDEKARQHLH  443
367             F  +   +++ Q +EL+ +V+     Q  H
368 Sbjct  411  FHWKATPADFKQAQELW-KVLKRYPNQQEH  439
371 >gi|56541439|dbj|BAD77828.1| catalase [Candida tropicalis]
372           Length=485
374  Score =  321 bits (823),  Expect = 3e-87
375  Identities = 171/436 (39%), Positives = 254/436 (58%), Gaps = 11/436 (2%)
377 Query  54   GSGAFGHFEVTKDVSDLTKAHFLRSPGIKTPVFIRFSTVTLGREYPDLARNPRGFAVKFY  113
378             GSGA+G FEVT D++D+  A FL + G KT +F RFSTV       D AR+PRGFA KFY
379 Sbjct  56   GSGAYGVFEVTDDITDICAAKFLDTVGKKTRIFTRFSTVGGEAGSADTARDPRGFATKFY  115
381 Query  114  TGEGNYDIVGLNFPVFFCRDPIQGPDVIRSQYRNPQNFLLDHNSLFDLLANTPEGNHAGM  173
382             T EGN D+V  N PVFF RDP + P  I +Q RN +  L D N  +D L +  E NH  M
383 Sbjct  116  TEEGNLDLVYNNTPVFFIRDPSKFPHFIHTQKRNSETHLKDANMFWDYLTSNEESNHQVM  175
385 Query  174  MFFSDHGTPAGWQNIHGYGCHTFKWVNAEGKFVYIKYHFLADHGQKQFNADEALRYGGED  233
386             + FSD GTPA ++ ++GY  HT+KW N +G++ Y++ HF+ D G K    +EA    G +
387 Sbjct  176  ILFSDRGTPASYREMNGYSGHTYKWSNKKGEWHYVQVHFITDQGNKTLTNEEAGSLAGSN  235
389 Query  234  PDYSKRELWRTIENGKELSWTAYVQVMKPEDADPEKLGFDPFDVTKVWPKKQFPLQEFGK  293
390             PDY++ +L++ +  G   SWT Y+Q M   +A  ++  F  FD+TKVWP  ++PL+ FGK
391 Sbjct  236  PDYAQEDLFKNMLAGNYPSWTCYIQTM--TEAQAKEADFSVFDLTKVWPHGKYPLRRFGK  293
393 Query  294  LTLNKNPENFHRDVEQAAFSPGSMVPGIEDSPDPLLQFRMFFYRDAQYHRIGVNLHQVPV  353
394              TLN+NP+N+  +VEQAAFSP   VP +E S DP+LQ R+F Y D   HR+G N  Q+PV
395 Sbjct  294  FTLNENPKNYFAEVEQAAFSPAHTVPYMEPSADPVLQSRLFSYSDTHRHRLGTNYTQIPV  353
397 Query  354  NCPFMASSYSSLNFDGQLRVDANHAMNPQYAPNSFVHKFRTDTAEAPYQLADGTVSRKSH  413
398             NCP   + ++    DG + V+ N   +P Y  +    +F+  + +   ++  G     + 
399 Sbjct  354  NCPVTGAVFNPHMRDGAMNVNGNLGSHPNYLASDKPIEFKQFSLQEDQEVWHGAA---TP  410
401 Query  414  FFHEGKASEYDQPRELYERVMD-EKARQHLHTNTARLLKLVEYPKIQAKYLGQLLRISEK  472
402             F  +   +++ Q +EL++ +      ++HL  N A      + P IQ K +    ++S +
403 Sbjct  411  FHWKATPADFKQSQELWKVLKRYPNQQEHLAHNVAVHASAADAP-IQDKVIAYFAKVSPE  469
405 Query  473  YA----RGVYDLLPEK  484
406              +    + + +L P K
407 Sbjct  470  LSNLIKKEILELSPRK  485
410 Database: All non-redundant GenBank CDS translations+PDB+SwissProt+PIR+PRF excluding 
411 environmental samples
412   Posted date:  Jun 8, 2005  3:44 AM
413 Number of letters in database: 849940114
414 Number of sequences in database:  2506223
415 Lambda     K      H
416    0.321    0.138    0.437 
417 Gapped
418 Lambda     K      H
419    0.267   0.0410    0.140 
420 Matrix: BLOSUM62
421 Gap Penalties: Existence: 11, Extension: 1
422 Number of Sequences: 147123
423 Number of Hits to DB: 13821951
424 Number of extensions: 654954
425 Number of successful extensions: 1258
426 Number of sequences better than 10: 15
427 Number of HSP's better than 10 without gapping: 14
428 Number of HSP's gapped: 1225
429 Number of HSP's successfully gapped: 15
430 Number of extra gapped extensions for HSPs above 10: 1206
431 Length of query: 528
432 Length of database: 849940114
433 Length adjustment: 116
434 Effective length of query: 412
435 Effective length of database: 69377587
436 Effective search space: 28583565844
437 Effective search space used: 21552263428
438 T: 11
439 A: 40
440 X1: 16 (7.4 bits)
441 X2: 38 (14.6 bits)
442 X3: 64 (24.7 bits)
443 S1: 41 (20.4 bits)
444 S2: 69 (31.2 bits)