Merge pull request #231 from bioperl/pir-no-desc-line
[bioperl-live.git] / t / data / phi.out
blobca6a0e45efda2258dc6fba216cd03a50b95afef9
1 BLASTP 2.0.14 [Jun-29-2000]
4 Reference: Altschul, Stephen F., Thomas L. Madden, Alejandro A. Schaffer, 
5 Jinghui Zhang, Zheng Zhang, Webb Miller, and David J. Lipman (1997), 
6 "Gapped BLAST and PSI-BLAST: a new generation of protein database search
7 programs",  Nucleic Acids Res. 25:3389-3402.
9 Query= CYS1_DICDI
10          (351 letters)
12 Database: /home/peter/blast/data/swissprot
13            88,780 sequences; 31,984,247 total letters
15 Searching......................................................................................................................................................
16 3 occurrence(s) of pattern in query
17   CYS1_DICDI; PATTERN.\r
18  pattern P-E-E-Q at position 23 of query sequence
19 effective database length=3.2e+07
20  pattern probability=8.9e-06
21 lengthXprobability=2.8e+02
23 Number of occurrences of pattern in the database is 349
24   CYS1_DICDI; PATTERN.\r
25  pattern P-E-E-Q at position 120 of query sequence
26 effective database length=3.2e+07
27  pattern probability=8.9e-06
28 lengthXprobability=2.8e+02
30 Number of occurrences of pattern in the database is 349
31   CYS1_DICDI; PATTERN.\r
32  pattern P-E-E-Q at position 237 of query sequence
33 effective database length=3.2e+07
34  pattern probability=8.9e-06
35 lengthXprobability=2.8e+02
37 Number of occurrences of pattern in the database is 349
38 done
41                                                                    Score     E
42                                                                    (bits)  Value
44 Significant matches for pattern occurrence 1 at position 23
47 sp|P04988|CYS1_DICDI CYSTEINE PROTEINASE 1 PRECURSOR                  688  0.0
48 sp|P30957|RYNC_RABIT RYANODINE RECEPTOR, CARDIAC MUSCLE                 8  4.8
49 sp|Q08862|GTC_RABIT GLUTATHIONE S-TRANSFERASE YC (ALPHA II) (GST...     7  6.0
50 sp|O95801|TTC4_HUMAN TETRATRICOPEPTIDE REPEAT PROTEIN 4                 7  7.6
51 sp|P36114|YKZ8_YEAST HYPOTHETICAL 81.8 KDA PROTEIN IN YPT52-DBP7...     7  9.6
54 Significant matches for pattern occurrence 2 at position 120
57 sp|P11559|MCRA_METVO METHYL-COENZYME M REDUCTASE ALPHA SUBUNIT         13  0.13
58 sp|Q49605|MCRA_METKA METHYL-COENZYME M REDUCTASE I ALPHA SUBUNIT...    11  0.43
59 sp|P81901|FER_PYRIS FERREDOXIN (SEVEN-IRON FERREDOXIN)                 11  0.55
60 sp|Q58256|MCRX_METJA METHYL-COENZYME M REDUCTASE II ALPHA SUBUNI...    10  1.1
61 sp|P53203|YG14_YEAST HYPOTHETICAL 52.9 KD PROTEIN IN ERP6-TFG2 I...     8  3.0
62 sp|P55002|MGP1_MOUSE MICROFIBRIL-ASSOCIATED GLYCOPROTEIN PRECURS...     7  6.0
63 sp|Q06234|ASH1_XENLA ACHAETE-SCUTE HOMOLOG 1                            7  7.6
64 sp|P20918|PLMN_MOUSE PLASMINOGEN PRECURSOR [CONTAINS: ANGIOSTATIN]      7  7.6
67 Significant matches for pattern occurrence 3 at position 237
70 sp|P49362|GCSB_FLAPR GLYCINE DEHYDROGENASE [DECARBOXYLATING] B, ...     9  1.4
71 sp|P49361|GCSA_FLAPR GLYCINE DEHYDROGENASE [DECARBOXYLATING] A, ...     9  1.4
72 sp|O49852|GCSP_FLATR GLYCINE DEHYDROGENASE [DECARBOXYLATING], MI...     8  4.8
73 sp|P32767|PDR6_YEAST PLEIOTROPIC DRUG RESISTANCE REGULATORY PROT...     7  6.0
74 sp|O49850|GCSP_FLAAN GLYCINE DEHYDROGENASE [DECARBOXYLATING], MI...     7  9.6
77 Significant alignments for pattern occurrence 1 at position 23
79 >sp|P04988|CYS1_DICDI CYSTEINE PROTEINASE 1 PRECURSOR
80           Length = 343
82  Score =  688 bits (1789), Expect = 0.0
83  Identities = 343/351 (97%), Positives = 343/351 (97%), Gaps = 8/351 (2%)
85 Query:  1   MKVILLFVLAVFTVFVSSRGIPPEEQSQFLEFQDKFNKKYSHEEYLERFEIFKSNLGKIE 60
86 pattern 23                        ****
87             MKVILLFVLAVFTVFVSSRGIPPEEQSQFLEFQDKFNKKYSHEEYLERFEIFKSNLGKIE
88 Sbjct:  1   MKVILLFVLAVFTVFVSSRGIPPEEQSQFLEFQDKFNKKYSHEEYLERFEIFKSNLGKIE 60
90 Query:  61  ELNLIAINHKADTKFGVNKFADLSSDEFKNYYLNNKEAIFTDDLPVADYLDDEFINSIPP 120
91 pattern 120                                                            *
92             ELNLIAINHKADTKFGVNKFADLSSDEFKNYYLNNKEAIFTDDLPVADYLDDEFINSIP 
93 Sbjct:  61  ELNLIAINHKADTKFGVNKFADLSSDEFKNYYLNNKEAIFTDDLPVADYLDDEFINSIP- 119
95 Query:  121 EEQTAFDWRTRGAVTPVKNQGQCGSCWSFSTTGNVEGQHFISQNKLVSLSEQNLVDCDHE 180
96 pattern 121 ***
97                TAFDWRTRGAVTPVKNQGQCGSCWSFSTTGNVEGQHFISQNKLVSLSEQNLVDCDHE
98 Sbjct:  120 ---TAFDWRTRGAVTPVKNQGQCGSCWSFSTTGNVEGQHFISQNKLVSLSEQNLVDCDHE 176
100 Query:  181 CMEYEGEEACDEGCNGGLQPNAYNYIIKNGGIQTESSYPYTAETGTQCNFNSANIGPEEQ 240
101 pattern 237                                                         ****
102             CMEYEGEEACDEGCNGGLQPNAYNYIIKNGGIQTESSYPYTAETGTQCNFNSANIG    
103 Sbjct:  177 CMEYEGEEACDEGCNGGLQPNAYNYIIKNGGIQTESSYPYTAETGTQCNFNSANIG---- 232
105 Query:  241 AKISNFTMIPKNETVMAGYIVSTGPLAIAADAVEWQFYIGGVFDIPCNPNSLDHGILIVG 300
106             AKISNFTMIPKNETVMAGYIVSTGPLAIAADAVEWQFYIGGVFDIPCNPNSLDHGILIVG
107 Sbjct:  233 AKISNFTMIPKNETVMAGYIVSTGPLAIAADAVEWQFYIGGVFDIPCNPNSLDHGILIVG 292
109 Query:  301 YSAKNTIFRKNMPYWIVKNSWGADWGEQGYIYLRRGKNTCGVSNFVSTSII 351
110             YSAKNTIFRKNMPYWIVKNSWGADWGEQGYIYLRRGKNTCGVSNFVSTSII
111 Sbjct:  293 YSAKNTIFRKNMPYWIVKNSWGADWGEQGYIYLRRGKNTCGVSNFVSTSII 343
114 >sp|P30957|RYNC_RABIT RYANODINE RECEPTOR, CARDIAC MUSCLE
115           Length = 4969
117  Score =  7.8 bits (25), Expect = 4.8
118  Identities = 14/39 (35%), Positives = 19/39 (47%)
120 Query:  23   PEEQSQFLEFQDKFNKKYSHEEYLERFEIFKSNLGKIEE 61
121 pattern 23   ****
122              PEEQ +F E + K  +K   EE     E  +   G+ EE
123 Sbjct:  4414 PEEQEKFQEQKTKEEEKEEKEETKSEPEKAEGEDGEKEE 4452
126 >sp|Q08862|GTC_RABIT GLUTATHIONE S-TRANSFERASE YC (ALPHA II) (GST CLASS-ALPHA)
127           Length = 221
129  Score =  7.4 bits (24), Expect = 6.0
130  Identities = 19/67 (28%), Positives = 35/67 (51%), Gaps = 12/67 (17%)
132 Query:  21  IPPEEQ-SQFLEFQDKFNKKY---------SH-EEYLERFEIFKSNLGKIEEL-NLIAIN 68
133 pattern 23    ****
134             +PPEEQ ++  + +DK   +Y         SH ++YL   ++ K+++  +E L N+  +N
135 Sbjct:  112 LPPEEQEAKLAQIKDKAKNRYFPAFEKVLKSHGQDYLVGNKLSKADILLVELLYNVEELN 171
137 Query:  69  HKADTKF 75
138               A   F
139 Sbjct:  172 PGATASF 178
142 >sp|O95801|TTC4_HUMAN TETRATRICOPEPTIDE REPEAT PROTEIN 4
143           Length = 356
145  Score =  7.1 bits (23), Expect = 7.6
146  Identities = 14/67 (20%), Positives = 32/67 (46%), Gaps = 5/67 (7%)
148 Query:  23  PEEQSQFLEFQDKFNKKYSHEEYLERFEIFKSNLGK---IEELNLIAINHKADTKFGVNK 79
149 pattern 23  ****
150             PEEQ++   ++D+ N  +  ++Y +    +   L K     +LN +   ++A  ++ +  
151 Sbjct:  75  PEEQAK--TYKDEGNDYFKEKDYKKAVISYTEGLKKKCADPDLNAVLYTNRAAAQYYLGN 132
153 Query:  80  FADLSSD 86
154             F    +D
155 Sbjct:  133 FRSALND 139
158 >sp|P36114|YKZ8_YEAST HYPOTHETICAL 81.8 KDA PROTEIN IN YPT52-DBP7 INTERGENIC REGION
159           Length = 725
161  Score =  6.8 bits (22), Expect = 9.6
162  Identities = 21/99 (21%), Positives = 43/99 (43%), Gaps = 21/99 (21%)
164 Query:  21  IPPEEQ--SQFLEFQDKFNKKYSHEEYLERFEIFKSNLGKIEELNLIAINHKADTKFGVN 78
165 pattern 23    ****
166             + PEEQ     L+F ++      H    ER  +  +++G    +N      +   + G+ 
167 Sbjct:  213 LTPEEQKDKDLLQFAEQI-----HSMRTER--LSGAHIGNSPAIN------RLRGELGLQ 259
169 Query:  79  KFADLSSDEFKNYYLNNKEAIFTDDLPVADYLDDEFINS 117
170                DL  +E  ++       + +DD+ ++    DEF++S
171 Sbjct:  260 AMEDLPEEEITDH------KVLSDDIDLSQATIDEFVHS 292
175 Significant alignments for pattern occurrence 2 at position 120
177 >sp|P11559|MCRA_METVO METHYL-COENZYME M REDUCTASE ALPHA SUBUNIT
178           Length = 555
180  Score = 13.0 bits (40), Expect = 0.13
181  Identities = 16/28 (57%), Positives = 18/28 (64%), Gaps = 3/28 (10%)
183 Query:  99  IFTDDLPVADYLDDEF---INSIPPEEQ 123
184 pattern 120                         ****
185             IFT D  +AD LDD F   IN + PEEQ
186 Sbjct:  170 IFTGDDELADELDDRFVIDINKLFPEEQ 197
189 >sp|Q49605|MCRA_METKA METHYL-COENZYME M REDUCTASE I ALPHA SUBUNIT (MCR I ALPHA)
190           Length = 553
192  Score = 11.2 bits (35), Expect = 0.43
193  Identities = 14/28 (50%), Positives = 18/28 (64%), Gaps = 3/28 (10%)
195 Query:  99  IFTDDLPVADYLDDEFINSIP---PEEQ 123
196 pattern 120                         ****
197             I T DL +AD +DD+F+  I    PEEQ
198 Sbjct:  168 IITGDLELADEIDDKFLIDIEKLFPEEQ 195
201 >sp|P81901|FER_PYRIS FERREDOXIN (SEVEN-IRON FERREDOXIN)
202           Length = 101
204  Score = 10.9 bits (34), Expect = 0.55
205  Identities = 12/23 (52%), Positives = 16/23 (69%), Gaps = 1/23 (4%)
207 Query:  114 FINSIPPEEQTAF-DWRTRGAVT 135
208 pattern 120       ****
209             F  S+ PEEQ AF +W+TR  +T
210 Sbjct:  78  FGKSLTPEEQRAFEEWKTRYGIT 100
213 >sp|Q58256|MCRX_METJA METHYL-COENZYME M REDUCTASE II ALPHA SUBUNIT (MCR II ALPHA)
214           Length = 553
216  Score =  9.8 bits (31), Expect = 1.1
217  Identities = 14/28 (50%), Positives = 17/28 (60%), Gaps = 3/28 (10%)
219 Query:  99  IFTDDLPVADYLDDEF---INSIPPEEQ 123
220 pattern 120                         ****
221             IFT D  +AD +D  F   IN + PEEQ
222 Sbjct:  168 IFTGDDELADEIDKRFLIDINKLFPEEQ 195
225 >sp|P53203|YG14_YEAST HYPOTHETICAL 52.9 KD PROTEIN IN ERP6-TFG2 INTERGENIC REGION
226           Length = 462
228  Score =  8.5 bits (27), Expect = 3.0
229  Identities = 13/39 (33%), Positives = 21/39 (53%), Gaps = 9/39 (23%)
231 Query:  112 DEFINSIP-------PEEQT--AFDWRTRGAVTPVKNQG 141
232 pattern 120                ****
233             DEF+N+ P       PEEQ+  A++W  +  +  + N G
234 Sbjct:  308 DEFLNTSPSPEVFTLPEEQSGMAWEWHDKDWMLDLTNDG 346
237 >sp|P55002|MGP1_MOUSE MICROFIBRIL-ASSOCIATED GLYCOPROTEIN PRECURSOR (MAGP) (MAGP-1)
238           Length = 183
240  Score =  7.4 bits (24), Expect = 6.0
241  Identities = 11/37 (29%), Positives = 18/37 (47%)
243 Query:  100 FTDDLPVADYLDDEFINSIPPEEQTAFDWRTRGAVTP 136
244 pattern 120                     ****
245             + D +  ADY D + ++   PEEQ     + +  V P
246 Sbjct:  37  YGDQIDNADYYDYQEVSPRTPEEQFQSQQQVQQEVIP 73
249 >sp|Q06234|ASH1_XENLA ACHAETE-SCUTE HOMOLOG 1
250           Length = 199
252  Score =  7.1 bits (23), Expect = 7.6
253  Identities = 11/27 (40%), Positives = 15/27 (54%), Gaps = 1/27 (3%)
255 Query:  105 PVADYLDDE-FINSIPPEEQTAFDWRT 130
256 pattern 120                 ****
257             PV+ Y  DE   + + PEEQ   D+ T
258 Sbjct:  171 PVSSYSSDEGSYDPLSPEEQELLDFTT 197
261 >sp|P20918|PLMN_MOUSE PLASMINOGEN PRECURSOR [CONTAINS: ANGIOSTATIN]
262           Length = 812
264  Score =  7.1 bits (23), Expect = 7.6
265  Identities = 8/13 (61%), Positives = 11/13 (84%)
267 Query:  112 DEFINSIPPEEQT 124
268 pattern 120         ****
269             D+  +S+PPEEQT
270 Sbjct:  359 DQSDSSVPPEEQT 371
274 Significant alignments for pattern occurrence 3 at position 237
276 >sp|P49362|GCSB_FLAPR GLYCINE DEHYDROGENASE [DECARBOXYLATING] B, MITOCHONDRIAL PRECURSOR
277             (GLYCINE DECARBOXYLASE B) (GLYCINE CLEAVAGE SYSTEM
278             P-PROTEIN B)
279           Length = 1034
281  Score =  9.5 bits (30), Expect = 1.4
282  Identities = 21/79 (26%), Positives = 39/79 (48%), Gaps = 13/79 (16%)
284 Query:  231 NSANIGPEEQAKISNFTMIPKNETVMAGYIVSTGPLAIAADAVEWQFYIGGVFDIPCNPN 290
285 pattern 237       ****
286             NSA   PEEQ K++ F   P  +++    I +T P +I  D++++  +  G+ +     +
287 Sbjct:  80  NSAT--PEEQTKMAEFVGFPNLDSL----IDATVPKSIRLDSMKYSKFDEGLTESQMIAH 133
289 Query:  291 SLDHGILIVGYSAKNTIFR 309
290               D        ++KN IF+
291 Sbjct:  134 MQD-------LASKNKIFK 145
294 >sp|P49361|GCSA_FLAPR GLYCINE DEHYDROGENASE [DECARBOXYLATING] A, MITOCHONDRIAL PRECURSOR
295             (GLYCINE DECARBOXYLASE A) (GLYCINE CLEAVAGE SYSTEM
296             P-PROTEIN A)
297           Length = 1037
299  Score =  9.5 bits (30), Expect = 1.4
300  Identities = 21/79 (26%), Positives = 39/79 (48%), Gaps = 13/79 (16%)
302 Query:  231 NSANIGPEEQAKISNFTMIPKNETVMAGYIVSTGPLAIAADAVEWQFYIGGVFDIPCNPN 290
303 pattern 237       ****
304             NSA   PEEQ K++ F   P  +++    I +T P +I  D++++  +  G+ +     +
305 Sbjct:  83  NSAT--PEEQTKMAEFVGFPNLDSL----IDATVPKSIRLDSMKYSKFDEGLTESQMIAH 136
307 Query:  291 SLDHGILIVGYSAKNTIFR 309
308               D        ++KN IF+
309 Sbjct:  137 MQD-------LASKNKIFK 148
312 >sp|O49852|GCSP_FLATR GLYCINE DEHYDROGENASE [DECARBOXYLATING], MITOCHONDRIAL PRECURSOR
313             (GLYCINE DECARBOXYLASE) (GLYCINE CLEAVAGE SYSTEM
314             P-PROTEIN)
315           Length = 1034
317  Score =  7.8 bits (25), Expect = 4.8
318  Identities = 21/79 (26%), Positives = 38/79 (47%), Gaps = 13/79 (16%)
320 Query:  231 NSANIGPEEQAKISNFTMIPKNETVMAGYIVSTGPLAIAADAVEWQFYIGGVFDIPCNPN 290
321 pattern 237       ****
322             NSA   PEEQ K++ F      +++    I +T P AI  D++++  +  G+ +     +
323 Sbjct:  80  NSAT--PEEQTKMAEFVGFSNLDSL----IDATVPKAIRLDSMKYSKFDEGLTESQMIAH 133
325 Query:  291 SLDHGILIVGYSAKNTIFR 309
326               D        ++KN IF+
327 Sbjct:  134 MQD-------LASKNKIFK 145
330 >sp|P32767|PDR6_YEAST PLEIOTROPIC DRUG RESISTANCE REGULATORY PROTEIN 6
331           Length = 1081
333  Score =  7.4 bits (24), Expect = 6.0
334  Identities = 25/93 (26%), Positives = 37/93 (38%), Gaps = 17/93 (18%)
336 Query:  159 HFISQNKLVSLSEQNLVDCDHECMEYEGEEACDEGCNGGLQPNAYNYI-IKNGGIQTESS 217
337             +F S+N+   +S   L     E M  +      E C   L P   ++I   N  I  +S+
338 Sbjct:  642 NFTSKNEQEKISNDKL-----EVMVIKTVSTLCETCREELTPYLMHFISFLNTVIMPDSN 696
340 Query:  218 YPYTAETG--------TQCNFNSANIGPEEQAK 242
341 pattern 237                            ****
342               +   T          QC  ++   GPEEQAK
343 Sbjct:  697 VSHFTRTKLVRSIGYVVQCQVSN---GPEEQAK 726
346 >sp|O49850|GCSP_FLAAN GLYCINE DEHYDROGENASE [DECARBOXYLATING], MITOCHONDRIAL PRECURSOR
347             (GLYCINE DECARBOXYLASE) (GLYCINE CLEAVAGE SYSTEM
348             P-PROTEIN)
349           Length = 1034
351  Score =  6.8 bits (22), Expect = 9.6
352  Identities = 20/79 (25%), Positives = 38/79 (47%), Gaps = 13/79 (16%)
354 Query:  231 NSANIGPEEQAKISNFTMIPKNETVMAGYIVSTGPLAIAADAVEWQFYIGGVFDIPCNPN 290
355 pattern 237       ****
356             NSA   PEEQ K++ F      +++    I +T P +I  D++++  +  G+ +     +
357 Sbjct:  80  NSAT--PEEQTKMAEFVGFSNLDSL----IDATVPKSIRLDSMKYSKFDEGLTESQMIAH 133
359 Query:  291 SLDHGILIVGYSAKNTIFR 309
360               D        ++KN IF+
361 Sbjct:  134 MQD-------LASKNKIFK 145
364   Database: /home/peter/blast/data/swissprot
365     Posted date:  Oct 10, 2000 10:43 AM
366   Number of letters in database: 31,984,247
367   Number of sequences in database:  88,780
368   
369 Lambda     K      H      C
370    0.270   0.0470    0.230    0.500 
373 Matrix: BLOSUM62
374 Gap Penalties: Existence: 11, Extension: 1
375 Number of Hits to DB: 1047
376 Number of Sequences: 88780
377 Number of extensions: 1047
378 Number of successful extensions: 36
379 Number of sequences better than 10.0: 36
380 Number of HSP's better than 10.0 without gapping: 0
381 Number of HSP's successfully gapped in prelim test: 0
382 Number of HSP's that attempted gapping in prelim test: 0
383 Number of HSP's gapped (non-prelim): 0
384 length of query: 351
385 length of database: 31,984,247
386 effective HSP length: 50
387 effective length of query: 301
388 effective length of database: 27,545,247
389 effective search space: 8291119347
390 effective search space used: 8291119347
391 T: 11
392 A: 40
393 X1: 16 ( 7.3 bits)
394 X2: 38 (14.8 bits)
395 X3: 64 (24.9 bits)
396 S1: 41 (21.6 bits)
397 S2: 65 (29.7 bits)