tag fourth (and hopefully last) alpha
[bioperl-live.git] / branch-1-6 / t / data / dnaEbsub_ecoli.wutblastx
blobe14461f71ca9083399d4ea0851bd4142aa4850a8
1 TBLASTX 2.0MP-WashU [12-Feb-2001] [linux-i686 01:36:08 31-Jan-2001]
3 Copyright (C) 1996-2000 Washington University, Saint Louis, Missouri USA.
4 All Rights Reserved.
6 Reference:  Gish, W. (1996-2000) http://blast.wustl.edu
8 Notice:  statistical significance is estimated under the assumption that the
9 equivalent of one entire reading frame of the query sequence and one entire
10 reading frame of the database code for protein and that significant alignments
11 will only involve coding reading frames.
13 Query=  gi|142864|gb|M10040.1|BACDNAE B.subtilis dnaE gene encoding DNA
14     primase, complete cds
15         (2001 letters)
17   Translating both strands of query sequence in all 6 reading frames
19 Database:  ecoli.nt
20            400 sequences; 4,662,239 total letters.
21 Searching....10....20....30....40....50....60....70....80....90....100% done
23                                                                      Smallest
24                                                                        Sum
25                                                      Reading  High  Probability
26 Sequences producing High-scoring Segment Pairs:        Frame Score  P(N)      N
28 gi|1789441|gb|AE000388.1|AE000388 Escherichia coli K-1... +2   318  6.4e-70   5
29 gi|2367383|gb|AE000509.1|AE000509 Escherichia coli K-1... -3    59  0.9992    2
33 >gi|1789441|gb|AE000388.1|AE000388 Escherichia coli K-12 MG1655 section 278 of
34             400 of the complete genome
35         Length = 10,334
37   Plus Strand HSPs:
39  Score = 318 (148.6 bits), Expect = 6.4e-70, Sum P(5) = 6.4e-70
40  Identities = 57/127 (44%), Positives = 81/127 (63%), Frame = +3 / +2
42 Query:   618 FDRFRNRVMFPIHDHHGAVVAFSGRALGSQQPKYMNSPETPLFHKSKLLYNFYKARLHIR 797
43              +DRFR RVMFPI D  G V+ F GR LG+  PKY+NSPET +FHK + LY  Y+A+    
44 Sbjct:  5366 YDRFRERVMFPIRDKRGRVIGFGGRVLGNDTPKYLNSPETDIFHKGRQLYGLYEAQQDNA 5545
46 Query:   798 KQERAVLFEGFADVYTAVSSDVKESIATMGTSLTDDHVKILRRNVEEIILCYDSDKAGYE 977
47              +  R ++ EG+ DV       +  ++A++GTS T DH+++L R    +I CYD D+AG +
48 Sbjct:  5546 EPNRLLVVEGYMDVVALAQYGINYAVASLGTSTTADHIQLLFRATNNVICCYDGDRAGRD 5725
50 Query:   978 ATLKASE 998
51              A  +A E
52 Sbjct:  5726 AAWRALE 5746
54  Score = 247 (116.1 bits), Expect = 6.4e-70, Sum P(5) = 6.4e-70
55  Identities = 44/98 (44%), Positives = 61/98 (62%), Frame = +3 / +2
57 Query:    21 MGNRIPDEIVDQVQKSADIVEVIGDYVQLKKQGRNYFGLCPFHGESTPSFSVSPDKQIFH 200
58              M  RIP   ++ +    DIV++I   V+LKKQG+N+   CPFH E TPSF+V+ +KQ +H
59 Sbjct:  4778 MAGRIPRVFINDLLARTDIVDLIDARVKLKKQGKNFHACCPFHNEKTPSFTVNGEKQFYH 4957
61 Query:   201 CFGCGAGGNVFSFLRQMEGYSFAESVSHLADKYQIDFP 314
62              CFGCGA GN   FL   +   F E+V  LA  + ++ P
63 Sbjct:  4958 CFGCGAHGNAIDFLMNYDKLEFVETVEELAAMHNLEVP 5071
65  Score = 85 (41.8 bits), Expect = 6.4e-70, Sum P(5) = 6.4e-70
66  Identities = 19/59 (32%), Positives = 28/59 (47%), Frame = +3 / +2
68 Query:   441 ALDYLLSRGFTKELINEFQIGYALDSWDFITKFLVKRGFSEAQMEKAGLLIRREDGSGY 617
69              A  YL  RG + E+I  F IG+A   WD + K       +   +  AG+L+  + G  Y
70 Sbjct:  5192 ARQYLEKRGLSHEVIARFAIGFAPPGWDNVLKRFGGNPENRQSLIDAGMLVTNDQGRSY 5368
72  Score = 65 (32.7 bits), Expect = 6.4e-70, Sum P(5) = 6.4e-70
73  Identities = 12/28 (42%), Positives = 18/28 (64%), Frame = +3 / +2
75 Query:  1014 GCKVRVAMIPDGLDPDDYIKKFGGEKFK 1097
76              G ++R   +PDG DPD  ++K G E F+
77 Sbjct:  5771 GRQLRFMFLPDGEDPDTLVRKEGKEAFE 5854
79  Score = 48 (24.9 bits), Expect = 0.89, Sum P(4) = 0.59
80  Identities = 15/49 (30%), Positives = 21/49 (42%), Frame = +3 / +2
82 Query:   639 VMFPIHDHHGAVVAFSGRALGSQQPKYMNSPETPLFHKSKLLYNFYKAR 785
83              V F  HD    V A   R+  +  P Y     T LFH+ K    F++ +
84 Sbjct:  4046 VRFYAHDRGRPVQARRRRSQRAISPDYTIGWLTNLFHRRKWRCRFHRRK 4192
86  Score = 46 (24.0 bits), Expect = 1.5, Sum P(4) = 0.78
87  Identities = 8/17 (47%), Positives = 10/17 (58%), Frame = +3 / +2
89 Query:   150 GESTPSFSVSPDKQIFH 200
90              G  TP +  SP+  IFH
91 Sbjct:  5447 GNDTPKYLNSPETDIFH 5497
93  Score = 42 (22.1 bits), Expect = 6.4e-70, Sum P(5) = 6.4e-70
94  Identities = 6/16 (37%), Positives = 10/16 (62%), Frame = +1 / +2
96 Query:  1129 WRSKCNISEKERTCPM 1176
97              W S   + +K+R CP+
98 Sbjct:  7151 WNSTIVLKQKKRVCPI 7198
100  Score = 42 (22.1 bits), Expect = 2.0e-42, Sum P(5) = 2.0e-42
101  Identities = 6/18 (33%), Positives = 14/18 (77%), Frame = +3 / +2
103 Query:    21 MGNRIPDEIVDQVQKSAD 74
104              +  R+PD++VD++++  D
105 Sbjct:   206 ISTRMPDDVVDKLKQLKD 259
107   Minus Strand HSPs:
109  Score = 102 (49.6 bits), Expect = 4.9e-08, Sum P(3) = 4.9e-08
110  Identities = 32/83 (38%), Positives = 42/83 (50%), Frame = -3 / -3
112 Query:   319 SSGKSIWYLSAR*ETDSAKE*PSICLKKEKTLPPAPQPKQ*KICLSGDTENEGVLSP*KG 140
113              S+G S   ++A   T S     S  ++K   LP AP PKQ   C S  T  +GV S   G
114 Sbjct:  5076 SNGTSRLCIAASSSTVSTNSSLS*FIRKSIALPCAPHPKQW*NCFSPLTVKDGVFSLWNG 4897
116 Query:   139 QSPK*FRPCFFN*T*SPMTSTIS 71
117              Q    F PCFF+ T + + ST+S
118 Sbjct:  4896 QHAWKFLPCFFSFTRASIRSTMS 4828
120  Score = 71 (35.4 bits), Expect = 4.9e-08, Sum P(3) = 4.9e-08
121  Identities = 18/35 (51%), Positives = 20/35 (57%), Frame = -3 / -3
123 Query:   724 FIYLGCWLPRALPEKATTAP**SWIGNMTRFLKRS 620
124              F YLG  LP   P K  T P  S +GN+TR  KRS
125 Sbjct:  5472 FRYLGVSLPSTRPPKPITRPRLSRMGNITRSRKRS 5368
127  Score = 65 (32.7 bits), Expect = 0.0034, Sum P(3) = 0.0034
128  Identities = 18/71 (25%), Positives = 34/71 (47%), Frame = -2 / -2
130 Query:   233 ENIAARSAAKAMKNLFVGRYGKRRCAFSMKRTESKVVSALLL*LNIITYDFNDICRLLHL 54
131              + +A R+ +KA+  LF+   G+ R    ++ T    + ALL  L+      +D+     +
132 Sbjct:  4990 DRVAVRATSKAVVKLFLTVNGEGRGFLVVEWTTRVEILALLFQLHTGIDQIDDVSACQQI 4811
134 Query:    53 IHNFIWYPISH 21
135              I+ + W   SH
136 Sbjct:  4810 INEYAWDSSSH 4778
138  Score = 42 (22.1 bits), Expect = 4.9e-08, Sum P(3) = 4.9e-08
139  Identities = 10/18 (55%), Positives = 12/18 (66%), Frame = -3 / -3
141 Query:  1093 NFSPPNFLM*SSGSNPSG 1040
142              N S P+F    SGS+PSG
143 Sbjct:  5850 NASLPSFRTSVSGSSPSG 5797
146 >gi|2367383|gb|AE000509.1|AE000509 Escherichia coli K-12 MG1655 section 399 of
147             400 of the complete genome
148         Length = 10,589
150   Minus Strand HSPs:
152  Score = 59 (29.9 bits), Expect = 7.1, Sum P(2) = 1.00
153  Identities = 15/40 (37%), Positives = 19/40 (47%), Frame = -3 / -3
155 Query:   706 WLPRALPEKATTAP**SWIGNMTRFLKRSKYPLPSSRLIR 587
156              WL R     +T +P   WI  M   L  SK  LPS++  R
157 Sbjct:  4227 WLSRTTVGSSTVSPRTFWITRMKVKLSSSKVTLPSTKSTR 4108
159  Score = 51 (26.3 bits), Expect = 7.1, Sum P(2) = 1.00
160  Identities = 8/15 (53%), Positives = 10/15 (66%), Frame = -3 / -1
162 Query:   382 CASAIFCSPEDSGRA 338
163              C S + C P+D GRA
164 Sbjct:  1097 CTSLMLCRPQDGGRA 1053
167 Parameters:
168   novalidctxok
169   nonnegok
170   gapall
171   Q=12
172   R=1
173   cpus=1
174   filter=seg
175   nogaps
176   matrix=blosum62
177   W=3
178   S2=41
179   gapS2=68
180   X=16
181   gapX=38
182   hitdist=40
183   gi
184   gapL=0.27
185   gapK=0.047
186   gapH=0.23
188   ctxfactor=36.0
189   E=10
191   Query                        -----  As Used  -----    -----  Computed  ----
192   Frame  MatID Matrix name     Lambda    K       H      Lambda    K       H
193    +3      0   blosum62        0.318   0.135   0.401    0.324   0.139   0.405  
194    +2      0   blosum62        0.318   0.135   0.401    0.365   0.163   0.618  
195    +1      0   blosum62        0.318   0.135   0.401    0.356   0.155   0.528  
196    -1      0   blosum62        0.318   0.135   0.401    0.350   0.155   0.543  
197    -2      0   blosum62        0.318   0.135   0.401    0.350   0.155   0.505  
198    -3      0   blosum62        0.318   0.135   0.401    0.358   0.157   0.543  
200   Query
201   Frame  MatID  Length  Eff.Length     E    S W   T  X   E2     S2
202    +3      0      666       666       10.  54 3  13 16  0.021   41
203    +2      0      666       666       10.  54 3  13 16  0.021   41
204    +1      0      667       667       10.  54 3  13 16  0.021   41
205    -1      0      667       667       10.  54 3  13 16  0.021   41
206    -2      0      666       666       10.  54 3  13 16  0.021   41
207    -3      0      666       666       10.  54 3  13 16  0.021   41
210 Statistics:
212   Database:  /home/jes12/db/ecoli.nt
213    Title:  ecoli.nt
214    Posted:  3:16:20 PM EST Nov 18, 2001
215    Created:  10:10:31 AM EST Nov 18, 2001
216    Format:  XDF-1
217    # of letters in database:  4,662,239
218    # of sequences in database:  400
219    # of database sequences satisfying E:  2
220   No. of states in DFA:  598 (64 KB)
221   Total size of DFA:  416 KB (1196 KB)
222   Time to generate neighborhood:  0.02u 0.02s 0.04t  Elapsed: 00:00:00
223   No. of threads or processors used:  1
224   Search cpu time:  2.41u 0.01s 2.42t  Elapsed: 00:00:05
225   Total cpu time:  2.44u 0.03s 2.47t  Elapsed: 00:00:07
226   Start:  Sat Apr 20 18:19:43 2002   End:  Sat Apr 20 18:19:50 2002