sync with trunk to r15684
[bioperl-live.git] / t / data / a_thaliana.blastn
blob10fb91f9a397fd9cfa7e15495f165b38b28b011d
1 BLASTN 2.2.1 [Apr-13-2001]
3 Reference: Altschul, Stephen F., Thomas L. Madden, Alejandro A. Schaffer, 
4 Jinghui Zhang, Zheng Zhang, Webb Miller, and David J. Lipman (1997), 
5 "Gapped BLAST and PSI-BLAST: a new generation of protein database search
6 programs",  Nucleic Acids Res. 25:3389-3402.
7 RID: 1012577175-3730-28291
8 Query= 
9          (60 letters)
11 Database: All GenBank+EMBL+DDBJ+PDB sequences (but no EST, STS, GSS,
12 or phase 0, 1 or 2 HTGS sequences) 
13            1,083,200 sequences; 4,677,375,331 total letters
18                                                                  Score    E
19 Sequences producing significant alignments:                      (bits) Value
21 gb|AY052359.1| Arabidopsis thaliana At2g17400 mRNA, complete cds       96   3e-18
22 gb|AC002329.2|AC002329 Arabidopsis thaliana chromosome II sectio...    96   3e-18
23 gb|AF132318.1|AF132318 Buchnera aphidicola phosphoribosyl anthra...    42   0.040
24 gb|AC024791.1| Caenorhabditis elegans cosmid Y47G6A, complete se...    36   2.5  
25 gb|AC017078.8| Homo sapiens BAC clone RP11-457N9 from 2, complet...    36   2.5  
26 gb|AC005046.3|AC005046 Homo sapiens BAC clone CTB-13F3 from 7q22...    36   2.5  
27 gb|AC006017.2|AC006017 Homo sapiens PAC clone RP5-981O7 from 7q3...    36   2.5  
28 dbj|AP001519.1|AP001519 Bacillus halodurans genomic DNA, section...    36   2.5  
29 gb|AC095064.3| Homo sapiens chromosome 4 clone RP11-620C21, comp...    34   9.7  
30 gb|AC003029.3| Homo sapiens Chromosome 12q24 PAC RP3-462E2 (Rosw...    34   9.7  
31 gb|AC079248.5| Homo sapiens BAC clone RP11-24J11 from 2, complet...    34   9.7  
32 gb|AC093865.2| Homo sapiens chromosome 2 clone RP11-560C24, comp...    34   9.7  
33 gb|AC010202.6|AC010202 Homo sapiens 12q BAC RP11-210L7 (Roswell ...    34   9.7  
34 gb|AC017118.3|AC017118 Genomic sequence for Arabidopsis thaliana...    34   9.7  
35 emb|AL355520.8|AL355520 Human DNA sequence from clone RP4-595C2 ...    34   9.7  
36 emb|AL137879.15|AL137879 Human DNA sequence from clone RP11-153O...    34   9.7  
37 gb|AC006395.1|AC006395 Homo sapiens PAC clone RP3-394H4 from Xq2...    34   9.7  
38 gb|AE000650.1|AE000650 Helicobacter pylori 26695 section 128 of ...    34   9.7  
39 gb|AC006924.3|AC006924 Homo sapiens, clone hRPK.32_A_1, complete...    34   9.7  
40 gb|AC006266.1|AC006266 Arabidopsis thaliana BAC F1K3 from chromo...    34   9.7  
41 gb|U32797.1|U32797 Haemophilus influenzae Rd section 112 of 163 ...    34   9.7  
42 emb|AJ286341.1|HIM286341 Human immunodeficiency virus type 1 pro...    34   9.7  
43 emb|AL161561.2|ATCHRIV61 Arabidopsis thaliana DNA chromosome 4, ...    34   9.7  
44 emb|AL161508.2|ATCHRIV20 Arabidopsis thaliana DNA chromosome 4, ...    34   9.7  
45 emb|AL035356.1|ATF22K18 Arabidopsis thaliana DNA chromosome 4, B...    34   9.7  
46 emb|AJ132676.1|MMU132676 Mus musculus IgVk gh33r pseudogene            34   9.7  
47 emb|AJ132673.1|MMU132673 Mus musculus IgVk gd33r pseudogene            34   9.7  
48 emb|AJ132672.1|MMU132672 Mus musculus IgVk gc33r pseudogene            34   9.7  
49 emb|Z74955.1|SCYOR047C S.cerevisiae chromosome XV reading frame ...    34   9.7  
50 emb|Z74954.1|SCYOR046C S.cerevisiae chromosome XV reading frame ...    34   9.7  
51 gb|U28135.1|SCU28135 Saccharomyces cerevisiae DEAD-Box Protein 5...    34   9.7  
53 ALIGNMENTS
54 >gb|AY052359.1| Arabidopsis thaliana At2g17400 mRNA, complete cds
55           Length = 2826
57  Score = 95.6 bits (48), Expect = 3e-18
58  Identities = 58/60 (96%), Gaps = 1/60 (1%)
59  Strand = Plus / Plus
61                                                                        
62 Query: 1   aggaatgctgtttaattggaatcgtacaatggagaatttgacggaaatagaatcaacgat 60
63            |||||||||||||||||||||||  |||||||||||||||||||||||||||||||||||
64 Sbjct: 154 aggaatgctgtttaattggaatca-acaatggagaatttgacggaaatagaatcaacgat 212
67 >gb|AC002329.2|AC002329 Arabidopsis thaliana chromosome II section 100 of 255 of the complete
68              sequence. Sequence from clones T23A1, F5J6, MJB20
69           Length = 76170
71  Score = 95.6 bits (48), Expect = 3e-18
72  Identities = 58/60 (96%), Gaps = 1/60 (1%)
73  Strand = Plus / Plus
75                                                                          
76 Query: 1     aggaatgctgtttaattggaatcgtacaatggagaatttgacggaaatagaatcaacgat 60
77              |||||||||||||||||||||||  |||||||||||||||||||||||||||||||||||
78 Sbjct: 60659 aggaatgctgtttaattggaatca-acaatggagaatttgacggaaatagaatcaacgat 60717
81 >gb|AF132318.1|AF132318 Buchnera aphidicola phosphoribosyl anthranilate transferase (trpD),
82            phosphoribosyl anthranilate isomerase/indoleglycerol
83            phosphate synthetase fusion (trpC/F), beta subunit of
84            tryptophan synthetase (trpB), and alpha subunit of
85            tryptophan synthetase (trp>
86           Length = 5383
88  Score = 42.1 bits (21), Expect = 0.040
89  Identities = 21/21 (100%)
90  Strand = Plus / Plus
92                                 
93 Query: 35  aatttgacggaaatagaatca 55
94            |||||||||||||||||||||
95 Sbjct: 536 aatttgacggaaatagaatca 556
98 >gb|AC024791.1| Caenorhabditis elegans cosmid Y47G6A, complete sequence
99           Length = 194322
101  Score = 36.2 bits (18), Expect = 2.5
102  Identities = 18/18 (100%)
103  Strand = Plus / Minus
105                                 
106 Query: 34     gaatttgacggaaataga 51
107               ||||||||||||||||||
108 Sbjct: 193876 gaatttgacggaaataga 193859
111 >gb|AC017078.8| Homo sapiens BAC clone RP11-457N9 from 2, complete sequence
112           Length = 193979
114  Score = 36.2 bits (18), Expect = 2.5
115  Identities = 24/26 (92%)
116  Strand = Plus / Plus
118                                         
119 Query: 3      gaatgctgtttaattggaatcgtaca 28
120               ||||| ||||||| ||||||||||||
121 Sbjct: 142900 gaatgttgtttaaatggaatcgtaca 142925
124 >gb|AC005046.3|AC005046 Homo sapiens BAC clone CTB-13F3 from 7q22, complete sequence
125           Length = 219436
127  Score = 36.2 bits (18), Expect = 2.5
128  Identities = 18/18 (100%)
129  Strand = Plus / Plus
131                                
132 Query: 13    taattggaatcgtacaat 30
133              ||||||||||||||||||
134 Sbjct: 46649 taattggaatcgtacaat 46666
137 >gb|AC006017.2|AC006017 Homo sapiens PAC clone RP5-981O7 from 7q34-q36, complete sequence
138           Length = 162556
140  Score = 36.2 bits (18), Expect = 2.5
141  Identities = 18/18 (100%)
142  Strand = Plus / Minus
144                                 
145 Query: 13     taattggaatcgtacaat 30
146               ||||||||||||||||||
147 Sbjct: 114940 taattggaatcgtacaat 114923
150 >dbj|AP001519.1|AP001519 Bacillus halodurans genomic DNA, section 13/14
151           Length = 303650
153  Score = 36.2 bits (18), Expect = 2.5
154  Identities = 18/18 (100%)
155  Strand = Plus / Minus
157                                
158 Query: 30    tggagaatttgacggaaa 47
159              ||||||||||||||||||
160 Sbjct: 28875 tggagaatttgacggaaa 28858
163 >gb|AC095064.3| Homo sapiens chromosome 4 clone RP11-620C21, complete sequence
164           Length = 87943
166  Score = 34.2 bits (17), Expect = 9.7
167  Identities = 17/17 (100%)
168  Strand = Plus / Plus
170                               
171 Query: 12    ttaattggaatcgtaca 28
172              |||||||||||||||||
173 Sbjct: 42346 ttaattggaatcgtaca 42362
176 >gb|AC003029.3| Homo sapiens Chromosome 12q24 PAC RP3-462E2 (Roswell Park Cancer
177              Institute Human PAC library) complete sequence
178           Length = 137830
180  Score = 34.2 bits (17), Expect = 9.7
181  Identities = 17/17 (100%)
182  Strand = Plus / Plus
184                               
185 Query: 24    gtacaatggagaatttg 40
186              |||||||||||||||||
187 Sbjct: 71491 gtacaatggagaatttg 71507
190 >gb|AC079248.5| Homo sapiens BAC clone RP11-24J11 from 2, complete sequence
191           Length = 128535
193  Score = 34.2 bits (17), Expect = 9.7
194  Identities = 17/17 (100%)
195  Strand = Plus / Minus
197                                
198 Query: 6      tgctgtttaattggaat 22
199               |||||||||||||||||
200 Sbjct: 111999 tgctgtttaattggaat 111983
203 >gb|AC093865.2| Homo sapiens chromosome 2 clone RP11-560C24, complete sequence
204           Length = 186218
206  Score = 34.2 bits (17), Expect = 9.7
207  Identities = 17/17 (100%)
208  Strand = Plus / Plus
210                                
211 Query: 5      atgctgtttaattggaa 21
212               |||||||||||||||||
213 Sbjct: 113514 atgctgtttaattggaa 113530
216 >gb|AC010202.6|AC010202 Homo sapiens 12q BAC RP11-210L7 (Roswell Park Cancer Institute Human
217              BAC Library) complete sequence
218           Length = 170004
220  Score = 34.2 bits (17), Expect = 9.7
221  Identities = 17/17 (100%)
222  Strand = Plus / Plus
224                               
225 Query: 4     aatgctgtttaattgga 20
226              |||||||||||||||||
227 Sbjct: 95294 aatgctgtttaattgga 95310
230 >gb|AC017118.3|AC017118 Genomic sequence for Arabidopsis thaliana BAC F6N18 from chromosome I,
231              complete sequence
232           Length = 92219
234  Score = 34.2 bits (17), Expect = 9.7
235  Identities = 17/17 (100%)
236  Strand = Plus / Plus
238                               
239 Query: 14    aattggaatcgtacaat 30
240              |||||||||||||||||
241 Sbjct: 84400 aattggaatcgtacaat 84416
244 >emb|AL355520.8|AL355520 Human DNA sequence from clone RP4-595C2 on chromosome 1q24.1-25.3
245              Contains ESTs, STSs and GSSs. Contains the 3' part of the
246              gene for two isoforms of the KIAA0351 protein and the gene
247              for angiopoietin Y1, complete sequence [Homo sapiens]
248           Length = 157575
250  Score = 34.2 bits (17), Expect = 9.7
251  Identities = 17/17 (100%)
252  Strand = Plus / Plus
254                               
255 Query: 5     atgctgtttaattggaa 21
256              |||||||||||||||||
257 Sbjct: 80465 atgctgtttaattggaa 80481
260 >emb|AL137879.15|AL137879 Human DNA sequence from clone RP11-153O23 on chromosome 13, complete
261              sequence [Homo sapiens]
262           Length = 85149
264  Score = 34.2 bits (17), Expect = 9.7
265  Identities = 17/17 (100%)
266  Strand = Plus / Plus
268                               
269 Query: 25    tacaatggagaatttga 41
270              |||||||||||||||||
271 Sbjct: 41783 tacaatggagaatttga 41799
274 >gb|AC006395.1|AC006395 Homo sapiens PAC clone RP3-394H4 from Xq23, complete sequence
275           Length = 72291
277  Score = 34.2 bits (17), Expect = 9.7
278  Identities = 17/17 (100%)
279  Strand = Plus / Plus
281                               
282 Query: 1     aggaatgctgtttaatt 17
283              |||||||||||||||||
284 Sbjct: 40047 aggaatgctgtttaatt 40063
287 >gb|AE000650.1|AE000650 Helicobacter pylori 26695 section 128 of 134 of the complete genome
288           Length = 11043
290  Score = 34.2 bits (17), Expect = 9.7
291  Identities = 17/17 (100%)
292  Strand = Plus / Minus
294                              
295 Query: 36   atttgacggaaatagaa 52
296             |||||||||||||||||
297 Sbjct: 1772 atttgacggaaatagaa 1756
300 >gb|AC006924.3|AC006924 Homo sapiens, clone hRPK.32_A_1, complete sequence
301           Length = 165633
303  Score = 34.2 bits (17), Expect = 9.7
304  Identities = 17/17 (100%)
305  Strand = Plus / Minus
307                               
308 Query: 4     aatgctgtttaattgga 20
309              |||||||||||||||||
310 Sbjct: 11360 aatgctgtttaattgga 11344
313 >gb|AC006266.1|AC006266 Arabidopsis thaliana BAC F1K3 from chromosome IV near 21 cM, complete
314              sequence
315           Length = 105680
317  Score = 34.2 bits (17), Expect = 9.7
318  Identities = 20/21 (95%)
319  Strand = Plus / Minus
321                                   
322 Query: 20    aatcgtacaatggagaatttg 40
323              ||||||||||||||| |||||
324 Sbjct: 52077 aatcgtacaatggagtatttg 52057
327 >gb|U32797.1|U32797 Haemophilus influenzae Rd section 112 of 163 of the complete genome
328           Length = 10274
330  Score = 34.2 bits (17), Expect = 9.7
331  Identities = 17/17 (100%)
332  Strand = Plus / Minus
334                              
335 Query: 26   acaatggagaatttgac 42
336             |||||||||||||||||
337 Sbjct: 2447 acaatggagaatttgac 2431
340 >emb|AJ286341.1|HIM286341 Human immunodeficiency virus type 1 proviral env gene for gp160,
341             genomic RNA, isolate M2424/4, clone 1
342           Length = 2586
344  Score = 34.2 bits (17), Expect = 9.7
345  Identities = 20/21 (95%)
346  Strand = Plus / Plus
348                                  
349 Query: 7    gctgtttaattggaatcgtac 27
350             |||||||||||||||| ||||
351 Sbjct: 1176 gctgtttaattggaatagtac 1196
354 >emb|AL161561.2|ATCHRIV61 Arabidopsis thaliana DNA chromosome 4, contig fragment No. 61
355           Length = 198402
357  Score = 34.2 bits (17), Expect = 9.7
358  Identities = 17/17 (100%)
359  Strand = Plus / Plus
361                                
362 Query: 44     gaaatagaatcaacgat 60
363               |||||||||||||||||
364 Sbjct: 146009 gaaatagaatcaacgat 146025
367 >emb|AL161508.2|ATCHRIV20 Arabidopsis thaliana DNA chromosome 4, contig fragment No. 20
368           Length = 196517
370  Score = 34.2 bits (17), Expect = 9.7
371  Identities = 20/21 (95%)
372  Strand = Plus / Minus
374                                    
375 Query: 20     aatcgtacaatggagaatttg 40
376               ||||||||||||||| |||||
377 Sbjct: 180658 aatcgtacaatggagtatttg 180638
380 >emb|AL035356.1|ATF22K18 Arabidopsis thaliana DNA chromosome 4, BAC clone  F22K18 (ESSAII project)
381           Length = 125803
383  Score = 34.2 bits (17), Expect = 9.7
384  Identities = 17/17 (100%)
385  Strand = Plus / Minus
387                                
388 Query: 44     gaaatagaatcaacgat 60
389               |||||||||||||||||
390 Sbjct: 102901 gaaatagaatcaacgat 102885
393 >emb|AJ132676.1|MMU132676 Mus musculus IgVk gh33r pseudogene
394           Length = 737
396  Score = 34.2 bits (17), Expect = 9.7
397  Identities = 17/17 (100%)
398  Strand = Plus / Minus
400                             
401 Query: 13  taattggaatcgtacaa 29
402            |||||||||||||||||
403 Sbjct: 317 taattggaatcgtacaa 301
406 >emb|AJ132673.1|MMU132673 Mus musculus IgVk gd33r pseudogene
407           Length = 813
409  Score = 34.2 bits (17), Expect = 9.7
410  Identities = 17/17 (100%)
411  Strand = Plus / Minus
413                             
414 Query: 13  taattggaatcgtacaa 29
415            |||||||||||||||||
416 Sbjct: 318 taattggaatcgtacaa 302
419 >emb|AJ132672.1|MMU132672 Mus musculus IgVk gc33r pseudogene
420           Length = 736
422  Score = 34.2 bits (17), Expect = 9.7
423  Identities = 17/17 (100%)
424  Strand = Plus / Minus
426                             
427 Query: 13  taattggaatcgtacaa 29
428            |||||||||||||||||
429 Sbjct: 318 taattggaatcgtacaa 302
432 >emb|Z74955.1|SCYOR047C S.cerevisiae chromosome XV reading frame ORF YOR047c
433           Length = 3461
435  Score = 34.2 bits (17), Expect = 9.7
436  Identities = 17/17 (100%)
437  Strand = Plus / Plus
439                             
440 Query: 24  gtacaatggagaatttg 40
441            |||||||||||||||||
442 Sbjct: 473 gtacaatggagaatttg 489
445 >emb|Z74954.1|SCYOR046C S.cerevisiae chromosome XV reading frame ORF YOR046c
446           Length = 2310
448  Score = 34.2 bits (17), Expect = 9.7
449  Identities = 17/17 (100%)
450  Strand = Plus / Plus
452                              
453 Query: 24   gtacaatggagaatttg 40
454             |||||||||||||||||
455 Sbjct: 1605 gtacaatggagaatttg 1621
458 >gb|U28135.1|SCU28135 Saccharomyces cerevisiae DEAD-Box Protein 5 (DBP5) gene, complete cds
459           Length = 3696
461  Score = 34.2 bits (17), Expect = 9.7
462  Identities = 17/17 (100%)
463  Strand = Plus / Minus
465                              
466 Query: 24   gtacaatggagaatttg 40
467             |||||||||||||||||
468 Sbjct: 1212 gtacaatggagaatttg 1196
471   Database: All GenBank+EMBL+DDBJ+PDB sequences (but no EST, STS, GSS,
472   or phase 0, 1 or 2 HTGS sequences)
473     Posted date:  Jan 31, 2002 11:56 PM
474   Number of letters in database: 382,408,035
475   Number of sequences in database:  1,083,200
476   
477 Lambda     K      H
478     1.37    0.711     1.31 
480 Gapped
481 Lambda     K      H
482     1.37    0.711     1.31 
485 Matrix: blastn matrix:1 -3
486 Gap Penalties: Existence: 5, Extension: 2
487 Number of Hits to DB: 117,267
488 Number of Sequences: 1083200
489 Number of extensions: 117267
490 Number of successful extensions: 7699
491 Number of sequences better than 10.0: 31
492 length of query: 60
493 length of database: 4,677,375,331
494 effective HSP length: 19
495 effective length of query: 41
496 effective length of database: 4,656,794,531
497 effective search space: 190928575771
498 effective search space used: 190928575771
499 T: 0
500 A: 30
501 X1: 6 (11.9 bits)
502 X2: 15 (29.7 bits)
503 S1: 12 (24.3 bits)
504 S2: 17 (34.2 bits)