Add tests for memory leaks and weaken for Issue #81
[bioperl-live.git] / t / data / test.genbank
blobc3ea71d4a0a72d5b82d6727d62dd1b7e59571086
1 LOCUS       DDU63596      310 bp    DNA             INV       14-MAY-1999
2 DEFINITION  Dictyostelium discoideum Tdd-4 transposable element flanking
3             sequence, clone p427/428 right end.
4 ACCESSION   U63596
5 NID         g2393749
6 KEYWORDS    .
7 SOURCE      Dictyostelium discoideum.
8   ORGANISM  Dictyostelium discoideum
9             Eukaryota; Dictyosteliida; Dictyostelium.
10 REFERENCE   1  (bases 1 to 310)
11   AUTHORS   Wells,D.J.
12   TITLE     Tdd-4, a DNA transposon of Dictyostelium that encodes proteins
13             similar to LTR retroelement integrases
14   JOURNAL   Nucleic Acids Res. 27 (11), 2408-2415 (1999)
15 REFERENCE   2  (bases 1 to 310)
16   AUTHORS   Wells,D.J. and Welker,D.L.
17   TITLE     Dictyostelium discoideum Tdd-4 transposable element, right end
18             flanking sequence from clone p427/428
19   JOURNAL   Unpublished
20 REFERENCE   3  (bases 1 to 310)
21   AUTHORS   Wells,D.J. and Welker,D.L.
22   TITLE     Direct Submission
23   JOURNAL   Submitted (11-JUL-1996) Biology, Utah State Univ., Logan, UT
24             84322-5305, USA
25 FEATURES             Location/Qualifiers
26      source          1..310
27                      /organism="Dictyostelium discoideum"
28                      /strain="AX4"
29                      /db_xref="taxon:44689"
30                      /clone="p427/428"
31      misc_feature    5.12
32                      /note="Fuzzy location"
33      misc_feature    join(J00194:(100..202),1..245,256..258)
34                      /note="Location partly in another entry"
35 BASE COUNT      118 a     46 c     67 g     79 t
36 ORIGIN      
37         1 gtgacagttg gctgtcagac atacaatgat tgtttagaag aggagaagat tgatccggag
38        61 taccgtgata gtattttaaa aactatgaaa gcgggaatac ttaatggtaa actagttaga
39       121 ttatgtgacg tgccaagggg tgtagatgta gaaattgaaa caactggtct aaccgattca
40       181 gaaggagaaa gtgaatcaaa agaagaagag tgatgatgaa tagccaccat tactgcatac
41       241 tgtagccctt acccttgtcg caccattagc cattaataaa aataaaaaat tatataaaaa
42       301 ttacacccat 
44 LOCUS       DDU63595       83 bp    DNA             INV       14-MAY-1999
45 DEFINITION  Dictyostelium discoideum Tdd-4 transposable element flanking
46             sequence, clone p427/428 left end.
47 ACCESSION   U63595
48 NID         g2393748
49 KEYWORDS    .
50 SOURCE      Dictyostelium discoideum.
51   ORGANISM  Dictyostelium discoideum
52             Eukaryota; Dictyosteliida; Dictyostelium.
53 REFERENCE   1  (bases 1 to 83)
54   AUTHORS   Wells,D.J.
55   TITLE     Tdd-4, a DNA transposon of Dictyostelium that encodes proteins
56             similar to LTR retroelement integrases
57   JOURNAL   Nucleic Acids Res. 27 (11), 2408-2415 (1999)
58 REFERENCE   2  (bases 1 to 83)
59   AUTHORS   Wells,D.J. and Welker,D.L.
60   TITLE     Dictyostelium discoideum Tdd-4 transposable element, left end
61             flanking sequence from clone p427/428
62   JOURNAL   Unpublished
63 REFERENCE   3  (bases 1 to 83)
64   AUTHORS   Wells,D.J. and Welker,D.L.
65   TITLE     Direct Submission
66   JOURNAL   Submitted (11-JUL-1996) Biology, Utah State Univ., Logan, UT
67             84322-5305, USA
68 FEATURES             Location/Qualifiers
69      source          1..83
70                      /organism="Dictyostelium discoideum"
71                      /strain="AX4"
72                      /db_xref="taxon:44689"
73                      /clone="p427/428"
74 BASE COUNT       31 a     16 c     12 g     24 t
75 ORIGIN      
76         1 ttcgaaggat atctcaaggc agttaataat tactatgatg attgtaaaat attccaaagt
77        61 ttcccagacc caccaataat gac
79 LOCUS       HUMBDNF       918 bp    DNA             PRI       31-OCT-1994
80 DEFINITION  Human brain-derived neurotrophic factor (BDNF) gene, complete cds.
81 ACCESSION   M37762
82 VERSION     M37762.1  GI:179402
83 KEYWORDS    neurotrophic factor.
84 SOURCE      Human DNA.
85   ORGANISM  Homo sapiens
86             Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Mammalia;
87             Eutheria; Primates; Catarrhini; Hominidae; Homo.
88 REFERENCE   1  (bases 1 to 918)
89   AUTHORS   Jones,K.R. and Reichardt,L.F.
90   TITLE     Molecular cloning of a human gene that is a member of the nerve
91             growth factor family
92   JOURNAL   Proc. Natl. Acad. Sci. U.S.A. 87 (20), 8060-8064 (1990)
93   MEDLINE   91045937
94 COMMENT     Draft entry and computer-readable sequence for [Proc. Natl. Acad.
95             Sci. U.S.A. (1990) In press] kindly submitted
96             by K.R.Jones, 13-AUG-1990.
97 FEATURES             Location/Qualifiers
98      source          1..918
99                      /organism="Homo sapiens"
100                      /db_xref="taxon:9606"
101                      /dev_stage="adult"
102      sig_peptide     76..123
103                      /gene="NTF3"
104                      /note="G00-125-917; putative"
105                      /product="brain-derived neurotrophic factor"
106      CDS             76..819
107                      /gene="BDNF"
108                      /note="putative"
109                      /codon_start=1
110                      /db_xref="GDB:G00-125-916"
111                      /product="brain-derived neurotrophic factor"
112                      /protein_id="AAA51820.1"
113                      /db_xref="GI:179403"
114                      /translation="MTILFLTMVISYFGCMKAAPMKEANIRGQGGLAYPGVRTHGTLE
115                      SVNGPKAGSRGLTSLADTFEHVIEELLDEDQKVRPNEENNKDADLYTSRVMLSSQVPL
116                      EPPLLFLLEEYKNYLDAANMSMRVRRHSDPARRGELSVCDSISEWVTAADKKTAVDMS
117                      GGTVTVLEKVPVSKGQLKQYFYETKCNPMGYTKEGCRGIDKRHWNSQCRTTQSYVRAL
118                      TMDSKKRIGWRFIRIDTSCVCTLTIKRGR"
119      gene            76..816
120                      /gene="NTF3"
121                      /map="12p13"
122      gene            76..819
123                      /gene="BDNF"
124                      /map="11p13"
125      mat_peptide     124..816
126                      /gene="NTF3"
127                      /note="G00-125-917; putative"
128                      /product="brain-derived neurotrophic factor"
129 BASE COUNT      269 a    192 c    237 g    220 t
130 ORIGIN
131         1 ggtgaaagaa agccctaacc agttttctgt cttgtttctg ctttctccct acagttccac
132        61 caggtgagaa gagtgatgac catccttttc cttactatgg ttatttcata ctttggttgc
133       121 atgaaggctg cccccatgaa agaagcaaac atccgaggac aaggtggctt ggcctaccca
134       181 ggtgtgcgga cccatgggac tctggagagc gtgaatgggc ccaaggcagg ttcaagaggc
135       241 ttgacatcat tggctgacac tttcgaacac gtgatagaag agctgttgga tgaggaccag
136       301 aaagttcggc ccaatgaaga aaacaataag gacgcagact tgtacacgtc cagggtgatg
137       361 ctcagtagtc aagtgccttt ggagcctcct cttctctttc tgctggagga atacaaaaat
138       421 tacctagatg ctgcaaacat gtccatgagg gtccggcgcc actctgaccc tgcccgccga
139       481 ggggagctga gcgtgtgtga cagtattagt gagtgggtaa cggcggcaga caaaaagact
140       541 gcagtggaca tgtcgggcgg gacggtcaca gtccttgaaa aggtccctgt atcaaaaggc
141       601 caactgaagc aatacttcta cgagaccaag tgcaatccca tgggttacac aaaagaaggc
142       661 tgcaggggca tagacaaaag gcattggaac tcccagtgcc gaactaccca gtcgtacgtg
143       721 cgggccctta ccatggatag caaaaagaga attggctggc gattcataag gatagacact
144       781 tcttgtgtat gtacattgac cattaaaagg ggaagatagt ggatttatgt tgtatagatt
145       841 agattatatt gagacaaaaa ttatctattt gtatatatac ataacagggt aaattattca
146       901 gttaagaaaa aaataatt
148 LOCUS       NT_010368  161485 bp    DNA             CON       16-NOV-2000
149 DEFINITION  Homo sapiens chromosome 15 working draft sequence segment, complete
150             sequence.
151 ACCESSION   NT_010368
152 VERSION     NT_010368.1  GI:11433101
153 KEYWORDS    HTG.
154 SOURCE      human.
155   ORGANISM  Homo sapiens
156             Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi;
157             Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo.
158 REFERENCE   1  (bases 1 to 161485)
159   AUTHORS   International Human Genome Project collaborators.
160   TITLE     Toward the complete sequence of the human genome
161   JOURNAL   Unpublished
162 COMMENT     GENOME ANNOTATION REFSEQ:  NCBI contigs are derived from assembled
163             genomic sequence data. They may include both draft and finished
164             sequence.
165             COMPLETENESS: not full length.
166 FEATURES             Location/Qualifiers
167      source          1..310
168                      /organism="Homo sapiens"
169                      /db_xref="taxon:9606"
170                      /chromosome="15"
171      source          order(1..100,251..300,300..310)
172                      /note="Doctored from Accession AC011224 
173                      sequenced by Whitehead Institute
174                      for Biomedical Research"
175                      /organism="Homo sapiens"
176                      /db_xref="taxon:9606"
177                      /clone="RP11-10K20"
178      variation       244
179                      /replace="T"
180                      /replace="A"
181                      /db_xref="dbSNP:140670"
182 ORIGIN      
183         1 gtgacagttg gctgtcagac atacaatgat tgtttagaag aggagaagat tgatccggag
184        61 taccgtgata gtattttaaa aactatgaaa gcgggaatac ttaatggtaa actagttaga
185       121 ttatgtgacg tgccaagggg tgtagatgta gaaattgaaa caactggtct aaccgattca
186       181 gaaggagaaa gtgaatcaaa agaagaagag tgatgatgaa tagccaccat tactgcatac
187       241 tgtagccctt acccttgtcg caccattagc cattaataaa aataaaaaat tatataaaaa
188       301 ttacacccat 
190 LOCUS       HUMBETGLOA              3002 bp    DNA     linear   PRI 26-AUG-1994
191 DEFINITION  Human haplotype C4 beta-globin gene, complete cds.
192 ACCESSION   L26462
193 VERSION     L26462.1  GI:432453
194 KEYWORDS    beta-globin.
195 SOURCE      Homo sapiens DNA.
196   ORGANISM  Homo sapiens
197             Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi;
198             Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo.
199 REFERENCE   1  (bases 1 to 3002)
200   AUTHORS   Fullerton,S.M., Harding,R.M., Boyce,A.J. and Clegg,J.B.
201   TITLE     Molecular and population genetic analysis of allelic sequence
202             diversity at the human beta-globin locus
203   JOURNAL   Proc. Natl. Acad. Sci. U.S.A. 91 (5), 1805-1809 (1994)
204   MEDLINE   94173918
205    PUBMED   7907422
206 FEATURES             Location/Qualifiers
207      source          1..3002
208                      /organism="Homo sapiens"
209                      /db_xref="taxon:9606"
210                      /haplotype="C4"
211                      /note="sequence found in a Melanesian population"
212      variation       111
213                      /replace="t"
214      variation       263
215                      /note="Rsa I polymorphism"
216                      /replace="t"
217      variation       273
218                      /replace="c"
219      variation       286..287
220                      /note="2 bp insertion of AT"
221                      /replace=""
222      variation       288
223                      /replace="t"
224      variation       295..296
225                      /note="1 bp deletion of C or 2 bp deletion of CT"
226                      /replace=""
227      variation       347
228                      /replace="c"
229      variation       476
230                      /replace="t"
231      variation       500
232                      /replace="c"
233      CDS             join(866..957,1088..1310,2161..2289)
234                      /codon_start=1
235                      /product="beta-globin"
236                      /protein_id="AAA21100.1"
237                      /db_xref="GI:532506"
238                      /translation="MVHLTPEEKSAVTALWGKVNVDEVGGEALGRLLVVYPWTQRFFE
239                      SFGDLSTPDAVMGNPKVKAHGKKVLGAFSDGLAHLDNLKGTFATLSELHCDKLHVDPE
240                      NFRLLGNVLVCVLAHHFGKEFTPPVQAAYQKVVAGVANALAHKYH"
241      exon            <866..957
242                      /number=1
243      variation       874
244                      /replace="c"
245      intron          958..1087
246                      /number=1
247      exon            1088..1310
248                      /number=2
249      intron          1311..2160
250                      /number=2
251      variation       1326
252                      /note="Ava II polymorphism"
253                      /replace="g"
254      variation       1384
255                      /replace="g"
256      variation       1391
257                      /replace="t"
258      variation       1976
259                      /replace="t"
260      exon            2161..>2289
261                      /number=3
262      variation       2522
263                      /replace="c"
264      variation       2602
265                      /replace="a"
266      variation       2604
267                      /replace="c"
268      variation       2760
269                      /note="Hinf I polymorphism"
270                      /replace="t"
271      variation       2913
272                      /replace="g"
273 BASE COUNT      810 a    601 c    599 g    992 t
274 ORIGIN      
275         1 acctcctatt tgacaccact gattacccca ttgatagtca cactttgggt tgtaagtgac
276        61 tttttattta tttgtatttt tgactgcatt aagaggtctc tagtttttta cctcttgttt
277       121 cccaaaacct aataagtaac taatgcacag agcacattga tttgtattta ttctattttt
278       181 agacataatt tattagcatg catgagcaaa ttaagaaaaa caacaacaaa tgaatgcata
279       241 tatatgtata tgtatgtgtg tacatataca catatatata tatatatatt ttttcttttc
280       301 ttaccagaag gttttaatcc aaataaggag aagatatgct tagaactgag gtagagtttt
281       361 catccattct gtcctgtaag tattttgcat attctggaga cgcaggaaga gatccatcta
282       421 catatcccaa agctgaatta tggtagacaa aactcttcca cttttagtgc atcaacttct
283       481 tatttgtgta ataagaaaat tgggaaaacg atcttcaata tgcttaccaa gctgtgattc
284       541 caaatattac gtaaatacac ttgcaaagga ggatgttttt agtagcaatt tgtactgatg
285       601 gtatggggcc aagagatata tcttagaggg agggctgagg gtttgaagtc caactcctaa
286       661 gccagtgcca gaagagccaa ggacaggtac ggctgtcatc acttagacct caccctgtgg
287       721 agccacaccc tagggttggc caatctactc ccaggagcag ggagggcagg agccagggct
288       781 gggcataaaa gtcagggcag agccatctat tgcttacatt tgcttctgac acaactgtgt
289       841 tcactagcaa cctcaaacag acaccatggt gcatctgact cctgaggaga agtctgccgt
290       901 tactgccctg tggggcaagg tgaacgtgga tgaagttggt ggtgaggccc tgggcaggtt
291       961 ggtatcaagg ttacaagaca ggtttaagga gaccaataga aactgggcat gtggagacag
292      1021 agaagactct tgggtttctg ataggcactg actctctctg cctattggtc tattttccca
293      1081 cccttaggct gctggtggtc tacccttgga cccagaggtt ctttgagtcc tttggggatc
294      1141 tgtccactcc tgatgctgtt atgggcaacc ctaaggtgaa ggctcatggc aagaaagtgc
295      1201 tcggtgcctt tagtgatggc ctggctcacc tggacaacct caagggcacc tttgccacac
296      1261 tgagtgagct gcactgtgac aagctgcacg tggatcctga gaacttcagg gtgagtctat
297      1321 gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt cataggaagg
298      1381 ggataagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca tcagtgtgga
299      1441 agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt ttcttttgtt
300      1501 taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact taatgcctta
301      1561 acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta aaaaaaaact
302      1621 ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt tgcatattca
303      1681 taatctccct actttatttt cttttatttt taattgatac ataatcatta tacatattta
304      1741 tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag ggtaattttg
305      1801 catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt atcttatttc
306      1861 taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat catgcctctt
307      1921 tgcaccattc taaagaataa cagtgataat ttctgggtta aggcaatagc aatatctctg
308      1981 catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata ttgctaatag
309      2041 cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg ctggattatt
310      2101 ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt cctcccacag
311      2161 ctcctgggca acgtgctggt ctgtgtgctg gcccatcact ttggcaaaga attcacccca
312      2221 ccagtgcagg ctgcctatca gaaagtggtg gctggtgtgg ctaatgccct ggcccacaag
313      2281 tatcactaag ctcgctttct tgctgtccaa tttctattaa aggttccttt gttccctaag
314      2341 tccaactact aaactggggg atattatgaa gggccttgag catctggatt ctgcctaata
315      2401 aaaaacattt attttcattg caatgatgta tttaaattat ttctgaatat tttactaaaa
316      2461 agggaatgtg ggaggtcagt gcatttaaaa cataaagaaa tgaagagcta gttcaaacct
317      2521 tgggaaaata cactatatct taaactccat gaaagaaggt gaggctgcaa acagctaatg
318      2581 cacattggca acagccctga tgcatatgcc ttattcatcc ctcagaaaag gattcaagta
319      2641 gaggcttgat ttggaggtta aagttttgct atgctgtatt ttacattact tattgtttta
320      2701 gctgtcctca tgaatgtctt ttcactaccc atttgcttat cctgcatctc tcagccttga
321      2761 ctccactcag ttctcttgct tagagatacc acctttcccc tgaagtgttc cttccatgtt
322      2821 ttacggcgag atggtttctc ctcgcctggc cactcagcct tagttgtctc tgttgtctta
323      2881 tagaggtcta cttgaagaag gaaaaacagg ggtcatggtt tgactgtcct gtgagccctt
324      2941 cttccctgcc tcccccactc acagtgaccc ggaatctgca gtgctagtct cccggaacta
325      3001 tc