TIKA-46 - Use Metadata in Parser
[tika.git] / CHANGES.txt
blob17363f156ce18a65023868784ecb5ea178c3cce8
1 Tika Change Log
3 Unreleased changes (0.1-dev)
5 1. TIKA-5 - Port Metadata Framework from Nutch (mattmann)
7 2. TIKA-11 - Consolidate test classes into a src/test/java directory tree (mattmann)
9 3. TIKA-15 - Utils.print does not print a Content having no value (jukka)
11 4. TIKA-19 - org.apache.tika.TestParsers fails (bdelacretaz)
13 5. TIKA-16 - Issues with data files used for testing by TestParsers (bdelacretaz)
15 6. TIKA-14 - MimeTypeUtils.getMimeType() returns the default mime type for 
16              .odt (Open Office) file (bdelacretaz)
18 7. TIKA-12 - Add URL capability to MimeTypesUtils (jukka)
20 8. TIKA-13 - Fix obsolete package names in config.xml (siren)
22 9. TIKA-10 - Remove MimeInfoException catch clauses and import from TestParsers (siren)
24 10. TIKA-8 - Replaced the jmimeinfo dependency with a trivial mime type detector (jukka)
26 11. TIKA-7 - Added the Lius Lite code. Added missing dependencies to POM (jukka)
28 12. TIKA-18 - "Office" interface should be renamed "MSOffice" (mattmann)
30 13. TIKA-23 - Decouple Parser from ParserConfig (jukka)
32 14. TIKA-6 - Port Nutch (or better) MimeType detection system into Tika (J. Charron & mattmann)
34 15. TIKA-25 - Removed hardcoded reference to C:\oo.xml in OpenOfficeParser (K. Bennett & jukka)
36 16. TIKA-17 - Need to support URL's for input resources. (K. Bennett & mattmann)
38 17. TIKA-22 - Remove @author tags from the java source (mattmann)
40 18. TIKA-21 - Simplified configuration code (jukka)
42 19. TIKA-17 - Rename all "Lius" classes to be "Tika" classes (jukka)
44 20. TIKA-30 - Added utility constructors to TikaConfig (K. Bennett & jukka)
46 21. TIKA-28 - Rename config.xml to tika-config.xml or similar (mattmann)
48 22. TIKA-26 - Use Map<String, Content> instead of List<Content> (jukka)
50 23. TIKA-31 - protected Parser.parse(InputStream stream,
51               Iterable<Content> contents) (jukka & K. Bennett)
52               
53 24. TIKA-36 - A convenience method for getting a document's content's text 
54               would be helpful (K. Bennett & mattmann)
55   
56 25. TIKA-33 - Stateless parsers (jukka)
58 26. TIKA-38 - TXTParser adds a space to the content it reads from a file (K. Bennett & ridabenjelloun)
60 27. TIKA-35 - Extract MsOffice properties, use RereadableInputStream devloped by K. Bennett (ridabenjelloun & K. Bennett)
62 28. TIKA-39 - Excel parsing improvements (siren & ridabenjelloun)
64 29. TIKA-34 - Provide a method that will return a default configuration 
65               (TikaConfig) (K. Bennett & mattmann)
67 30. TIKA-42 - Content class needs (String, String, String) constructor (K. Bennett)
69 31. TIKA-43 - Parser interface (jukka)
71 32. TIKA-47 - Remove TikaLogger (jukka)
73 33. TIKA-46 - Use Metadata in Parser (jukka & mattmann)