complete refactoring of zarchive and zdump
[zip-doc.git] / NOTES
blobacacc509dd26f9b6b16668fa3a908d9e87c98978
1 Quick notes, need to be expanded:
3 Download a wikipedia file from http://static.wikipedia.org, use 7zip to unextract it (7z x wikipedia-id-html.7z or 7za x wikipedia-id-html.7z). 
4 Then run ruby zdump.rb id id.zdump - zdump.rb must be ran from the catalogue where all the rb scripts are. id is the catalogue where you unzipped the Wikipedia file, and id.zdump is the resulting file.
5 To use any zdump file, use ruby mongrel-web.rb id.zdump, yout can then access pages from localhost:2042 (or 127.0.0.1:2042 if that doesn't work).
6 In zdump.rb there is a line called ignore = /something/ - this is a regular expression of pages to ignore. If you take out discussion, talk and image pages, usually you can make the resulting file about 40% smaller.
8 mongrel-web-gui.rb is currently completely out of date, but it should be easy to fix it. All development happens in ruby-web.rb (maybe the should be merged).
10 Please contact me with any questions.
11 Stian <shaklev@gmail.com>
12 This is released under a GPL / MIT license.