page removed on github administration request
[bibanon.git] / Useful-Tools.md
blobc3b50a86d895a92fc92ded4b5a9e2823696ebda9
1 ## Archive Scripts
3 * [BASC Archiver](https://github.com/bibanon/BASC-Archiver) - Tool that downloads an entire 4chan thread, it's JSON, and all images.
4 * [Wget](http://github.com/baslqc/baslqc/wiki/Wget) - The internet archivist's swiss army knife. Grab any website, and all public data on it for offline viewing (or into WARC format).
5 * [youtube-dl](https://github.com/rg3/youtube-dl) - Download videos off of YouTube and other streaming sites. [[Here are some recommended commands.|Youtube-dl]]
6 * [Imgur Album Downloader](https://github.com/alexgisby/imgur-album-downloader) - To save choice albums for later viewing.
7 * [Wikiteam - Mediawiki Dump Generator](http://archiveteam.org/index.php?title=WikiTeam#Tools_and_source_code) - Archive an entire backup of a MediaWiki-based wiki, all pages, all history, and all images. You can use Special:Import to restore this XML backup.
8 * ~~[Plowshare](https://github.com/plowshare/plowshare) - Oh no! Was OP a faggot and gave you 10 split Mediafire links? Not to worry, you can use this automated download script to scrape from any download site in an automated manner. Though sometimes, you'll still have to solve captchas.~~404'ed
9 * [Bdom's Tumblr Backup](https://github.com/bdoms/tumblr_backup) - This python script backs up an entire Tumblr blog with all posts and images. Just in case the author decides to delete their blog...
10   * Unfortunately, it doesn't grab a list of reblogs/comments or the Tumblr theme. Might be a good project to work on.
12 ### Quick and dirty archive snapshot
14 Just click a bookmarklet to archive a page for later! Great for source links and Google Cache, because you can bet that they will be gone within 5 years.
16 * [Archive.today](http://archive.today/) - An improved version of WebCite, optimized for pesky "Web 2.0" sites that dump a lot of extra CSS and other content that is tricky to archive.
17 * [Webcite](http://webcite.org) - The original tried-and-true website snapshot archiver, for research paper citations.
19 ## Markdown Conversion
21 * [Pandoc](http://johnmacfarlane.net/pandoc/) - The Swiss Army knife of markup language converters. Convert anything to Markdown, and convert markdown to anything. Great for turning HTML into a readable format.
22 * [gdoc2md](http://lifehacker.com/this-script-converts-google-documents-to-markdown-for-e-511746113) - A quick and dirty script used to convert a Google Doc into Markdown. Great for importing collaborative projects.
24 ## Regular Expressions
26 * [Regexr](http://www.regexr.com/) - Create and share Regular Expressions for everyone to use. Great for learning how to make them.
28 ## Programming Guidelines
30 * **Use the GPLv3 for programs/scripts.** - This ensures that the source code of our programs stay open-source, and any derivatives are open source.
31 * **Use the LGPLv3 for libraries.** - This ensures that the source code of our libraries stay open source. Unlike the GPL, however, the LGPL allows statically linked (`import library`) programs to use any license they want.
32   * The only exception is the BASC-py4chan wrapper, which uses the WTFPL. This is a humorous tradition inherited in honor of Edgeworth E. Euler.