added README
[rofl0r-jobflow.git] / README
blobc4e873901e4e355662323eb44ae7cb2bbbcfec22
1 jobflow by rofl0r
2 =================
4 this program is inspired by GNU parallel, but has the following differences
6  + written in C (orders of magnitude less memory used, a few KB vs 50-60 MB)
7  + does not leak memory
8  + much faster
9  + supports rlimits passed to started processes
10  - doesn't support ssh (usage of remote cpus)
11  - doesn't support all kinds of argument permutations
13 basically, it works by processing stdin, launching one process per line.
14 the actual line can be passed to the started program as an argv.
15 this allows for easy parallelization of standard unix tasks.
17 it is possible to save the current processed line, so when the task is killed
18 it can be continued later.
20 example usage:
21 you have a list of things, and a tool that processes a single thing.
23     cat things.list | jobflow -threads=8 -exec ./mytask {}
25     seq 100 | jobflow -threads=100 -exec echo {}
27     cat urls.txt | jobflow -threads=32 -exec wget {}
29     find . -name '*.bmp' | jobflow -threads=8 -exec bmp2jpeg {.}.bmp {.}.jpg
31 run jobflow without arguments to see a list of possible command line options,
32 and argument permutations.
35 there is one known issue, see the fixme comment at the top of jobflow.c