clean up some TODO items; rename ACI to circID
[tor.git] / doc / TODO
blob3a44aa40a884694cc2f465f0a9c8e3a050129769
1 Issues identified while writing paper:
2     - Rotate tls-level connections -- make new ones, expire old ones.
3     - Dirserver shouldn't put you in running-routers list if you haven't
4       uploaded a descriptor recently
5     - Look at having smallcells and largecells
6     - separate trying to rebuild a circuit because you have none from trying 
7       to rebuild a circuit because the current one is stale
9 <nickm> If I compromise a node, and streamIDs are sequential, I learn
10 how many streams have been open and closed on this circuit at this point.
11 > hm. you learn this for circuits too, do you not?
12 <nickm> True.  But how-many-circuits-from-A-to-B only leaks how long
13 the connection from A to B has been alive and how much use it's seen.
14 > ok. needs more investigation.
17 Legend:
18 SPEC!!  - Not specified
19 SPEC    - Spec not finalized
20 NICK    - nick claims
21 ARMA    - arma claims
22         - Not done
23         * Top priority
24         . Partially done
25         o Done
26         D Deferred
27         X Abandoned
29 Short-term:
30         - Rename ACI to circID
31         . integrate rep_ok functions, see what breaks
32         - update tor faq
33         o obey SocksBindAddress, ORBindAddress
34         - warn if we're running as root
35         o make connection_flush_buf() more obviously obsolete
36         . let hup reread the config file, eg so we can get new exit
37           policies without restarting
38         - use times(2) rather than gettimeofday to measure how long it
39           takes to process a cell
40         . Exit policies
41                 o Spec how to write the exit policies
42                 - Path selection algorithms
43                         - Let user request certain nodes
44                         - And disallow certain nodes
45                         D Choose path by jurisdiction, etc?
46                 - Make relay end cells have failure status and payload attached
47                 - Streams that fail due to exit policy must reextend to new node
48                 - Add extend_wait state to edge connections, thumb through them
49                   when the AP get an extended cell.
50         - let non-approved routers handshake.
51         - just list approved routers in directory.
52         . migrate to using nickname rather than addr:port for routers
53                 o decide_aci_type
54                 - generate onion skins
55                   - circuit_send_next_onion_skin
56                   - circuit_extend
57                   - onion_generate_cpath
58                 - get_unique_aci_by_addr_port
59                 - circ->n_addr and circ->n_port
60                   - circuit_enumerate_by_naddr_nport
61                 - cpath layers
62                 - connection_or_connect
63                 - connection_exact_get_by_addr_port
64                 - connection_twin_get_by_addr_port
65                 - router_get_by_addr_port
66                 - connection_or_init_conn_from_router
67                 - tag_pack, tag_unpack, connection_cpu_process_inbuf
68                 - directory_initiate_command
69         . Move from onions to ephemeral DH
70                 o incremental path building
71                 o transition circuit-level sendmes to hop-level sendmes
72                 o implement truncate, truncated
73                 o move from 192byte DH to 128byte DH, so it isn't so damn slow
74                 - exiting from not-last hop
75                         - OP logic to decide to extend/truncate a path
76                         - make sure exiting from the not-last hop works
77                         - logic to find last *open* hop, not last hop, in cpath
78                         - choose exit nodes by exit policies
79         - Remember address and port when beginning. 
80         - Extend by nickname/hostname/something, not by IP.
82 On-going
83         . Better comments for functions!
84         . Go through log messages, reduce confusing error messages.
85         . make the logs include more info (fd, etc)
86         . Unit tests
88 Mid-term:
89         . Redo scheduler
90                 o fix SSL_read bug for buffered records
91                 - make round-robining more fair
92         - What happens when a circuit's length is 1? What breaks?
93         . streams / circuits
94                 o Implement streams
95                 o Rotate circuits after N minutes?
96                 X Circuits should expire when circuit->expire triggers
97 NICK            . Handle half-open connections
98                         o openssh is an application that uses half-open connections
99                         o Figure out what causes connections to close, standardize
100                           when we mark a connection vs when we tear it down
101                 o Look at what ssl does to keep from mutating data streams
102 ARMA    - Reduce streamid footprint from 7 bytes to 2 bytes
103                 - Check for collisions in streamid (now possible with
104                   just 2 bytes), and back up & replace with padding if so
105                 - Use the 3 saved bytes to put pseudorandomness in each relay cell
106                 - Use the 4 reserved bytes in each cell header to keep 1/5
107                   of a sha1 of the relay payload (move into stream header)
108                 - Move length into the stream header too
109                 - Spec the stream_id stuff. Clarify that nobody on the backward
110                   stream should look at stream_id.
111         . Put CPU workers in separate processes
112                 o Handle multiple cpu workers (one for each cpu, plus one)
113                 o Queue for pending tasks if all workers full
114                 o Support the 'process this onion' task
115                 D Merge dnsworkers and cpuworkers to some extent
116                 - Handle cpuworkers dying
117         . Scrubbing proxies
118                 - Find an smtp proxy?
119                         - Check the old smtp proxy code
120                 o Find an ftp proxy? wget --passive
121                 D Wait until there are packet redirectors for Linux
122                 . Get socks4a support into Mozilla
123         . Develop rendezvous points
124 SPEC!!          - Handle socks commands other than connect, eg, bind?
125                 o Design
126                 - Spec
127                 - Implement
128         - Tests
129                 o Testing harness/infrastructure
130                 D System tests (how?)
131                 - Performance tests, so we know when we've improved
132                         . webload infrastructure (Bruce)
133                         . httperf infrastructure (easy to set up)
134                         . oprofile (installed in RH >8.0)
135 NICK    . Daemonize and package
136                 o Teach it to fork and background
137                 - Red Hat spec file
138                 - Debian spec file equivalent
139         . Portability
140                 . Which .h files are we actually using?
141                 . Port to:
142                         o Linux
143                         o BSD
144                         . Solaris
145                         o Cygwin
146                         . Win32
147                         o OS X
148                 - deal with pollhup / reached_eof on all platforms
149                 o openssl randomness
150                 o inet_ntoa
151                 . stdint.h
152                 - Make a script to set up a local network on your machine
153         - More flexibility in node addressing
154                 D Support IPv6 rather than just 4
155                 - Handle multihomed servers (config variable to set IP)
157 In the distant future:
158         D Load balancing between router twins
159                 D Keep track of load over links/nodes, to
160                   know who's hosed
161 SPEC!!  D Non-clique topologies
162         D Implement our own memory management, at least for common structs
163           (Not ever necessary?)
164         D Advanced directory servers
165                 D Automated reputation management
166 SPEC!!          D Figure out how to do threshold directory servers
167                 D jurisdiction info in dirserver entries? other info?
169 Older (done) todo stuff:
171         o Get tor to act like a socks server
172                 o socks4, socks4a
173                 o socks5
174         o routers have identity key, link key, onion key.
175                 o link key certs are
176                   D signed by identity key
177                   D not in descriptor
178                   o not in config
179                   D not on disk
180                 o identity and onion keys are in descriptor (and disk)
181         o upon boot, if it doesn't find identity key, generate it and write it.
182         o also write a file with the identity key fingerprint in it
183         o router generates descriptor: flesh out router_get_my_descriptor()
184         o Routers sign descriptors with identity key
185         o routers put version number in descriptor
186         o routers should maybe have `uname -a` in descriptor?
187         o Give nicknames to routers
188                 o in config
189                 o in descriptors
190         o router posts descriptor
191                 o when it boots
192                 D when it changes
193         o change tls stuff so certs don't get written to disk, or read from disk
194         o make directory.c 'thread'safe
195         o dirserver parses descriptor
196         o dirserver checks signature
197         D client checks signature?
198         o dirserver writes directory to file
199           o reads that file upon boot
200         o directory includes all routers, up and down
201         o add "up" line to directory, listing nicknames
202         o instruments ORs to report stats
203           o average cell fullness
204           o average bandwidth used
205         o configure log files. separate log file, separate severities.
206         o what assumptions break if we fclose(0) when we daemonize?
207         o make buffer struct elements opaque outside buffers.c
208         o add log convention to the HACKING file
209         o make 'make install' do the right thing
210         o change binary name to tor
211         o change config files so you look at commandline, else look in
212           /etc/torrc. no cascading.
213         o have an absolute datadir with fixed names for files, and fixed-name
214           keydir under that with fixed names
215         o Move (most of) the router/directory code out of main.c
216         o Simple directory servers
217                 o Include key in source; sign directories
218                         o Signed directory backend
219                         o Document
220                         o Integrate
221                 o Add versions to code
222                 o Have directories list recommended-versions
223                         o Include line in directories
224                         o Check for presence of line.
225                         o Quit if running the wrong version
226                         o Command-line option to override quit
227                 o Add more information to directory server entries
228                         o Exit policies
229         o Clearer bandwidth management 
230                 o Do we want to remove bandwidth from OR handshakes?
231                 o What about OP handshakes?
232         X Move away from openssl
233                 o Abstract out crypto calls
234                 X Look at nss, others? Just include code?
235         o Use a stronger cipher
236                 o aes now, by including the code ourselves
237         X On the fly compression of each stream
238         o Clean up the event loop (optimize and sanitize)
239         o Remove that awful concept of 'roles'
240         o Terminology
241                 o Circuits, topics, cells stay named that
242                 o 'Connection' gets divided, or renamed, or something?
243         o DNS farm
244                 o Distribute queries onto the farm, get answers
245                 o Preemptively grow a new worker before he's needed
246                 o Prune workers when too many are idle
247                 o DNS cache   
248                         o Clear DNS cache over time  
249                         D Honor DNS TTL info (how??)
250                 o Have strategy when all workers are busy
251                 o Keep track of which connections are in dns_wait
252                 o Need to cache positives/negatives on the tor side
253                         o Keep track of which queries have been asked
254                 o Better error handling when
255                         o An address doesn't resolve
256                         o We have max workers running
257                 o Consider taking the master out of the loop?
258         X Implement reply onions
259         o Total rate limiting
260         o Look at OR handshake in more detail
261                 o Spec it
262                 o Merge OR and OP handshakes
263                 o rearrange connection_or so it doesn't suck so much to read
264                 D Periodic link key rotation. Spec?
265         o wrap malloc with something that explodes when it fails
266         o Clean up the number of places that get to look at prkey