Check for named servers when looking them up by nickname;
[tor.git] / doc / TODO
bloba5e8d21e7580f0cd9ff7f7cc65db9f16e0b397ad
1 $Id$
2 Legend:
3 SPEC!!  - Not specified
4 SPEC    - Spec not finalized
5 NICK    - nick claims
6 ARMA    - arma claims
7 PHOBOS  - phobos claims
8         - Not done
9         * Top priority
10         . Partially done
11         o Done
12         D Deferred
13         X Abandoned
15 Non-Coding, Soon:
16 N - contact umass folks
17 N - Mention controller libs someplace.
18   D FAQ entry: why gnutls is bad/not good for tor
19 P - flesh out the rest of the section 6 of the faq
20 P - gather pointers to livecd distros that include tor
21   - put the logo on the website, in source form, so people can put it on
22     stickers directly, etc.
23   - more pictures from ren. he wants to describe the tor handshake, i want to
24     talk about hidden services.
25   * clean up the places where our docs are redundant (or worse, obsolete in
26     one file and correct elsewhere). agl has a start on a global
27     list-of-tor-docs.
28 P - update windows docs to clarify which versions of windows, and why a
29     DOS window, how it's used, for the less technical users
30 NR- write a spec appendix for 'being nice with tor'
31   - tor-in-the-media page
32   - Ask schanzle@cas.homelinux.org about a patch for rpm spec fixes against
33     tor-0.1.0.7.rc
34   - Remove need for HACKING file.
38 for 0.1.1.x:
39 R - are dirservers auto-verifying duplicate nicknames?
40   o tor should auto-sort the recommended-versions strings 
41     (with the new smartlist sort stuff maybe)
42   o setconf SocksBindAddress kills tor if it fails to bind
44   o controller libs should support resetconf command.
45 N . Additional controller features
46       - Find a way to make event info more extensible
47       - change circuit status events to give more details, like purpose,
48         whether they're internal, etc.
49       . Expose more information via getinfo:
50         - import and export rendezvous descriptors
51         - Review all static fields for additional candidates
52       - Allow EXTENDCIRCUIT to unknown server.
53       - We need some way to adjust server status, and to tell tor not to
54         download directories/network-status, and a way to force a download.
55       - It would be nice to request address lookups from the controller
56         without using SOCKS.
58   . Helper nodes
59     . More testing and debugging
60     - On sighup, if usehelpernodes changed to 1, use new circuits?
61     - If your helper nodes are unavailable, don't abandon them unless
62       other nodes *are* reachable.
63 R   - If you think an OR conn is open but you can never establish a circuit
64       to it, reconsider whether it's actually open.
66   - Miscellaneous cleanups
67     - switch accountingmax to count total in+out, not either in or
68       out. it's easy to move in this direction (not risky), but hard to
69       back, out if we decide we prefer it the way it already is. hm.
70     . Come up with a coherent strategy for bandwidth buckets and TLS. (The
71       logic for reading from TLS sockets is likely to overrun the bandwidth
72       buckets under heavy load.  (Really, the logic was never right in the
73       first place.)  Also, we should audit all users of get_pending_bytes().)
74         - Make it harder to circumvent bandwidth caps: look at number of bytes
75           sent across sockets, not number sent inside TLS stream.
76 R   o remove the warnings from rendezvous stuff that shouldn't be warnings.
78   . Update the hidden service stuff for the new dir approach.
79     - switch to an ascii format.
80     - authdirservers publish blobs of them.
81     - other authdirservers fetch these blobs.
82     - hidserv people have the option of not uploading their blobs.
83     - you can insert a blob via the controller.
84     - and there's some amount of backwards compatibility.
85     - teach clients, intro points, and hidservs about auth mechanisms.
86     - come up with a few more auth mechanisms.
89   - Christian Grothoff's attack of infinite-length circuit.
90     the solution is to have a separate 'extend-data' cell type
91     which is used for the first N data cells, and only
92     extend-data cells can be extend requests.
93     - Specify, including thought about
94     - Implement
96 N - Destroy and truncated cells should have reasons.
97 N - Add private:* alias in exit policies to make it easier to ban all the
98     fiddly little 192.168.foo addresses.
99     (AGL had a patch; consider applying it.)
101 N - warn if listening for SOCKS on public IP.
103   - cpu fixes:
104     - see if we should make use of truncate to retry
105     o hardware accelerator support (configure engines.)
106     o hardware accelerator support (use instead of aes.c when reasonable)
107       - Benchmark this somehow to see whether using EVP_foo is slower in the
108         non-engine case than AES_foo.  If so, check for AES engine and fall
109         back to AES_foo when it's not found.
110 R   - kill dns workers more slowly
112   . Directory changes
113     o recommended-versions for client / server ?
114     . Some back-out mechanism for auto-approval
115       o dirservers have blacklist of IPs and keys they hate
116       - a way of rolling back approvals to before a timestamp
117       - have new people be in limbo and need to demonstrate usefulness
118         before we approve them
119       - other?
121 R   . Dirservers verify reachability claims
122       o basic reachability testing, influencing network-status list.
123       X rate-limiting the reporting of trouble servers
124 R     - check reachability as soon as you hear about a new server
126     - Decentralization
127       - Figure out what to do about hidden service descriptors.
128       - find 10 dirservers.
129         - (what are criteria to be a dirserver?)
130       o Dirservers publish compressed network-status objects.
131         o Support retrieving several-at-once
132       o Everyone downloads network-status objects
133         o Clients: from all directories, round-robin
134           o Basic implementation: disable until 0.1.1.x is out.
135           o On failure, mark trusted_dir_server as having failed
136           o Retry, up to a point.
137           - Launch retry immediately on failure.
138         o Parse them
139         o Cache them, reload on restart
140         o Serve cached directories
141       o Directories expose individual descriptors
142         X By 'if-newer-than' (Does the spec require this??)
143         o Support compression.
144       o Alice acts on network-status objects
145         o Alice downloads descriptors as needed.
146           o Figure out what's needed
147           o Store it
148             o Implement store
149             o Implement reload-from-store
150             o Store downloaded descriptors
151           o Download it
152             o As-needed if we have 2 network-status objs.
153             o Download "all" if we have less than 2 network-status objs.
154               (This has vulnerabilities if we're not careful)
155             o Call directory_has_arrived as needed; rename it.
156             o Set has_fetched_directory properly.
157           o Retry descriptors on failure
158           o Give up after a while.
159           - But try again after a long while (???)
160         o Check software versions according to some sane plan.
161           - Warn again after 24 hours.
162         o Alice sets descriptor status from network-status
163           o Implement
164           o Use
165 N     . Routerdesc download changes
166         o Refactor combined-status to be its own type.
167         o Change rule from "do not launch new connections when one exists" to
168           "do not request any fingerprint that we're currently requesting."
169         o Launch connections every minute, or whenever a download fails
170         o Retry failed routerdescs after 0, 1, 5, 10 minutes.
171           o Mirrors retry harder and more often. (0, 0, 1, 1, 2, 5, and 15)
172         o Reset failure count every 60 minutes
173         o Drop fallback to download-all.  Also, always split download.
174         - Only use a routerdesc if you recognize its hash.
175           - (Must defer till dirservers are upgraded to latest code, which
176             actually generates these hashes.)
177           - Of course, authdirservers must not do this.
178           - Should directory mirrors do something else entirely?
179         - Use has_fetched_directory sanely, whatever that means.
180           - What *does* that mean?
181         o If we have a routerdesc for Bob, and he says, "I'm 0.1.0.x", don't
182           fetch a new one if it was published in the last 2 hours.
183           - How does this interact with the 'recognized hash' rule?
184       . Downgrade new directory events from notice to info
185       - Clients should estimate their skew as median of skew from directory
186         connections over last N seconds.
187       o Call dirport_is_reachable from somewhere else.
188       o Networkstatus should list who's an authority.
189       o Add nickname element to dirserver line.  Log this along with IP:Port.
190       o Warn when using non-default directory servers.
191       - When giving up on a non-finished dir request, log how many bytes
192         dropped, to see whether it's worthwhile to use partial info.
193     - Security
194       - Alices avoid duplicate class C nodes.
195       - Analyze how bad the partitioning is or isn't.
197     - Make authorities rate-limit logging their complaints about given
198       servers?
200 N   . Naming and validation:
201       o Separate naming from validation in authdirs.
202       o Authdirs need to be able to decline to validate based on
203         IP range and key
204       o Authdirs need to be able to decline to include baased on
205         IP range and key.
206       o Not all authdirs name.
207       o Change naming rule: N->K iff any naming authdir says N->K,
208         and none says N->K' or N'->K.
209       o Clients choose names based on network-status options.
210       o Names are remembered in client state (?)
211       - Okay to have two valid servers with same nickname, but not
212         two named servers with same nickname.  Update logic.
214   - packaging and ui stuff:
215     . multiple sample torrc files
216     - uninstallers
217       . for os x
218     . something, anything, for sys tray on Windows.
219     . figure out how to make nt service stuff work?
220       . Document it.
221     . Add version number to directory.
222 N   - Vet all pending installer patches
223       - Win32 installer plus privoxy, sockscap/freecap, etc.
224       - Vet win32 systray helper code
226   o openssl patch to check for degenerate keys in DH handshake
227     o accepted and put into openssl
229 Reach (deferrable) items for 0.1.1.x:
230   - Start using create-fast cells as clients
231   o Let more config options (e.g. ORPort) change dynamically.
232   - start handling server descriptors without a socksport?
233   o Add TTLs to DNS-related replies, and use them (when present) to adjust
234     addressmap values.
236   . Research memory use on Linux: what's happening?
237     - Is it threading?  (Maybe, maybe not)
238     - Is it the buf_shrink bug? (Quite possibly)
239     - Instrument the 0.1.1 code to figure out where our memory is going;
240       apply the results. (all platforms?)
242   - Make router_is_general_exit() a bit smarter once we're sure what it's for.
244 For 0.1.1.x, if we can figure out how:
245   - rewrite how libevent does select() on win32 so it's not so very slow.
246   o enclaves (at least preliminary)
247   - Write limiting; separate token bucket for write
248   - Audit everything to make sure rend and intro points are just as likely to
249     be us as not.
250   - Do something to prevent spurious EXTEND cells from making middleman
251     nodes connect all over.  Rate-limit failed connections, perhaps?
253 Future version:
254   - Limit to 2 dir, 2 OR, N SOCKS connections per IP.
255   - Handle full buffers without totally borking
256   - Rate-limit OR and directory connections overall and per-IP and
257     maybe per subnet.
258   - Hold-open-until-flushed now works by accident; it should work by
259     design.
260   - DoS protection: TLS puzzles, public key ops, bandwidth exhaustion.
261     - Specify?
262   - tor-resolve script should use socks5 to get better error messages.
263   - make min uptime a function of the available choices (say, choose 60th
264     percentile, not 1 day.)
265   - config option to publish what ports you listen on, beyond ORPort/DirPort
266   - hidserv offerers shouldn't need to define a SocksPort
267     * figure out what breaks for this, and do it.
268   - auth mechanisms to let hidden service midpoint and responder filter
269     connection requests.
270   - Relax clique assumptions.
271   - tor should be able to have a pool of outgoing IP addresses
272     that it is able to rotate through. (maybe)
274 Blue-sky:
275   - Patch privoxy and socks protocol to pass strings to the browser.
276   - Standby/hotswap/redundant hidden services.
277   - Robust decentralized storage for hidden service descriptors.
278   - The "China problem"
279   - Allow small cells and large cells on the same network?
280   - Cell buffering and resending. This will allow us to handle broken
281     circuits as long as the endpoints don't break, plus will allow
282     connection (tls session key) rotation.
283   - Implement Morphmix, so we can compare its behavior, complexity, etc.
284   - Other transport. HTTP, udp, rdp, airhook, etc. May have to do our own
285     link crypto, unless we can bully openssl into it.
286   - Conn key rotation.
287   - Need a relay teardown cell, separate from one-way ends.
288     (Pending a user who needs this)
289   - Handle half-open connections: right now we don't support all TCP
290     streams, at least according to the protocol. But we handle all that
291     we've seen in the wild.
292     (Pending a user who needs this)