[1.2.0] Type variable in HTMLDefinition was not being set properly, fixed. Minor...
[htmlpurifier.git] / TODO
blobf85f14d745e2d53334e60cf5d2b8515aed7552b2
2 TODO List
4 Ongoing
5  - Lots of profiling, make it faster!
6  - Plugins for major CMSes (very tricky issue)
8 1.2 release
9  - Make URI validation routines tighter (especially mailto)
10  - More extensive URI filtering schemes
11  - Allow for background-image and list-style-image (see above)
12  - Distinguish between different types of URIs, for instance, a mailto URI
13    in IMG SRC is nonsensical
14  - Error logging for filtering/cleanup procedures
16 1.3 release
17  - Add various "levels" of cleaning
18     - Related: Allow strict (X)HTML
20 1.4 release
21  - Additional support for poorly written HTML
22     - Implement all non-essential attribute transforms
23     - Microsoft Word HTML cleaning (i.e. MsoNormal)
25 2.0 release
26  - Formatters for plaintext
27     - Auto-paragraphing (be sure to leverage fact that we know when things
28       shouldn't be paragraphed, such as lists and tables).
29     - Linkify URLs
30     - Smileys
32 3.0 release
33  - Extended HTML capabilities based on namespacing and tag transforms
34     - Hooks for adding custom processors to custom namespaced tags and
35       attributes, offer default implementation
36     - Lots of documentation and samples
38 Unknown release (on a scratch-an-itch basis)
39  - Silently drop content inbetween SCRIPT tags (can be generalized to allow
40    specification of elements that, when detected as foreign, trigger removal
41    of children, although unbalanced tags could wreck havoc (or at least delete
42    the rest of the document)).
43  - Fixes for Firefox's inability to handle COL alignment props (Bug 915)
44  - Automatically add non-breaking spaces to empty table cells when
45    empty-cells:show is applied to have compatibility with Internet Explorer
46  - Non-lossy dumb alternate character encoding transformations, achieved by
47    numerically encoding all non-ASCII characters
48  - Semi-lossy dumb alternate character encoding transformations, achieved by
49    encoding all characters that have string entity equivalents
50  - Convert RTL/LTR override characters to <bdo> tags, or vice versa on demand.
51    Also, enable disabling of directionality
53 Requested
54  - Native content compression, whitespace stripping (don't rely on Tidy, make
55    sure we don't remove from pre tags)
56  - Win32 Phalanger C# binaries
58 Wontfix
59  - Non-lossy smart alternate character encoding transformations
60  - Pretty-printing HTML, users can use Tidy on the output on entire page