[1.0.1] Fixed rejection of inline style declarations that had lots of extra space...
[htmlpurifier.git] / TODO
blob62f223a0195a7adffe18d3c5ec03548857dc84e3
2 TODO List
4 Ongoing
5  - Lots of profiling, make it faster!
6  - Plugins for major CMSes (very tricky issue)
8 1.1 release
9  - Directive documentation generation
10  - Rewrite table's child definition to be faster, smart, and regexp free
11  - Allow HTML 4.01 output (cosmetic changes to the generator)
12  - Formatters for plaintext
13     - Auto-paragraphing (be sure to leverage fact that we know when things
14       shouldn't be paragraphed, such as lists and tables).
16 1.2 release
17  - Additional support for poorly written HTML
18     - Implement all non-essential attribute transforms
19     - Microsoft Word HTML cleaning (i.e. MsoNormal)
21 1.3 release
22  - Make URI validation routines tighter (especially mailto)
23  - More extensive URI filtering schemes
24  - Allow for background-image and list-style-image (see above)
25  - Distinguish between different types of URIs, for instance, a mailto URI
26    in IMG SRC is nonsensical
28 2.0 release
29  - Add various "levels" of cleaning
30     - Related: Allow strict (X)HTML
32 3.0 release
33  - Extended HTML capabilities based on namespacing and tag transforms
34     - Hooks for adding custom processors to custom namespaced tags and
35       attributes, offer default implementation
36     - Lots of documentation and samples
38 Unknown release (on a scratch-an-itch basis)
39  - Silently drop content inbetween SCRIPT tags (can be generalized to allow
40    specification of elements that, when detected as foreign, trigger removal
41    of children, although unbalanced tags could wreck havoc (or at least delete
42    the rest of the document)).
43  - Fixes for Firefox's inability to handle COL alignment props (Bug 915)
44  - Automatically add non-breaking spaces to empty table cells when
45    empty-cells:show is applied to have compatibility with Internet Explorer
46  - Pretty-printing HTML (adds dependency of Generator to HTMLDefinition)
47  - Non-lossy dumb alternate character encoding transformations, achieved by
48    numerically encoding all non-ASCII characters
50 Wontfix
51  - Non-lossy smart alternate character encoding transformations