[1.2.0] HTML-ization for code-quality and colors. Also added in missing $Id$ to progr...
[htmlpurifier.git] / TODO
blob154487f7fc9dfacb55d231433998a207b5f6327a
2 TODO List
4 1.2 release
5  - Make URI validation routines tighter (especially mailto)
6  - More extensive URI filtering schemes (see URI in config-ideas.txt)
7  - Allow for background-image and list-style-image (see above)
8  - Error logging for filtering/cleanup procedures
9  - Rich set* methods and config file loaders for HTMLPurifier_Config
11 1.3 release
12  - Add various "levels" of cleaning
13     - Related: Allow strict (X)HTML
14  - More fine-grained control over escaping behavior
15     - Silently drop content inbetween SCRIPT tags (can be generalized to allow
16       specification of elements that, when detected as foreign, trigger removal
17       of children, although unbalanced tags could wreck havoc (or at least
18       delete the rest of the document)).
20 1.4 release
21  - Additional support for poorly written HTML
22     - Implement all non-essential attribute transforms
23     - Microsoft Word HTML cleaning (i.e. MsoNormal)
25 2.0 release
26  - Formatters for plaintext
27     - Auto-paragraphing (be sure to leverage fact that we know when things
28       shouldn't be paragraphed, such as lists and tables).
29     - Linkify URLs
30     - Smileys
31     - Linkification for HTML Purifier docs: notably configuration and
32       class names
34 3.0 release
35  - Extended HTML capabilities based on namespacing and tag transforms
36     - Hooks for adding custom processors to custom namespaced tags and
37       attributes, offer default implementation
38     - Lots of documentation and samples
40 Ongoing
41  - Lots of profiling, make it faster!
42  - Plugins for major CMSes (very tricky issue)
44 Unknown release (on a scratch-an-itch basis)
45  - Fixes for Firefox's inability to handle COL alignment props (Bug 915)
46  - Automatically add non-breaking spaces to empty table cells when
47    empty-cells:show is applied to have compatibility with Internet Explorer
48  - Convert RTL/LTR override characters to <bdo> tags, or vice versa on demand.
49    Also, enable disabling of directionality
50  - Append something to duplicate IDs so they're still usable (impl. note: the
51    dupe detector would also need to detect the suffix as well)
52  - Have 'lang' attribute be checked against official lists
54 Encoding workarounds
55  - Non-lossy dumb alternate character encoding transformations, achieved by
56    numerically encoding all non-ASCII characters
57  - Semi-lossy dumb alternate character encoding transformations, achieved by
58    encoding all characters that have string entity equivalents
60 Requested
61  - Native content compression, whitespace stripping (don't rely on Tidy, make
62    sure we don't remove from <pre> or related tags)
63  - Win32 Phalanger C# binaries (?)
64  - Remove redundant tags, ex. <u><u>Underlined</u></u>. Implementation notes:
65     1. Analyzing which tags to remove duplicants
66     2. Ensure attributes are merged into the parent tag
67     3. Extend the tag exclusion system to specify whether or not the
68     contents should be dropped or not (currently, there's code that could do
69     something like this if it didn't drop the inner text too.)
71 Wontfix
72  - Non-lossy smart alternate character encoding transformations (unless
73    patch provided)
74  - Pretty-printing HTML, users can use Tidy on the output on entire page