1998-10-24 Roland McGrath <roland@baalperazim.frob.com>
[glibc.git] / PROJECTS
blobd5be6313eb87435df7eca1145213f808fcfa9a99
1 Open jobs for finishing GNU libc:
2 ---------------------------------
3 Status: July 1998
5 If you have time and talent to take over any of the jobs below please
6 contact <bug-glibc@gnu.org>.
8 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
9 \f
10 [ 1] Port to new platforms or test current version on formerly supported
11      platforms.
13 **** See http://www.gnu.org/software/libc/porting.html for more details.
16 [ 2] Test compliance with standards.  If you have access to recent
17      standards (IEEE, ISO, ANSI, X/Open, ...) and/or test suites you
18      could do some checks as the goal is to be compliant with all
19      standards if they do not contradict each other.
22 [ 3] The IMHO opinion most important task is to write a more complete
23      test suite.  We cannot get too many people working on this.  It is
24      not difficult to write a test, find a definition of the function
25      which I normally can provide, if necessary, and start writing tests
26      to test for compliance.  Beside this, take a look at the sources
27      and write tests which in total test as many paths of execution as
28      possible.
31 [ 4] Write translations for the GNU libc message for the so far
32      unsupported languages.  GNU libc is fully internationalized and
33      users can immediately benefit from this.
35      Take a look at the matrix in
36         ftp://ftp.gnu.org/pub/gnu/ABOUT-NLS
37      for the current status (of course better use a mirror of ftp.gnu.org).
40 [ 6] Write `long double' versions of the math functions.  This should be
41      done in collaboration with the NetBSD and FreeBSD people.
43      The libm is in fact fdlibm (not the same as in Linux libc).
45 **** Partly done.  But we need someone with numerical experiences for
46      the rest.
49 [ 7] Several math functions have to be written:
51      - exp2
53      with long double arguments.
55      Beside this most of the complex math functions which are new in
56      ISO C 9X should be improved.  Writing some of them in assembler is
57      useful to exploit the parallelism which often is available.
60 [ 8] If you enjoy assembler programming (as I do --drepper :-) you might
61      be interested in writing optimized versions for some functions.
62      Especially the string handling functions can be optimized a lot.
64      Take a look at
66         Faster String Functions
67         Henry Spencer, University of Toronto
68         Usenix Winter '92, pp. 419--428
70      or just ask.  Currently mostly i?86 and Alpha optimized versions
71      exist.  Please ask before working on this to avoid duplicate
72      work.
75 [10] Extend regex and/or rx to work with wide characters and complete
76      implementation of character class and collation class handling.
78      It is planned to do a complete rewrite.
81 [11] Write access function for netmasks, bootparams, and automount
82      databases for nss_files and nss_db module.
83      The functions should be embedded in the nss scheme.  This is not
84      hard and not all services must be supported at once.
87 [14] We need to write a library for on-the-fly transformation of streams
88      of text.  In fact, this would be a recode-library (you know, GNU recode).
89      This is needed in several places in the GNU libc and I already have
90      rather concrete plans but so far no possibility to start this.
92 ***  The library is available, now it remains to be used in the streams.
95 [15] Cleaning up the header files.  Ideally, each header style should
96      follow the "good examples".  Each variable and function should have
97      a short description of the function and its parameters.  The prototypes
98      should always contain variable names which can help to identify their
99      meaning; better than
101                 int foo __P ((int, int, int, int));
103      Blargh!
105 [16] The libio stream file functions should be extended in a way to use
106      mmap to map the file and use it as the buffer to user sees.  For
107      read-only streams this should be rather easy and it avoids all read()
108      calls.
110      A more sophisticated solution would use mmap also for writing.  The
111      standards do not demand that the file on the disk is always in the
112      correct form so it would be possible to enlarge it always according
113      to the page size and install the correct length only for fclose() and
114      fflush() calls.
116 [18] Based on the sprof program we need tools to analyze the output.  The
117      result should be a link map which specifies in which order the .o
118      files are placed in the shared object.  This should help to improve
119      code locality and result in a smaller foorprint (in code and data
120      memory) since less pages are only used in small parts.
122 [19] A user-level STREAMS implementation should be available if the
123      kernel does not provide the support.
125 [20] More conversion modules for iconv(3).  Existing modules should be
126      extended to do things like transliteration if this is wanted.
127      For often used conversion a direct conversion function should be
128      available.
130 [21] The nscd program and the stubs in the libc should be changed so
131      that each program uses only one socket connect.  Take a look at
132         http://www.cygnus.com/~drepper/nscd.html
134 [22] It should be possible to have the information gconv-modules in
135      a simple database which is faster to access.  Using libdb is probably
136      overkill and loading it would probably be slower than reading the
137      plain text file.  But a file format with a simple hash table and
138      some data it points to should be fine.  Probably it should be
139      two tables, one for the aliases, one for the mappings.  The code
140      should start similar to this:
142         if (stat ("gconv-modules", &stp) == 0
143             && stat ("gconv-modules.db", %std) == 0
144             && stp.st_mtime < std.st_mtime)
145           {
146             ... use the database ...
147           {
148         else
149           {
150             ... use the plain file if it exists, otherwise the db ...
151           }
153 [23] The `strptime' function needs to be completed.  This includes among
154      other things that it must get teached about timezones.  The solution
155      envisioned is to extract the timezones from the ADO timezone
156      specifications.  Special care must be given names which are used
157      multiple times.  Here the precedence should (probably) be according
158      to the geograhical distance.  E.g., the timezone EST should be
159      treated as the `Eastern Australia Time' instead of the US `Eastern
160      Standard Time' if the current TZ variable is set to, say,
161      Australia/Canberra or if the current locale is en_AU.