* verify.c (verify_jvm_instructions): Fix typo.
[official-gcc.git] / libstdc++-v3 / porting.texi
blob9114806b63f580422444635be7b0120587b80f1f
1 \input texinfo
3 @c ---------------------------------------------------------------------
4 @c Prologue
5 @c ---------------------------------------------------------------------
7 @setfilename porting.info
8 @settitle Porting libstdc++-v3
9 @setchapternewpage odd
11 @ifinfo
12 This file explains how to port libstdc++-v3 (the GNU C++ library) to 
13 a new target.
15 Copyright (c) 2000, 2001 Free Software Foundation, Inc.
16 @end ifinfo
18 @c ---------------------------------------------------------------------
19 @c Titlepage
20 @c ---------------------------------------------------------------------
22 @titlepage
23 @title Porting libstdc++-v3
24 @author Mark Mitchell
25 @page
26 @vskip 0pt plus 1filll
27 Copyright @copyright{} 2000, 2001 Free Software Foundation, Inc.
29 Permission is granted to copy, distribute and/or modify this document
30 under the terms of the GNU Free Documentation License, Version 1.1 or
31 any later version published by the Free Software Foundation; with the
32 Invariant Sections being ``GNU General Public License'', the Front-Cover
33 texts being (a) (see below), and with the Back-Cover Texts being (b)
34 (see below).  A copy of the license is included in the section entitled
35 ``GNU Free Documentation License''.
37 (a) The FSF's Front-Cover Text is:
39      A GNU Manual
41 (b) The FSF's Back-Cover Text is:
43      You have freedom to copy and modify this GNU Manual, like GNU
44      software.  Copies published by the Free Software Foundation raise
45      funds for GNU development.
46 @end titlepage
48 @c ---------------------------------------------------------------------
49 @c Top
50 @c ---------------------------------------------------------------------
52 @node Top
53 @top Porting libstdc++-v3
55 This document explains how to port libstdc++-v3 (the GNU C++ library) to 
56 a new target.
58 In order to make the GNU C++ library (libstdc++-v3) work with a new
59 target, you must edit some configuration files and provide some new
60 header files.  
62 Before you get started, make sure that you have a working C library on
63 your target.  The C library need not precisely comply with any
64 particular standard, but should generally conform to the requirements
65 imposed by the ANSI/ISO standard.
67 In addition, you should try to verify that the C++ compiler generally
68 works.  It is difficult to test the C++ compiler without a working
69 library, but you should at least try some minimal test cases.
71 Here are the primary steps required to port the library:
73 @menu
74 * Operating system::    Configuring for your operating system.
75 * Character types::     Implementing character classification.
76 * Thread safety::       Implementing atomic operations.
77 * Numeric limits::      Implementing numeric limits.
78 * Libtool::             Using libtool.
79 * GNU Free Documentation License:: How you can copy and share this manual.
80 @end menu
82 @c ---------------------------------------------------------------------
83 @c Operating system
84 @c ---------------------------------------------------------------------
86 @node Operating system
87 @chapter Operating system
89 If you are porting to a new operating-system (as opposed to a new chip
90 using an existing operating system), you will need to create a new
91 directory in the @file{config/os} hierarchy.  For example, the IRIX
92 configuration files are all in @file{config/os/irix}.  There is no set
93 way to organize the OS configuration directory.  For example,
94 @file{config/os/solaris/solaris-2.6} and
95 @file{config/os/solaris/solaris-2.7} are used as configuration
96 directories for these two versions of Solaris.  On the other hand, both
97 Solaris 2.7 and Solaris 2.8 use the @file{config/os/solaris/solaris-2.7}
98 directory.  The important information is that there needs to be a
99 directory under @file{config/os} to store the files for your operating
100 system.
102 You'll have to change the @file{configure.target} file to ensure that
103 your new directory is activated.  Look for the switch statement that
104 sets @code{os_include_dir}, and add a pattern to handle your operating
105 system.  The switch statement switches on only the OS portion of the
106 standard target triplet; e.g., the @code{solaris2.8} in
107 @code{sparc-sun-solaris2.8}.
109 The first file to create in this directory, should be called
110 @file{bits/os_defines.h}.  This file contains basic macro definitions
111 that are required to allow the C++ library to work with your C library.
112 This file should provide macro definitions for @code{__off_t},
113 @code{__off64_t}, and @code{__ssize_t}.  Typically, this just looks
114 like:
116 @example
117 #define __off_t off_t
118 #define __off64_t off64_t
119 #define __ssize_t ssize_t
120 @end example
122 @noindent
123 You don't have to provide these definitions if your system library
124 already defines these types -- but the only library known to provide
125 these types is the GNU C Library, so you will almost certainly have to
126 provide these macros.  Note that this file does not have to include a
127 header file that defines @code{off_t}, or the other types; you simply
128 have to provide the macros.
130 In addition, several libstdc++-v3 source files unconditionally define
131 the macro @code{_POSIX_SOURCE}.  On many systems, defining this macro
132 causes large portions of the C library header files to be eliminated
133 at preprocessing time.  Therefore, you may have to @code{#undef} this
134 macro, or define other macros (like @code{_LARGEFILE_SOURCE} or
135 @code{__EXTENSIONS__}).  You won't know what macros to define or
136 undefine at this point; you'll have to try compiling the library and
137 seeing what goes wrong.  If you see errors about calling functions
138 that have not been declared, look in your C library headers to see if
139 the functions are declared there, and then figure out what macros you
140 need to define.  You will need to add them to the
141 @code{CPLUSPLUS_CPP_SPEC} macro in the GCC configuration file for your
142 target.  It will not work to simply define these macros in
143 @file{os_defines.h}.
145 At this time, there are two libstdc++-v3-specific macros which may be
146 defined.  @code{_G_USING_THUNKS} may be defined to 0 to express that the
147 port doesn't use thunks (although it is unclear that this is still
148 useful since libio support isn't currently working and the g++ v3 ABI
149 invalidates the assumption that some ports don't use thunks).
150 @code{_GLIBCPP_AVOID_FSEEK} may be defined if seeking on an interactive
151 stream (or one hooked to a pipe) is not allowed by the OS.  In this
152 case, getc()/ungetc() will be used at some key locations in the library
153 implementation instead of fseek().  Currently, the code path to avoid
154 fseek() is only enabled when the seek size is 1 character away from the
155 current stream position.  This is known to improve *-unknown-freebsd*
156 and sparc-sun-solaris2.*.
158 Finally, you should bracket the entire file in an include-guard, like
159 this:
161 @example
162 #ifndef _GLIBCPP_OS_DEFINES
163 #define _GLIBCPP_OS_DEFINES
165 #endif
166 @end example
168 We recommend copying an existing @file{bits/os_defines.h} to use as a
169 starting point.
171 @c ---------------------------------------------------------------------
172 @c Character types
173 @c ---------------------------------------------------------------------
175 @node Character types
176 @chapter Character types
178 The library requires that you provide three header files to implement
179 character classification, analagous to that provided by the C libraries
180 @file{<ctype.h>} header.  You can model these on the files provided in
181 @file{config/os/generic/bits}.  However, these files will almost
182 certainly need some modification.
184 The first file to write is @file{bits/ctype_base.h}.  This file provides
185 some very basic information about character classification.  The libstdc++-v3
186 library assumes that your C library implements @file{<ctype.h>} by using
187 a table (indexed by character code) containing integers, where each of
188 these integers is a bit-mask indicating whether the charcter is
189 upper-case, lower-case, alphabetic, etc.  The @file{bits/ctype_base.h}
190 file gives the type of the integer, and the values of the various bit
191 masks.  You will have to peer at your own @file{<ctype.h>} to figure out
192 how to define the values required by this file.
194 The @file{bits/ctype_base.h} header file does not need include guards.
195 It should contain a single @code{struct} definition called
196 @code{ctype_base}.  This @code{struct} should contain two type
197 declarations, and one enumeration declaration, like this example, taken
198 from the IRIX configuration:
200 @example
201 struct ctype_base
203   typedef unsigned int  mask;
204   typedef int*          __to_type;
206   enum
207   @{
208     space = _ISspace,
209     print = _ISprint,
210     cntrl = _IScntrl,
211     upper = _ISupper,
212     lower = _ISlower,
213     alpha = _ISalpha,
214     digit = _ISdigit,
215     punct = _ISpunct,
216     xdigit = _ISxdigit,
217     alnum = _ISalnum,
218     graph = _ISgraph
219   @};
221 @end example
223 @noindent
224 The @code{mask} type is the type of the elements in the table.  If your
225 C library uses a table to map lower-case numbers to upper-case numbers,
226 and vice versa, you should define @code{__to_type} to be the type of the
227 elements in that table.  If you don't mind taking a minor performance
228 penalty, or if your library doesn't implement @code{toupper} and
229 @code{tolower} in this way, you can pick any pointer-to-integer type,
230 but you must still define the type.
232 The enumeration should give definitions for all the values in the above
233 example, using the values from your native @file{<ctype.h>}.  They can
234 be given symbolically (as above), or numerically, if you prefer.  You do
235 not have to include @file{<ctype.h>} in this header; it will always be
236 included before @file{bits/ctype_base.h} is included.
238 The next file to write is @file{bits/ctype_noninline.h}, which also does
239 not require include guards.  This file defines a few member functions
240 that will be included in @file{include/bits/locale_facets.h}.  The first
241 function that must be written is the @code{ctype<char>::ctype}
242 constructor.  Here is the IRIX example:
244 @example
245 ctype<char>::ctype(const mask* __table = 0, bool __del = false, 
246       size_t __refs = 0)
247   : _Ctype_nois<char>(__refs), _M_del(__table != 0 && __del), 
248     _M_toupper(NULL),
249     _M_tolower(NULL),
250     _M_ctable(NULL), 
251     _M_table(!__table
252              ? (const mask*) (__libc_attr._ctype_tbl->_class + 1)
253              : __table) 
254   @{ @}
255 @end example
257 @noindent
258 There are two parts of this that you might choose to alter. The first,
259 and most important, is the line involving @code{__libc_attr}.  That is
260 IRIX system-dependent code that gets the base of the table mapping
261 character codes to attributes.  You need to substitute code that obtains
262 the address of this table on your system.  If you want to use your
263 operating system's tables to map upper-case letters to lower-case, and
264 vice versa, you should initialize @code{_M_toupper} and
265 @code{_M_tolower} with those tables, in similar fashion.
267 Now, you have to write two functions to convert from upper-case to
268 lower-case, and vice versa.  Here are the IRIX versions:
270 @example
271 char
272 ctype<char>::do_toupper(char __c) const
273 @{ return _toupper(__c); @}
275 char
276 ctype<char>::do_tolower(char __c) const
277 @{ return _tolower(__c); @}
278 @end example
280 @noindent
281 Your C library provides equivalents to IRIX's @code{_toupper} and
282 @code{_tolower}.  If you initialized @code{_M_toupper} and
283 @code{_M_tolower} above, then you could use those tables instead.
285 Finally, you have to provide two utility functions that convert strings
286 of characters.  The versions provided here will always work -- but you
287 could use specialized routines for greater performance if you have
288 machinery to do that on your system:
290 @example
291 const char*
292 ctype<char>::do_toupper(char* __low, const char* __high) const
294   while (__low < __high)
295     @{
296       *__low = do_toupper(*__low);
297       ++__low;
298     @}
299   return __high;
302 const char* 
303 ctype<char>::do_tolower(char* __low, const char* __high) const
305   while (__low < __high)
306     @{
307       *__low = do_tolower(*__low);
308       ++__low;
309     @}
310   return __high;
312 @end example
314 You must also provide the @file{bits/ctype_inline.h} file, which
315 contains a few more functions.  On most systems, you can just copy
316 @file{config/os/generic/ctype_inline.h} and use it on your system.
318 In detail, the functions provided test characters for particular
319 properties; they are analagous to the functions like @code{isalpha} and
320 @code{islower} provided by the C library.
322 The first function is implemented like this on IRIX:
324 @example
325 bool
326 ctype<char>::
327 is(mask __m, char __c) const throw()
328 @{ return (_M_table)[(unsigned char)(__c)] & __m; @}
329 @end example
331 @noindent
332 The @code{_M_table} is the table passed in above, in the constructor.
333 This is the table that contains the bitmasks for each character.  The
334 implementation here should work on all systems.
336 The next function is:
338 @example
339 const char*
340 ctype<char>::
341 is(const char* __low, const char* __high, mask* __vec) const throw()
343   while (__low < __high)
344     *__vec++ = (_M_table)[(unsigned char)(*__low++)];
345   return __high;
347 @end example
349 @noindent
350 This function is similar; it copies the masks for all the characters
351 from @code{__low} up until @code{__high} into the vector given by
352 @code{__vec}.
354 The last two functions again are entirely generic:
356 @example
357 const char*
358 ctype<char>::
359 scan_is(mask __m, const char* __low, const char* __high) const throw()
361   while (__low < __high && !this->is(__m, *__low))
362     ++__low;
363   return __low;
366 const char*
367 ctype<char>::
368 scan_not(mask __m, const char* __low, const char* __high) const throw()
370   while (__low < __high && this->is(__m, *__low))
371     ++__low;
372   return __low;
374 @end example
376 @c ---------------------------------------------------------------------
377 @c Thread safety
378 @c ---------------------------------------------------------------------
380 @node Thread safety
381 @chapter Thread safety
383 The C++ library string functionality requires a couple of atomic
384 operations to provide thread-safety.  If you don't take any special
385 action, the library will use stub versions of these functions that are
386 not thread-safe.  They will work fine, unless your applications are
387 multi-threaded.
389 If you want to provide custom, safe, versions of these functions, there
390 are two distinct approaches.  One is to provide a version for your CPU,
391 using assembly language constructs.  The other is to use the
392 thread-safety primitives in your operating system.  In either case, you
393 make a file called @file{bits/atomicity.h}.  
395 If you are using the assembly-language approach, put this code in
396 @file{config/cpu/<chip>/bits/atomicity.h}, where chip is the name of
397 your processor.  In that case, edit the switch statement in
398 @file{configure.target} to set the @code{cpu_include_dir}.  In either
399 case, set the switch statement that sets @code{ATOMICITYH} to be the
400 directory containing @file{bits/atomicity.h}.
402 With those bits out of the way, you have to actually write
403 @file{bits/atomicity.h} itself.  This file should be wrapped in an
404 include guard named @code{_BITS_ATOMICITY_H}.  It should define one
405 type, and two functions.  
407 The type is @code{_Atomic_word}.  Here is the version used on IRIX:
409 @example
410 typedef long _Atomic_word;
411 @end example
413 @noindent
414 This type must be a signed integral type supporting atomic operations.
415 If you're using the OS approach, use the same type used by your system's
416 primitives.  Otherwise, use the type for which your CPU provides atomic
417 primitives.
419 Then, you must provide two functions.  The bodies of these functions
420 must be equivalent to those provided here, but using atomic operations:
422 @example
423 static inline _Atomic_word
424 __attribute__ ((__unused__))
425 __exchange_and_add (_Atomic_word* __mem, int __val)
427   _Atomic_word __result = *__mem;
428   *__mem += __val;
429   return __result;
432 static inline void
433 __attribute__ ((__unused__))
434 __atomic_add (_Atomic_word* __mem, int __val)
436   *__mem += __val;
438 @end example
440 @c ---------------------------------------------------------------------
441 @c Numeric limits
442 @c ---------------------------------------------------------------------
444 @node Numeric limits
445 @chapter Numeric limits
447 The C++ library requires information about the fundamental data types,
448 such as the minimum and maximum representable values of each type.
449 You can define each of these values individually, but it is usually
450 easiest just to indicate how many bits are used in each of the data
451 types and let the library do the rest.  For information about the
452 macros to define, see the top of @file{include/bits/std_limits.h}.
454 If you need to define any macros, you can do so in
455 @file{os_defines.h}.  However, if all operating systems for your CPU
456 are likely to use the same values, you can provide a CPU-specific file
457 instead so that you do not have to provide the same definitions for
458 each operating system.  To take that approach, create a new file
459 called @file{limits.h} in your CPU configuration directory (e.g.,
460 @file{config/cpu/i386/bits}) and then modify @file{configure.target}
461 so that @code{LIMITSH} is set to the CPU directory (e.g.,
462 @file{config/cpu/i386}).  Note that @code{LIMITSH} should not include
463 the @samp{bits} part of the directory name.
465 @c ---------------------------------------------------------------------
466 @c Libtool
467 @c ---------------------------------------------------------------------
469 @node Libtool
470 @chapter Libtool
472 The C++ library is compiled, archived and linked with libtool.
473 Explaining the full workings of libtool is beyond the scope of this
474 document, but there are a few, particular bits that are necessary for
475 porting.
477 Some parts of the libstdc++-v3 library are compiled with the libtool
478 @code{--tags CXX} option (the C++ definitions for libtool).  Therefore,
479 @file{ltcf-cxx.sh} in the top-level directory needs to have the correct
480 logic to compile and archive objects equivalent to the C version of libtool,
481 @file{ltcf-c.sh}.  Some libtool targets have definitions for C but not
482 for C++, or C++ definitions which have not been kept up to date.
484 The C++ run-time library contains initialization code that needs to be
485 run as the library is loaded.  Often, that requires linking in special
486 object files when the C++ library is built as a shared library, or
487 taking other system-specific actions.
489 The libstdc++-v3 library is linked with the C version of libtool, even though it
490 is a C++ library.  Therefore, the C version of libtool needs to ensure
491 that the run-time library initializers are run.  The usual way to do
492 this is to build the library using @code{gcc -shared}.
494 If you need to change how the library is linked, look at
495 @file{ltcf-c.sh} in the top-level directory.  Find the switch statement
496 that sets @code{archive_cmds}.  Here, adjust the setting for your
497 operating system.
499 @c ---------------------------------------------------------------------
500 @c GFDL
501 @c ---------------------------------------------------------------------
503 @include fdl.texi
505 @c ---------------------------------------------------------------------
506 @c Epilogue
507 @c ---------------------------------------------------------------------
509 @contents
510 @bye