add *r-interactive* variable -- set to 1 if working interactively in Common Lisp
[rclg.git] / README
blob8ed500919571dbc7211cf18fe4561f5a4e00b48b
1  -*- mode: text -*-
3 (we are really in muse mode; but most people don't have it readily
4 available and we aren't forcing the use of Emacs/muse.   M-x muse-mode
5 makes reading easier IMHO).
8 * License 
10 See the file COPYING in the top level directory.
12 * Interfacing Common Lisp and R
14 This library considers multiple approaches for connecting Common Lisp
15 and R, particularly for embedding R within CL.  CLSR also attempts to
16 do the reverse.  RCL is a third approach, which provides more
17 porcelain around the plumbing.  RCLG also tries to use R with the
18 threaded SBCL capability.  All of this will be commented on later (in
19 time, in this file).
22 * Quick start
24 ** Requirements
26 Common Lisp Implementation:
28 A. (WORKS!) SBCL 1.0 and later (known, might work on earlier versions)
30 B. (Goal, but not working yet):  CLISP is a target, but there are a
31    few configuration issues to resolve.
33 You will need the following libraries available:
35 1. ASDF   (system definition facility, for loading packages)
36 2. CFFI   (Common foreign function interface: later than CFFI-060526)
37                                                         (May 26 2006)
38 3. RCLG   (this library)
42 Once you have these, then the simple way to get started is to:
44 1. add rclg.asd to the ASDF systems path.
45 2. See  rclg-demo.lisp  for getting started.  It has incantations for:
46    a. compiling and loading cffi
47    b. compiling and loading rclg
48    c. basic R functions
49    d. basic data conversion.
61 * Past and possibly present "Issues"
63 1. Need to get it working ("again") with CLISP.
65 ** From the file formerly known as NOTES/06032006.rif (date contained)
67 1. In the current version of cffi, the variable names get wrapped in
68    asterisks, so
70 (defcvar "R_CStackLimit"  :unsigned-long)  ;; :unsigned long
71 (defcvar "R_SignalHandlers" :unsigned-long) ;; :unsigned long
73    make variables named *R-CSTACKLIMIT* and *R-SIGNALHANDLERS*
75 2. In "rclg-demo.lisp", I wanted to mention that rnb doesn't mean "no
76    blocking", it means "no backconverting".  It's not that it doesn't
77    protect --- it does all the normal protection, it just doesn't
78    convert the result back from R to Lisp.  It's to avoid pushing big
79    objects back and forth through the pipe needlessly.  In some sense,
80    rnb is what you'd use to do an R assignment, but you get a CL name
81    for whatever it is rather than an R name.
83 3. At this point, it seems like setting *R-SIGNALHANDLERS* to 0 is
84    preventing an immediate seg fault.  So that's good.
86 4. We are still getting errors related to the stack, and I can't
87    actually *find* anything.  Whenever I try to find a function, I'm
88    getting back "Unbound value".  I don't know for sure that this is
89    related to the stack problems.  The equivalent C program does find
90    things.  I've put the C and Lisp programs in subdirectory
91    simple-test.  I'm not sure whether want to be using Rf_findVar or
92    Rf_findFun.
94 5. I'm not sure 100% I'm handling the stack correctly.  On the mailing
95    list, it suggests setting R_CStackLimit = -1.  However, CFFI
96    believes that *R-CSTACKLIMIT* is an unsigned long, and won't let me
97    set it to -1.  I'm seting it to the two's complement value, which
98    is 429476295.  I think this is OK, but tell me if it isn't.
100 6. It is worth noting that Rf_initEmbeddedR *will* change the value of
101    R_CStackLimit.  So it is important to set signalhandlers to 0
102    BEFORE starting R, and then probably set StackLimit afterwards.
103    I've played a bit with going into the R source and turning off the
104    stuff in the initialization that sets it to some value, but that
105    produced an infinite loop of stack checks.
107 7. I had to make a bunch of changes so that all the built-in file
108    constants match my directory structure.  I think it's set up so you
109    only have to change the path in one place now (the defvar of
110    *R-HOME-STR* in rclg-load).
112 ** From the file formerly known as src/NOTES
116 1.R SEXP
118 rclg-types:sexptype
119   "Gets the sexptype of an robj.  WARNING: ASSUMES THAT THE TYPE
120 IS STORED IN THE LOW ORDER 5 BITS OF THE SXPINFO-STRUCT, AND THAT
121 IT CAN BE EXTRACTED VIA A 'mod 32' OPERATION!  MAY NOT BE PORTABLE."
123 2. NAs
126 (defvar *r-NA-internal* -2147483648) ;;  PLATFORM SPECIFIC HACK!!!
129 3. SBCL-specific hacks
131 rclg-convert:sequence-to-robj is sbcl-specific!  Should think about
132 removing rclg-helpers for more portability, if it's fast enough.
134 Consolidate with-gensyms somewhere?
136 We only get r-names and r-dims back at the "toplevel" call to r.
137 Should rnb protect?  Don't think we're using poss-sexp for anything...
139 with-r-traps is SBCL specific.  
140 Multiprocessing stuff (with mutex) is SBCL specific.
142 In R, memory.c contains allocVector.  Looks like it *should* be doable
143 to directly pass vectors around (non-portably, of course).
156 * Comparison of Implementation and Design of RCLG, CLSR.
158 ** Tools to initialize R
160 1. rclg-init : start-rclg update-R
161                start-rclg-update-thread stop-rclg-update-thread 
162                with-R-traps with-r-mutex
164    initialize and maintain the R evaluator process. 
166 2. rclg-load : load-r-libraries  (FFI initializer, not FFI <-> CL specifier.
168    initialize environment and load libraries.
170 3. clsr-loader: uffi-load-r-library (package: clsr)
172 4. clsr : instantiates an R process.
174 ** Tools to handle R data structures and SEXPs in CL
176 1. rclg-access  : r-setcar, r-car, r-cdr
177                   (R SEXP content <-> CL data)
179    low-level defuns for data transport between R SEXPs and CL. 
181 2. rclg-convert : convert-to-r, convert-from-r, *r-na*, r-nil, r-bound
182                   (data type and data conversion)
184 3. rclg-types : SEXP data structure information.  exports types, print method.
186    structures and objects for R internal types
188 4. clsr-rref : High level R SEXP data structures and mappings
190 5. clsr-sxp : SEXP data structures and mappings
192 ** Mappings:  Name (Function/variable), object registry
194 1. rclg-control : r (internal: rname-to-robj, rname-to-rfun
196    primary interface to R evaluator
198 2. clsr-objects : tracks created R objects  in CL (reference counter).
201 ** R evaluation
203 1. rclg-control : r (converts results),
204                   rnb (uneval'd R object, unprotected)
206 1. rclg-parse-objects : tools to handle string commands.
209 ** internal FFI
211 1. rclg-foreigns : maps libR to CL
213 ** CL tools (some R, some general)
215 1. rclg-utils : with-gensyms, over-column-major-indices, to-list, to-vector