.
[emacs.git] / lispref / hash.texi
blob7e2c3c3751c69dac768f628b9272732cfc74026a
1 @c -*-texinfo-*-
2 @c This is part of the GNU Emacs Lisp Reference Manual.
3 @c Copyright (C) 1999 Free Software Foundation, Inc. 
4 @c See the file elisp.texi for copying conditions.
5 @setfilename ../info/hash
6 @node Hash Tables, Symbols, Sequences Arrays Vectors, Top
7 @chapter Hash Tables
8 @cindex hash tables
10   A hash table is a very fast kind of lookup table, somewhat like
11 an alist in that it maps keys to corresponding values.  It differs
12 from an alist in these ways:
14 @itemize @bullet
15 @item
16 Lookup in a hash table is extremely fast---in fact, the time required
17 is essentially @emph{independent} of how many elements are stored
18 in the table.
20 @item
21 The correspondences in a hash table are in no particular order.
23 @item
24 There is no way to share structure between two hash tables,
25 the way two alists can share a common tail.
26 @end itemize
28   Emacs Lisp (starting with Emacs 21) provides a general-purpose hash
29 table data type, along with a series of functions for operating on them.
30 Hash tables have no read syntax, and print in hash notation, like this:
32 @example
33 (make-hash-table)
34      @result{} #<hash-table 'eql nil 0/65 0x83af980>
35 @end example
37   Obarrays are also a kind of hash table, but they are a different type
38 of object and are used only for recording interned symbols
39 (@pxref{Creating Symbols}).
41 @menu
42 * Creating Hash::
43 * Hash Access::
44 * Defining Hash::
45 * Other Hash::
46 @end menu
48 @node Creating Hash
49 @section Creating Hash Tables
51   The principal function for creating a hash table is
52 @code{make-hash-table}.
54 @tindex make-hash-table
55 @defun make-hash-table &rest keyword-args
56 This function creates a new hash table according to the specified
57 arguments.  The arguments should consist of alternating keywords
58 (particular symbols recognized specially) and values corresponding to
59 them.
61 Several keywords make sense in @code{make-hash-table}, but the only two
62 that you really need to know about are @code{:test} and @code{:weak}.
64 @table @code
65 @item :test @var{test}
66 This specifies the method of key lookup for this hash table.  The
67 default is @code{eql}; @code{eq} and @code{equal} are other
68 alternatives:
70 @table @code
71 @item eql
72 Keys which are numbers are ``the same'' if they are equal in value;
73 otherwise, two distinct objects are never ``the same''.
75 @item eq
76 Any two distinct Lisp objects are ``different'' as keys.
78 @item equal
79 Two Lisp objects are ``the same'', as keys, if they are equal
80 according to @code{equal}.
81 @end table
83 You can use @code{define-hash-table-test} (@pxref{Defining Hash}) to
84 define additional possibilities for @var{test}.
86 @item :weakness @var{weak}
87 The weakness of a hash table specifies whether the presence of a key or
88 value in the hash table preserves it from garbage collection.
90 The value, @var{weak}, must be one of @code{nil}, @code{key},
91 @code{value} or @code{t}.  If @var{weak} is @code{key} or @code{t}, then
92 the hash table does not prevent its keys from being collected as garbage
93 (if they are not referenced anywhere else); if a particular key does get
94 collected, the corresponding association is removed from the hash table.
96 Likewise, if @var{weak} is @code{value} or @code{t}, then the hash table
97 does not prevent values from being collected as garbage (if they are not
98 referenced anywhere else); if a particular value does get collected, the
99 corresponding association is removed from the hash table.
101 The default for @var{weak} is @code{nil}, so that all keys and values
102 referenced in the hash table are preserved from garbage collection.  If
103 @var{weak} is @code{t}, neither keys nor values are protected (that is,
104 both are weak).
106 @item :size @var{size}
107 This specifies a hint for how many associations you plan to store in the
108 hash table.  If you know the approximate number, you can make things a
109 little more efficient by specifying it this way.  If you specify to
110 small a size, the hash table will grow automatically when necessary, but
111 doing that takes some extra time,
113 The default size is 65.
115 @item :rehash-size @var{rehash-size}
116 When you add an association to a hash table and the table is ``full,''
117 it grows automatically.  This value specifies how to make the hash table
118 larger, at that time.
120 If @var{rehash-size} is an integer, it should be positive, and the hash
121 table grows by adding that much to the nominal size.  If
122 @var{rehash-size} is a floating point number, it had better be greater
123 than 1, and the hash table grows by multiplying the old size by that
124 number.
126 The default value is 1.5.
128 @item :rehash-threshold @var{threshold}
129 This specifies the criterion for when the hash table is ``full.''  The
130 value, @var{threshold}, should be a positive floating point number, no
131 greater than 1.  The hash table is ``full'' whenever the actual number of
132 entries exceeds this fraction of the nominal size.  The default for
133 @var{threshold} is 0.8.
134 @end table
135 @end defun
137 @tindex makehash
138 @defun makehash &optional test
139 This is equivalent to @code{make-hash-table}, but with a different style
140 argument list.  The argument @var{test} specifies the method
141 of key lookup.
143 If you want to specify other parameters, you should use
144 @code{make-hash-table}.
145 @end defun
147 @node Hash Access
148 @section Hash Table Access
150   This section describes the functions for accessing and storing
151 associations in a hash table.
153 @tindex gethash
154 @defun gethash key table &optional default
155 This function looks up @var{key} in @var{table}, and returns its
156 associated @var{value}---or @var{default}, if @var{key} has no
157 association in @var{table}.
158 @end defun
160 @tindex puthash
161 @defun puthash key value table 
162 This function enters an association for @var{key} in @var{table}, with
163 value @var{value}.  If @var{key} already has an association in
164 @var{table}, @var{value} replaces the old associated value.
165 @end defun
167 @tindex remhash
168 @defun remhash key table
169 This function removes the association for @var{key} from @var{table}, if
170 there is one.  If @var{key} has no association, @code{remhash} does
171 nothing.
172 @end defun
174 @tindex clrhash
175 @defun clrhash table
176 This function removes all the associations from hash table @var{table},
177 so that it becomes empty.  This is also called @dfn{clearing} the hash
178 table.
179 @end defun
181 @tindex maphash
182 @defun maphash function table
183 This function calls @var{function} once for each of the associations in
184 @var{table}.  The function @var{function} should accept two
185 arguments---a @var{key} listed in @var{table}, and its associated
186 @var{value}.
187 @end defun
189 @node Defining Hash
190 @section Defining Hash Comparisons
191 @cindex hash code
193   You can define new methods of key lookup by means of
194 @code{define-hash-table-test}.  In order to use this feature, you need
195 to understand how hash tables work, and what a @dfn{hash code} means.
197   You can think of a hash table conceptually as a large array of many
198 slots, each capable of holding one association.  To look up a key,
199 @code{gethash} first computes an integer, the hash code, from the key.
200 It reduces this integer modulo the length of the array, to produce an
201 index in the array.  Then it looks in that slot, and if necessary in
202 other nearby slots, to see if it has found the key being sought.
204   Thus, to define a new method of key lookup, you need to specify both a
205 function to compute the hash code from a key, and a function to compare
206 two keys directly.
208 @tindex define-hash-table-test
209 @defun define-hash-table-test name test-fn hash-fn
210 This function defines a new hash table test, named @var{name}.
212 After defining @var{name} in this way, you can use it as the @var{test}
213 argument in @code{make-hash-table}.  When you do that, the hash table
214 will use @var{test-fn} to compare key values, and @var{hash-fn} to compute
215 a ``hash code'' from a key value.
217 The function @var{test-fn} should accept two arguments, two keys, and
218 return non-@code{nil} if they are considered ``the same.''
220 The function @var{hash-fn} should accept one argument, a key, and return
221 an integer that is the ``hash code'' of that key.  For good results, the
222 function should use the whole range of integer values for hash codes,
223 including negative integers.
225 The specified functions are stored in the property list of @var{name}
226 under the property @code{hash-table-test}; the property value's form is
227 @code{(@var{test-fn} @var{hash-fn})}.
229 This example creates a hash table whose keys are strings that are
230 compared case-insensitively.
232 @example
233 (defun case-fold-string= (a b)
234   (compare-strings a nil nil b nil nil t))
236 (defun case-fold-string-hash (a)
237   (sxhash (upcase a)))
239 (define-hash-table-test 'case-fold 'case-fold-string= 
240                         'case-fold-string-hash))
242 (make-hash-table :test 'case-fold)
243 @end example
244 @end defun
246 @tindex sxhash
247 @defun sxhash obj
248 This function returns a hash code for Lisp object @var{obj}.
249 This is an integer which reflects the contents of @var{obj}
250 and the other Lisp objects it points to.
252 If two objects @var{obj1} and @var{obj2} are equal, then @code{(sxhash
253 @var{obj1})} and @code{(sxhash @var{obj2})} are the same integer.
255 If the two objects are not equal, the values returned by @code{sxhash}
256 are usually different, but not always; but once in a rare while, by
257 luck, you will encounter two distinct-looking objects that give the same
258 result from @code{sxhash}.
259 @end defun
261 @node Other Hash
262 @section Other Hash Table Functions
264   Here are some other functions for working with hash tables.
266 @tindex hash-table-p
267 @defun hash-table-p table
268 This returns non-@code{nil} if @var{table} is a hash table object.
269 @end defun
271 @tindex copy-hash-table
272 @defun copy-hash-table table
273 This function creates and returns a copy of @var{table}.  Only the table
274 itself is copied---the keys and values are shared.
275 @end defun
277 @tindex hash-table-count
278 @defun hash-table-count table
279 This function returns the actual number of entries in @var{table}.
280 @end defun
282 @tindex hash-table-rehash-test
283 @defun hash-table-rehash-test table
284 This returns the @var{test} value that was given when @var{table} was
285 created, to specify how to hash and compare keys.  See
286 @code{make-hash-table} (@pxref{Creating Hash}).
287 @end defun
289 @tindex hash-table-weakness
290 @defun hash-table-weakness table
291 This function returns the @var{weak} value that was specified for hash
292 table @var{table}.
293 @end defun
295 @tindex hash-table-rehash-size
296 @defun hash-table-rehash-size table
297 This returns the rehash size of @var{table}.
298 @end defun
300 @tindex hash-table-rehash-threshold
301 @defun hash-table-rehash-threshold table
302 This returns the rehash threshold of @var{table}.
303 @end defun
305 @tindex hash-table-rehash-size
306 @defun hash-table-rehash-size table
307 This returns the current nominal size of @var{table}.
308 @end defun