Fix a crash that could occur in fts5 'secure-delete' mode when operating on corrupt...
[sqlite.git] / README.md
blob0df8b58c231246158fdf77aaaa5573f6f653e271
1 <h1 align="center">SQLite Source Repository</h1>
3 This repository contains the complete source code for the
4 [SQLite database engine](https://sqlite.org/).  Some test scripts
5 are also included.  However, many other test scripts
6 and most of the documentation are managed separately.
8 ## Version Control
10 SQLite sources are managed using
11 [Fossil](https://www.fossil-scm.org/), a distributed version control system
12 that was specifically designed and written to support SQLite development.
13 The [Fossil repository](https://sqlite.org/src/timeline) contains the urtext.
15 If you are reading this on GitHub or some other Git repository or service,
16 then you are looking at a mirror.  The names of check-ins and
17 other artifacts in a Git mirror are different from the official
18 names for those objects.  The official names for check-ins are
19 found in a footer on the check-in comment for authorized mirrors.
20 The official check-in name can also be seen in the `manifest.uuid` file
21 in the root of the tree.  Always use the official name, not  the
22 Git-name, when communicating about an SQLite check-in.
24 If you pulled your SQLite source code from a secondary source and want to
25 verify its integrity, there are hints on how to do that in the
26 [Verifying Code Authenticity](#vauth) section below.
28 ## Obtaining The Code
30 If you do not want to use Fossil, you can download tarballs or ZIP
31 archives or [SQLite archives](https://sqlite.org/cli.html#sqlar) as follows:
33   *  Latest trunk check-in as
34      [Tarball](https://www.sqlite.org/src/tarball/sqlite.tar.gz),
35      [ZIP-archive](https://www.sqlite.org/src/zip/sqlite.zip), or
36      [SQLite-archive](https://www.sqlite.org/src/sqlar/sqlite.sqlar).
38   *  Latest release as
39      [Tarball](https://www.sqlite.org/src/tarball/sqlite.tar.gz?r=release),
40      [ZIP-archive](https://www.sqlite.org/src/zip/sqlite.zip?r=release), or
41      [SQLite-archive](https://www.sqlite.org/src/sqlar/sqlite.sqlar?r=release).
43   *  For other check-ins, substitute an appropriate branch name or
44      tag or hash prefix in place of "release" in the URLs of the previous
45      bullet.  Or browse the [timeline](https://www.sqlite.org/src/timeline)
46      to locate the check-in desired, click on its information page link,
47      then click on the "Tarball" or "ZIP Archive" links on the information
48      page.
50 If you do want to use Fossil to check out the source tree,
51 first install Fossil version 2.0 or later.
52 (Source tarballs and precompiled binaries available
53 [here](https://www.fossil-scm.org/fossil/uv/download.html).  Fossil is
54 a stand-alone program.  To install, simply download or build the single
55 executable file and put that file someplace on your $PATH.)
56 Then run commands like this:
58         mkdir -p ~/sqlite ~/Fossils
59         cd ~/sqlite
60         fossil clone https://www.sqlite.org/src ~/Fossils/sqlite.fossil
61         fossil open ~/Fossils/sqlite.fossil
63 After setting up a repository using the steps above, you can always
64 update to the latest version using:
66         fossil update trunk   ;# latest trunk check-in
67         fossil update release ;# latest official release
69 Or type "fossil ui" to get a web-based user interface.
71 ## Compiling for Unix-like systems
73 First create a directory in which to place
74 the build products.  It is recommended, but not required, that the
75 build directory be separate from the source directory.  Cd into the
76 build directory and then from the build directory run the configure
77 script found at the root of the source tree.  Then run "make".
79 For example:
81         tar xzf sqlite.tar.gz    ;#  Unpack the source tree into "sqlite"
82         mkdir bld                ;#  Build will occur in a sibling directory
83         cd bld                   ;#  Change to the build directory
84         ../sqlite/configure      ;#  Run the configure script
85         make                     ;#  Run the makefile.
86         make sqlite3.c           ;#  Build the "amalgamation" source file
87         make test                ;#  Run some tests (requires Tcl)
89 See the makefile for additional targets.
91 The configure script uses autoconf 2.61 and libtool.  If the configure
92 script does not work out for you, there is a generic makefile named
93 "Makefile.linux-gcc" in the top directory of the source tree that you
94 can copy and edit to suit your needs.  Comments on the generic makefile
95 show what changes are needed.
97 ## Using MSVC for Windows systems
99 On Windows, all applicable build products can be compiled with MSVC.
100 First open the command prompt window associated with the desired compiler
101 version (e.g. "Developer Command Prompt for VS2013").  Next, use NMAKE
102 with the provided "Makefile.msc" to build one of the supported targets.
104 For example, from the parent directory of the source subtree named "sqlite":
106         mkdir bld
107         cd bld
108         nmake /f ..\sqlite\Makefile.msc TOP=..\sqlite
109         nmake /f ..\sqlite\Makefile.msc sqlite3.c TOP=..\sqlite
110         nmake /f ..\sqlite\Makefile.msc sqlite3.dll TOP=..\sqlite
111         nmake /f ..\sqlite\Makefile.msc sqlite3.exe TOP=..\sqlite
112         nmake /f ..\sqlite\Makefile.msc test TOP=..\sqlite
114 There are several build options that can be set via the NMAKE command
115 line.  For example, to build for WinRT, simply add "FOR_WINRT=1" argument
116 to the "sqlite3.dll" command line above.  When debugging into the SQLite
117 code, adding the "DEBUG=1" argument to one of the above command lines is
118 recommended.
120 SQLite does not require [Tcl](http://www.tcl.tk/) to run, but a Tcl installation
121 is required by the makefiles (including those for MSVC).  SQLite contains
122 a lot of generated code and Tcl is used to do much of that code generation.
124 ## Source Code Tour
126 Most of the core source files are in the **src/** subdirectory.  The
127 **src/** folder also contains files used to build the "testfixture" test
128 harness. The names of the source files used by "testfixture" all begin
129 with "test".
130 The **src/** also contains the "shell.c" file
131 which is the main program for the "sqlite3.exe"
132 [command-line shell](https://sqlite.org/cli.html) and
133 the "tclsqlite.c" file which implements the
134 [Tcl bindings](https://sqlite.org/tclsqlite.html) for SQLite.
135 (Historical note:  SQLite began as a Tcl
136 extension and only later escaped to the wild as an independent library.)
138 Test scripts and programs are found in the **test/** subdirectory.
139 Additional test code is found in other source repositories.
140 See [How SQLite Is Tested](http://www.sqlite.org/testing.html) for
141 additional information.
143 The **ext/** subdirectory contains code for extensions.  The
144 Full-text search engine is in **ext/fts3**.  The R-Tree engine is in
145 **ext/rtree**.  The **ext/misc** subdirectory contains a number of
146 smaller, single-file extensions, such as a REGEXP operator.
148 The **tool/** subdirectory contains various scripts and programs used
149 for building generated source code files or for testing or for generating
150 accessory programs such as "sqlite3_analyzer(.exe)".
152 ### Generated Source Code Files
154 Several of the C-language source files used by SQLite are generated from
155 other sources rather than being typed in manually by a programmer.  This
156 section will summarize those automatically-generated files.  To create all
157 of the automatically-generated files, simply run "make target&#95;source".
158 The "target&#95;source" make target will create a subdirectory "tsrc/" and
159 fill it with all the source files needed to build SQLite, both
160 manually-edited files and automatically-generated files.
162 The SQLite interface is defined by the **sqlite3.h** header file, which is
163 generated from src/sqlite.h.in, ./manifest.uuid, and ./VERSION.  The
164 [Tcl script](http://www.tcl.tk) at tool/mksqlite3h.tcl does the conversion.
165 The manifest.uuid file contains the SHA3 hash of the particular check-in
166 and is used to generate the SQLITE\_SOURCE\_ID macro.  The VERSION file
167 contains the current SQLite version number.  The sqlite3.h header is really
168 just a copy of src/sqlite.h.in with the source-id and version number inserted
169 at just the right spots. Note that comment text in the sqlite3.h file is
170 used to generate much of the SQLite API documentation.  The Tcl scripts
171 used to generate that documentation are in a separate source repository.
173 The SQL language parser is **parse.c** which is generated from a grammar in
174 the src/parse.y file.  The conversion of "parse.y" into "parse.c" is done
175 by the [lemon](./doc/lemon.html) LALR(1) parser generator.  The source code
176 for lemon is at tool/lemon.c.  Lemon uses the tool/lempar.c file as a
177 template for generating its parser.
178 Lemon also generates the **parse.h** header file, at the same time it
179 generates parse.c.
181 The **opcodes.h** header file contains macros that define the numbers
182 corresponding to opcodes in the "VDBE" virtual machine.  The opcodes.h
183 file is generated by scanning the src/vdbe.c source file.  The
184 Tcl script at ./mkopcodeh.tcl does this scan and generates opcodes.h.
185 A second Tcl script, ./mkopcodec.tcl, then scans opcodes.h to generate
186 the **opcodes.c** source file, which contains a reverse mapping from
187 opcode-number to opcode-name that is used for EXPLAIN output.
189 The **keywordhash.h** header file contains the definition of a hash table
190 that maps SQL language keywords (ex: "CREATE", "SELECT", "INDEX", etc.) into
191 the numeric codes used by the parse.c parser.  The keywordhash.h file is
192 generated by a C-language program at tool mkkeywordhash.c.
194 The **pragma.h** header file contains various definitions used to parse
195 and implement the PRAGMA statements.  The header is generated by a
196 script **tool/mkpragmatab.tcl**. If you want to add a new PRAGMA, edit
197 the **tool/mkpragmatab.tcl** file to insert the information needed by the
198 parser for your new PRAGMA, then run the script to regenerate the
199 **pragma.h** header file.
201 ### The Amalgamation
203 All of the individual C source code and header files (both manually-edited
204 and automatically-generated) can be combined into a single big source file
205 **sqlite3.c** called "the amalgamation".  The amalgamation is the recommended
206 way of using SQLite in a larger application.  Combining all individual
207 source code files into a single big source code file allows the C compiler
208 to perform more cross-procedure analysis and generate better code.  SQLite
209 runs about 5% faster when compiled from the amalgamation versus when compiled
210 from individual source files.
212 The amalgamation is generated from the tool/mksqlite3c.tcl Tcl script.
213 First, all of the individual source files must be gathered into the tsrc/
214 subdirectory (using the equivalent of "make target_source") then the
215 tool/mksqlite3c.tcl script is run to copy them all together in just the
216 right order while resolving internal "#include" references.
218 The amalgamation source file is more than 200K lines long.  Some symbolic
219 debuggers (most notably MSVC) are unable to deal with files longer than 64K
220 lines.  To work around this, a separate Tcl script, tool/split-sqlite3c.tcl,
221 can be run on the amalgamation to break it up into a single small C file
222 called **sqlite3-all.c** that does #include on about seven other files
223 named **sqlite3-1.c**, **sqlite3-2.c**, ..., **sqlite3-7.c**.  In this way,
224 all of the source code is contained within a single translation unit so
225 that the compiler can do extra cross-procedure optimization, but no
226 individual source file exceeds 32K lines in length.
228 ## How It All Fits Together
230 SQLite is modular in design.
231 See the [architectural description](http://www.sqlite.org/arch.html)
232 for details. Other documents that are useful in
233 (helping to understand how SQLite works include the
234 [file format](http://www.sqlite.org/fileformat2.html) description,
235 the [virtual machine](http://www.sqlite.org/opcode.html) that runs
236 prepared statements, the description of
237 [how transactions work](http://www.sqlite.org/atomiccommit.html), and
238 the [overview of the query planner](http://www.sqlite.org/optoverview.html).
240 Years of effort have gone into optimizing SQLite, both
241 for small size and high performance.  And optimizations tend to result in
242 complex code.  So there is a lot of complexity in the current SQLite
243 implementation.  It will not be the easiest library in the world to hack.
245 Key files:
247   *  **sqlite.h.in** - This file defines the public interface to the SQLite
248      library.  Readers will need to be familiar with this interface before
249      trying to understand how the library works internally.
251   *  **sqliteInt.h** - this header file defines many of the data objects
252      used internally by SQLite.  In addition to "sqliteInt.h", some
253      subsystems have their own header files.
255   *  **parse.y** - This file describes the LALR(1) grammar that SQLite uses
256      to parse SQL statements, and the actions that are taken at each step
257      in the parsing process.
259   *  **vdbe.c** - This file implements the virtual machine that runs
260      prepared statements.  There are various helper files whose names
261      begin with "vdbe".  The VDBE has access to the vdbeInt.h header file
262      which defines internal data objects.  The rest of SQLite interacts
263      with the VDBE through an interface defined by vdbe.h.
265   *  **where.c** - This file (together with its helper files named
266      by "where*.c") analyzes the WHERE clause and generates
267      virtual machine code to run queries efficiently.  This file is
268      sometimes called the "query optimizer".  It has its own private
269      header file, whereInt.h, that defines data objects used internally.
271   *  **btree.c** - This file contains the implementation of the B-Tree
272      storage engine used by SQLite.  The interface to the rest of the system
273      is defined by "btree.h".  The "btreeInt.h" header defines objects
274      used internally by btree.c and not published to the rest of the system.
276   *  **pager.c** - This file contains the "pager" implementation, the
277      module that implements transactions.  The "pager.h" header file
278      defines the interface between pager.c and the rest of the system.
280   *  **os_unix.c** and **os_win.c** - These two files implement the interface
281      between SQLite and the underlying operating system using the run-time
282      pluggable VFS interface.
284   *  **shell.c.in** - This file is not part of the core SQLite library.  This
285      is the file that, when linked against sqlite3.a, generates the
286      "sqlite3.exe" command-line shell.  The "shell.c.in" file is transformed
287      into "shell.c" as part of the build process.
289   *  **tclsqlite.c** - This file implements the Tcl bindings for SQLite.  It
290      is not part of the core SQLite library.  But as most of the tests in this
291      repository are written in Tcl, the Tcl language bindings are important.
293   *  **test*.c** - Files in the src/ folder that begin with "test" go into
294      building the "testfixture.exe" program.  The testfixture.exe program is
295      an enhanced Tcl shell.  The testfixture.exe program runs scripts in the
296      test/ folder to validate the core SQLite code.  The testfixture program
297      (and some other test programs too) is built and run when you type
298      "make test".
300   *  **ext/misc/json1.c** - This file implements the various JSON functions
301      that are built into SQLite.
303 There are many other source files.  Each has a succinct header comment that
304 describes its purpose and role within the larger system.
306 <a name="vauth"></a>
307 ## Verifying Code Authenticity
309 The `manifest` file at the root directory of the source tree
310 contains either a SHA3-256 hash (for newer files) or a SHA1 hash (for
311 older files) for every source file in the repository.
312 The name of the version of the entire source tree is just the
313 SHA3-256 hash of the `manifest` file itself, possibly with the
314 last line of that file omitted if the last line begins with
315 "`# Remove this line`".
316 The `manifest.uuid` file should contain the SHA3-256 hash of the
317 `manifest` file. If all of the above hash comparisons are correct, then
318 you can be confident that your source tree is authentic and unadulterated.
320 The format of the `manifest` file should be mostly self-explanatory, but
321 if you want details, they are available
322 [here](https://fossil-scm.org/fossil/doc/trunk/www/fileformat.wiki#manifest).
324 ## Contacts
326 The main SQLite website is [http://www.sqlite.org/](http://www.sqlite.org/)
327 with geographically distributed backups at
328 [http://www2.sqlite.org/](http://www2.sqlite.org) and
329 [http://www3.sqlite.org/](http://www3.sqlite.org).