Do not even try star-schema detection if the join has fewer than 5 tables,
[sqlite.git] / README.md
blob0975a32d9af048ce777ef534ebea1471132dc44c
1 <h1 align="center">SQLite Source Repository</h1>
3 This repository contains the complete source code for the
4 [SQLite database engine](https://sqlite.org/).  Some test scripts
5 are also included.  However, many other test scripts
6 and most of the documentation are managed separately.
8 ## Version Control
10 SQLite sources are managed using
11 [Fossil](https://www.fossil-scm.org/), a distributed version control system
12 that was specifically designed and written to support SQLite development.
13 The [Fossil repository](https://sqlite.org/src/timeline) contains the urtext.
15 If you are reading this on GitHub or some other Git repository or service,
16 then you are looking at a mirror.  The names of check-ins and
17 other artifacts in a Git mirror are different from the official
18 names for those objects.  The official names for check-ins are
19 found in a footer on the check-in comment for authorized mirrors.
20 The official check-in name can also be seen in the `manifest.uuid` file
21 in the root of the tree.  Always use the official name, not  the
22 Git-name, when communicating about an SQLite check-in.
24 If you pulled your SQLite source code from a secondary source and want to
25 verify its integrity, there are hints on how to do that in the
26 [Verifying Code Authenticity](#vauth) section below.
28 ## Contacting The SQLite Developers
30 The preferred way to ask questions or make comments about SQLite or to
31 report bugs against SQLite is to visit the 
32 [SQLite Forum](https://sqlite.org/forum) at <https://sqlite.org/forum/>.
33 Anonymous postings are permitted.
35 If you think you have found a bug that has security implications and
36 you do not want to report it on the public forum, you can send a private
37 email to drh at sqlite dot org.
39 ## Public Domain
41 The SQLite source code is in the public domain.  See
42 <https://sqlite.org/copyright.html> for details. 
44 Because SQLite is in the public domain, we do not normally accept pull
45 requests, because if we did take a pull request, the changes in that
46 pull request might carry a copyright and the SQLite source code would
47 then no longer be fully in the public domain.
49 ## Obtaining The SQLite Source Code
51 If you do not want to use Fossil, you can download tarballs or ZIP
52 archives or [SQLite archives](https://sqlite.org/cli.html#sqlar) as follows:
54   *  Latest trunk check-in as
55      [Tarball](https://www.sqlite.org/src/tarball/sqlite.tar.gz),
56      [ZIP-archive](https://www.sqlite.org/src/zip/sqlite.zip), or
57      [SQLite-archive](https://www.sqlite.org/src/sqlar/sqlite.sqlar).
59   *  Latest release as
60      [Tarball](https://www.sqlite.org/src/tarball/sqlite.tar.gz?r=release),
61      [ZIP-archive](https://www.sqlite.org/src/zip/sqlite.zip?r=release), or
62      [SQLite-archive](https://www.sqlite.org/src/sqlar/sqlite.sqlar?r=release).
64   *  For other check-ins, substitute an appropriate branch name or
65      tag or hash prefix in place of "release" in the URLs of the previous
66      bullet.  Or browse the [timeline](https://www.sqlite.org/src/timeline)
67      to locate the check-in desired, click on its information page link,
68      then click on the "Tarball" or "ZIP Archive" links on the information
69      page.
71 If you do want to use Fossil to check out the source tree,
72 first install Fossil version 2.0 or later.
73 (Source tarballs and precompiled binaries available
74 [here](https://www.fossil-scm.org/fossil/uv/download.html).  Fossil is
75 a stand-alone program.  To install, simply download or build the single
76 executable file and put that file someplace on your $PATH.)
77 Then run commands like this:
79         mkdir -p ~/sqlite ~/Fossils
80         cd ~/sqlite
81         fossil clone https://www.sqlite.org/src ~/Fossils/sqlite.fossil
82         fossil open ~/Fossils/sqlite.fossil
84 After setting up a repository using the steps above, you can always
85 update to the latest version using:
87         fossil update trunk   ;# latest trunk check-in
88         fossil update release ;# latest official release
90 Or type "fossil ui" to get a web-based user interface.
92 ## Compiling for Unix-like systems
94 First create a directory in which to place
95 the build products.  It is recommended, but not required, that the
96 build directory be separate from the source directory.  Cd into the
97 build directory and then from the build directory run the configure
98 script found at the root of the source tree.  Then run "make".
100 For example:
102         tar xzf sqlite.tar.gz    ;#  Unpack the source tree into "sqlite"
103         mkdir bld                ;#  Build will occur in a sibling directory
104         cd bld                   ;#  Change to the build directory
105         ../sqlite/configure      ;#  Run the configure script
106         make                     ;#  Builds the "sqlite3" command-line tool
107         make sqlite3.c           ;#  Build the "amalgamation" source file
108         make devtest             ;#  Run some tests (requires Tcl)
110 See the makefile for additional targets.
112 The configure script uses autoconf 2.61 and libtool.  If the configure
113 script does not work out for you, there is a generic makefile named
114 "Makefile.linux-gcc" in the top directory of the source tree that you
115 can copy and edit to suit your needs.  Comments on the generic makefile
116 show what changes are needed.
118 ## Compiling for Windows Using MSVC
120 On Windows, all applicable build products can be compiled with MSVC.
121 You will also need a working installation of TCL.
122 See the [compile-for-windows.md](doc/compile-for-windows.md) document for
123 additional information about how to install MSVC and TCL and configure your
124 build environment.
126 If you want to run tests, you need to let SQLite know the location of your
127 TCL library, using a command like this:
129         set TCLDIR=c:\Tcl
131 SQLite uses "tclsh.exe" as part of the build process, and so that utility
132 program will need to be somewhere on your %PATH%.  The finished SQLite library
133 does not contain any TCL code, but it does use TCL to help with the build process
134 and to run tests.
136 Build using Makefile.msc.  Example:
138         nmake /f Makefile.msc
139         nmake /f Makefile.msc sqlite3.c
140         nmake /f Makefile.msc devtest
141         nmake /f Makefile.msc releasetest
143 There are many other makefile targets.  See comments in Makefile.msc for
144 details.
146 ## Source Code Tour
148 Most of the core source files are in the **src/** subdirectory.  The
149 **src/** folder also contains files used to build the "testfixture" test
150 harness. The names of the source files used by "testfixture" all begin
151 with "test".
152 The **src/** also contains the "shell.c" file
153 which is the main program for the "sqlite3.exe"
154 [command-line shell](https://sqlite.org/cli.html) and
155 the "tclsqlite.c" file which implements the
156 [Tcl bindings](https://sqlite.org/tclsqlite.html) for SQLite.
157 (Historical note:  SQLite began as a Tcl
158 extension and only later escaped to the wild as an independent library.)
160 Test scripts and programs are found in the **test/** subdirectory.
161 Additional test code is found in other source repositories.
162 See [How SQLite Is Tested](https://www.sqlite.org/testing.html) for
163 additional information.
165 The **ext/** subdirectory contains code for extensions.  The
166 Full-text search engine is in **ext/fts3**.  The R-Tree engine is in
167 **ext/rtree**.  The **ext/misc** subdirectory contains a number of
168 smaller, single-file extensions, such as a REGEXP operator.
170 The **tool/** subdirectory contains various scripts and programs used
171 for building generated source code files or for testing or for generating
172 accessory programs such as "sqlite3_analyzer(.exe)".
174 ### Generated Source Code Files
176 Several of the C-language source files used by SQLite are generated from
177 other sources rather than being typed in manually by a programmer.  This
178 section will summarize those automatically-generated files.  To create all
179 of the automatically-generated files, simply run "make target&#95;source".
180 The "target&#95;source" make target will create a subdirectory "tsrc/" and
181 fill it with all the source files needed to build SQLite, both
182 manually-edited files and automatically-generated files.
184 The SQLite interface is defined by the **sqlite3.h** header file, which is
185 generated from src/sqlite.h.in, ./manifest.uuid, and ./VERSION.  The
186 [Tcl script](https://www.tcl.tk) at tool/mksqlite3h.tcl does the conversion.
187 The manifest.uuid file contains the SHA3 hash of the particular check-in
188 and is used to generate the SQLITE\_SOURCE\_ID macro.  The VERSION file
189 contains the current SQLite version number.  The sqlite3.h header is really
190 just a copy of src/sqlite.h.in with the source-id and version number inserted
191 at just the right spots. Note that comment text in the sqlite3.h file is
192 used to generate much of the SQLite API documentation.  The Tcl scripts
193 used to generate that documentation are in a separate source repository.
195 The SQL language parser is **parse.c** which is generated from a grammar in
196 the src/parse.y file.  The conversion of "parse.y" into "parse.c" is done
197 by the [lemon](./doc/lemon.html) LALR(1) parser generator.  The source code
198 for lemon is at tool/lemon.c.  Lemon uses the tool/lempar.c file as a
199 template for generating its parser.
200 Lemon also generates the **parse.h** header file, at the same time it
201 generates parse.c.
203 The **opcodes.h** header file contains macros that define the numbers
204 corresponding to opcodes in the "VDBE" virtual machine.  The opcodes.h
205 file is generated by scanning the src/vdbe.c source file.  The
206 Tcl script at ./mkopcodeh.tcl does this scan and generates opcodes.h.
207 A second Tcl script, ./mkopcodec.tcl, then scans opcodes.h to generate
208 the **opcodes.c** source file, which contains a reverse mapping from
209 opcode-number to opcode-name that is used for EXPLAIN output.
211 The **keywordhash.h** header file contains the definition of a hash table
212 that maps SQL language keywords (ex: "CREATE", "SELECT", "INDEX", etc.) into
213 the numeric codes used by the parse.c parser.  The keywordhash.h file is
214 generated by a C-language program at tool mkkeywordhash.c.
216 The **pragma.h** header file contains various definitions used to parse
217 and implement the PRAGMA statements.  The header is generated by a
218 script **tool/mkpragmatab.tcl**. If you want to add a new PRAGMA, edit
219 the **tool/mkpragmatab.tcl** file to insert the information needed by the
220 parser for your new PRAGMA, then run the script to regenerate the
221 **pragma.h** header file.
223 ### The Amalgamation
225 All of the individual C source code and header files (both manually-edited
226 and automatically-generated) can be combined into a single big source file
227 **sqlite3.c** called "the amalgamation".  The amalgamation is the recommended
228 way of using SQLite in a larger application.  Combining all individual
229 source code files into a single big source code file allows the C compiler
230 to perform more cross-procedure analysis and generate better code.  SQLite
231 runs about 5% faster when compiled from the amalgamation versus when compiled
232 from individual source files.
234 The amalgamation is generated from the tool/mksqlite3c.tcl Tcl script.
235 First, all of the individual source files must be gathered into the tsrc/
236 subdirectory (using the equivalent of "make target_source") then the
237 tool/mksqlite3c.tcl script is run to copy them all together in just the
238 right order while resolving internal "#include" references.
240 The amalgamation source file is more than 200K lines long.  Some symbolic
241 debuggers (most notably MSVC) are unable to deal with files longer than 64K
242 lines.  To work around this, a separate Tcl script, tool/split-sqlite3c.tcl,
243 can be run on the amalgamation to break it up into a single small C file
244 called **sqlite3-all.c** that does #include on about seven other files
245 named **sqlite3-1.c**, **sqlite3-2.c**, ..., **sqlite3-7.c**.  In this way,
246 all of the source code is contained within a single translation unit so
247 that the compiler can do extra cross-procedure optimization, but no
248 individual source file exceeds 32K lines in length.
250 ## How It All Fits Together
252 SQLite is modular in design.
253 See the [architectural description](https://www.sqlite.org/arch.html)
254 for details. Other documents that are useful in
255 (helping to understand how SQLite works include the
256 [file format](https://www.sqlite.org/fileformat2.html) description,
257 the [virtual machine](https://www.sqlite.org/opcode.html) that runs
258 prepared statements, the description of
259 [how transactions work](https://www.sqlite.org/atomiccommit.html), and
260 the [overview of the query planner](https://www.sqlite.org/optoverview.html).
262 Years of effort have gone into optimizing SQLite, both
263 for small size and high performance.  And optimizations tend to result in
264 complex code.  So there is a lot of complexity in the current SQLite
265 implementation.  It will not be the easiest library in the world to hack.
267 Key files:
269   *  **sqlite.h.in** - This file defines the public interface to the SQLite
270      library.  Readers will need to be familiar with this interface before
271      trying to understand how the library works internally.
273   *  **sqliteInt.h** - this header file defines many of the data objects
274      used internally by SQLite.  In addition to "sqliteInt.h", some
275      subsystems have their own header files.
277   *  **parse.y** - This file describes the LALR(1) grammar that SQLite uses
278      to parse SQL statements, and the actions that are taken at each step
279      in the parsing process.
281   *  **vdbe.c** - This file implements the virtual machine that runs
282      prepared statements.  There are various helper files whose names
283      begin with "vdbe".  The VDBE has access to the vdbeInt.h header file
284      which defines internal data objects.  The rest of SQLite interacts
285      with the VDBE through an interface defined by vdbe.h.
287   *  **where.c** - This file (together with its helper files named
288      by "where*.c") analyzes the WHERE clause and generates
289      virtual machine code to run queries efficiently.  This file is
290      sometimes called the "query optimizer".  It has its own private
291      header file, whereInt.h, that defines data objects used internally.
293   *  **btree.c** - This file contains the implementation of the B-Tree
294      storage engine used by SQLite.  The interface to the rest of the system
295      is defined by "btree.h".  The "btreeInt.h" header defines objects
296      used internally by btree.c and not published to the rest of the system.
298   *  **pager.c** - This file contains the "pager" implementation, the
299      module that implements transactions.  The "pager.h" header file
300      defines the interface between pager.c and the rest of the system.
302   *  **os_unix.c** and **os_win.c** - These two files implement the interface
303      between SQLite and the underlying operating system using the run-time
304      pluggable VFS interface.
306   *  **shell.c.in** - This file is not part of the core SQLite library.  This
307      is the file that, when linked against sqlite3.a, generates the
308      "sqlite3.exe" command-line shell.  The "shell.c.in" file is transformed
309      into "shell.c" as part of the build process.
311   *  **tclsqlite.c** - This file implements the Tcl bindings for SQLite.  It
312      is not part of the core SQLite library.  But as most of the tests in this
313      repository are written in Tcl, the Tcl language bindings are important.
315   *  **test\*.c** - Files in the src/ folder that begin with "test" go into
316      building the "testfixture.exe" program.  The testfixture.exe program is
317      an enhanced Tcl shell.  The testfixture.exe program runs scripts in the
318      test/ folder to validate the core SQLite code.  The testfixture program
319      (and some other test programs too) is built and run when you type
320      "make test".
322 There are many other source files.  Each has a succinct header comment that
323 describes its purpose and role within the larger system.
325 <a name="vauth"></a>
326 ## Verifying Code Authenticity
328 The `manifest` file at the root directory of the source tree
329 contains either a SHA3-256 hash or a SHA1 hash
330 for every source file in the repository.
331 The name of the version of the entire source tree is just the
332 SHA3-256 hash of the `manifest` file itself, possibly with the
333 last line of that file omitted if the last line begins with
334 "`# Remove this line`".
335 The `manifest.uuid` file should contain the SHA3-256 hash of the
336 `manifest` file. If all of the above hash comparisons are correct, then
337 you can be confident that your source tree is authentic and unadulterated.
338 Details on the format for the `manifest` files are available
339 [on the Fossil website](https://fossil-scm.org/fossil/doc/trunk/www/fileformat.wiki#manifest).
341 The process of checking source code authenticity is automated by the 
342 makefile:
344 >   make verify-source
346 Or on windows:
348 >   nmake /f Makefile.msc verify-source
350 Using the makefile to verify source integrity is good for detecting
351 accidental changes to the source tree, but malicious changes could be
352 hidden by also modifying the makefiles.
354 ## Contacts
356 The main SQLite website is [https://sqlite.org/](https://sqlite.org/)
357 with geographically distributed backups at
358 [https://www2.sqlite.org/](https://www2.sqlite.org) and
359 [https://www3.sqlite.org/](https://www3.sqlite.org).