Remove -Winline from the default set of CFLAGS for gcc. It's gotten much
[PostgreSQL.git] / doc / FAQ
blobbc5c77d72560469cce5979af74446dabf717e98b
2                 Frequently Asked Questions (FAQ) for PostgreSQL
3                                        
4    Last updated: Fri Aug 15 20:32:19 EDT 2008
5    
6    Current maintainer: Bruce Momjian (bruce@momjian.us)
7    
8    The most recent version of this document can be viewed at
9    http://www.postgresql.org/files/documentation/faqs/FAQ.html.
10    
11    Platform-specific questions are answered at
12    http://www.postgresql.org/docs/faq/.
13      _________________________________________________________________
14    
15                              General Questions
16                                       
17    1.1) What is PostgreSQL? How is it pronounced? What is Postgres?
18    1.2) Who controls PostgreSQL?
19    1.3) What is the copyright of PostgreSQL?
20    1.4) What platforms does PostgreSQL support?
21    1.5) Where can I get PostgreSQL?
22    1.6) What is the most recent release?
23    1.7) Where can I get support?
24    1.8) How do I submit a bug report?
25    1.9) How do I find out about known bugs or missing features?
26    1.10) What documentation is available?
27    1.11) How can I learn SQL?
28    1.12) How do I submit a patch or join the development team?
29    1.13) How does PostgreSQL compare to other DBMSs? Can PostgreSQL be
30    embedded?
31    1.14) Will PostgreSQL handle recent daylight saving time changes in
32    various countries?
33    1.15) How do I unsubscribe from the PostgreSQL email lists? How do I
34    avoid receiving duplicate emails?
35    
36                            User Client Questions
37                                       
38    2.1) What interfaces are available for PostgreSQL?
39    2.2) What tools are available for using PostgreSQL with Web pages?
40    2.3) Does PostgreSQL have a graphical user interface?
41    
42                           Administrative Questions
43                                       
44    3.1) How do I install PostgreSQL somewhere other than
45    /usr/local/pgsql?
46    3.2) How do I control connections from other hosts?
47    3.3) How do I tune the database engine for better performance?
48    3.4) What debugging features are available?
49    3.5) Why do I get "Sorry, too many clients" when trying to connect?
50    3.6 What is the upgrade process for PostgreSQL?
51    3.7) What computer hardware should I use?
52    
53                            Operational Questions
54                                       
55    4.1) How do I SELECT only the first few rows of a query? A random row?
56    4.2) How do I find out what tables, indexes, databases, and users are
57    defined? How do I see the queries used by psql to display them?
58    4.3) How do you change a column's data type?
59    4.4) What is the maximum size for a row, a table, and a database?
60    4.5) How much database disk space is required to store data from a
61    typical text file?
62    4.6) Why are my queries slow? Why don't they use my indexes?
63    4.7) How do I see how the query optimizer is evaluating my query?
64    4.8) How do I perform regular expression searches and case-insensitive
65    regular expression searches? How do I use an index for
66    case-insensitive searches?
67    4.9) In a query, how do I detect if a field is NULL? How do I
68    concatenate possible NULLs? How can I sort on whether a field is NULL
69    or not?
70    4.10) What is the difference between the various character types?
71    4.11.1) How do I create a serial/auto-incrementing field?
72    4.11.2) How do I get the value of a SERIAL insert?
73    4.11.3) Doesn't currval() lead to a race condition with other users?
74    4.11.4) Why aren't my sequence numbers reused on transaction abort?
75    Why are there gaps in the numbering of my sequence/SERIAL column?
76    4.12) What is an OID? What is a CTID?
77    4.13) Why do I get the error "ERROR: Memory exhausted in
78    AllocSetAlloc()"?
79    4.14) How do I tell what PostgreSQL version I am running?
80    4.15) How do I create a column that will default to the current time?
81    4.16) How do I perform an outer join?
82    4.17) How do I perform queries using multiple databases?
83    4.18) How do I return multiple rows or columns from a function?
84    4.19) Why do I get "relation with OID ##### does not exist" errors
85    when accessing temporary tables in PL/PgSQL functions?
86    4.20) What replication solutions are available?
87    4.21) Why are my table and column names not recognized in my query?
88    Why is capitalization not preserved?
89      _________________________________________________________________
90    
91                              General Questions
92                                       
93   1.1) What is PostgreSQL? How is it pronounced? What is Postgres?
94   
95    PostgreSQL is pronounced Post-Gres-Q-L. (For those curious about how
96    to say "PostgreSQL", an audio file is available.)
97    
98    PostgreSQL is an object-relational database system that has the
99    features of traditional commercial database systems with enhancements
100    to be found in next-generation DBMS systems. PostgreSQL is free and
101    the complete source code is available.
102    
103    PostgreSQL development is performed by a team of mostly volunteer
104    developers spread throughout the world and communicating via the
105    Internet. It is a community project and is not controlled by any
106    company. To get involved, see the developer's FAQ at
107    http://www.postgresql.org/docs/faqs.FAQ_DEV.html
108    
109    Postgres is a widely-used nickname for PostgreSQL. It was the original
110    name of the project at Berkeley and is strongly preferred over other
111    nicknames. If you find 'PostgreSQL' hard to pronounce, call it
112    'Postgres' instead.
113    
114   1.2) Who controls PostgreSQL?
115   
116    If you are looking for a PostgreSQL gatekeeper, central committee, or
117    controlling company, give up --- there isn't one. We do have a core
118    committee and CVS committers, but these groups are more for
119    administrative purposes than control. The project is directed by the
120    community of developers and users, which anyone can join. All you need
121    to do is subscribe to the mailing lists and participate in the
122    discussions. (See the Developer's FAQ for information on how to get
123    involved in PostgreSQL development.)
124    
125   1.3) What is the copyright of PostgreSQL?
126   
127    PostgreSQL is distributed under the classic BSD license. Basically, it
128    allows users to do anything they want with the code, including
129    reselling binaries without the source code. The only restriction is
130    that you not hold us legally liable for problems with the software.
131    There is also the requirement that this copyright appear in all copies
132    of the software. Here is the actual BSD license we use:
133    
134    PostgreSQL Data Base Management System
135    
136    Portions Copyright (c) 1996-2008, PostgreSQL Global Development Group
137    Portions Copyright (c) 1994-1996 Regents of the University of
138    California
139    
140    Permission to use, copy, modify, and distribute this software and its
141    documentation for any purpose, without fee, and without a written
142    agreement is hereby granted, provided that the above copyright notice
143    and this paragraph and the following two paragraphs appear in all
144    copies.
145    
146    IN NO EVENT SHALL THE UNIVERSITY OF CALIFORNIA BE LIABLE TO ANY PARTY
147    FOR DIRECT, INDIRECT, SPECIAL, INCIDENTAL, OR CONSEQUENTIAL DAMAGES,
148    INCLUDING LOST PROFITS, ARISING OUT OF THE USE OF THIS SOFTWARE AND
149    ITS DOCUMENTATION, EVEN IF THE UNIVERSITY OF CALIFORNIA HAS BEEN
150    ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
151    
152    THE UNIVERSITY OF CALIFORNIA SPECIFICALLY DISCLAIMS ANY WARRANTIES,
153    INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF
154    MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE. THE SOFTWARE
155    PROVIDED HEREUNDER IS ON AN "AS IS" BASIS, AND THE UNIVERSITY OF
156    CALIFORNIA HAS NO OBLIGATIONS TO PROVIDE MAINTENANCE, SUPPORT,
157    UPDATES, ENHANCEMENTS, OR MODIFICATIONS.
158    
159   1.4) What platforms does PostgreSQL support?
160   
161    In general, any modern Unix-compatible platform should be able to run
162    PostgreSQL. The platforms that had received explicit testing at the
163    time of release are listed in the installation instructions.
164    
165    PostgreSQL also runs natively on Microsoft Windows NT-based operating
166    systems like Win2000 SP4, WinXP, and Win2003. A prepackaged installer
167    is available at http://www.postgresql.org/download/windows.
168    MSDOS-based versions of Windows (Win95, Win98, WinMe) can run
169    PostgreSQL using Cygwin.
170    
171    There is also a Novell Netware 6 port at
172    http://developer.novell.com/wiki/index.php/Postgresql, and an OS/2
173    (eComStation) version at
174    http://hobbes.nmsu.edu/cgi-bin/h-search?sh=1&button=Search&key=postgre
175    SQL&stype=all&sort=type&dir=%2F.
176    
177   1.5) Where can I get PostgreSQL?
178   
179    Via web browser, use http://www.postgresql.org/ftp/, and via ftp, use
180    ftp://ftp.postgresql.org/pub/.
181    
182   1.6) What is the most recent release?
183   
184    The latest release of PostgreSQL is version 8.3.3.
185    
186    We plan to have a major release every year, with minor releases every
187    few months.
188    
189   1.7) Where can I get support?
190   
191    The PostgreSQL community provides assistance to many of its users via
192    email. The main web site to subscribe to the email lists is
193    http://www.postgresql.org/community/lists/. The general or bugs lists
194    are a good place to start.
195    
196    The major IRC channel is #postgresql on Freenode (irc.freenode.net).
197    To connect you can use the Unix program irc -c '#postgresql' "$USER"
198    irc.freenode.net or use any other IRC clients. A Spanish one also
199    exists on the same network, (#postgresql-es), a French one,
200    (#postgresqlfr), and a Brazilian one, (#postgresql-br). There is also
201    a PostgreSQL channel on EFNet.
202    
203    A list of commercial support companies is available at
204    http://www.postgresql.org/support/professional_support.
205    
206   1.8) How do I submit a bug report?
207   
208    Visit the PostgreSQL bug form at
209    http://www.postgresql.org/support/submitbug. Also check out our ftp
210    site ftp://ftp.postgresql.org/pub/ to see if there is a more recent
211    PostgreSQL version.
212    
213    Bugs submitted using the bug form or posted to any PostgreSQL mailing
214    list typically generates one of the following replies:
215      * It is not a bug, and why
216      * It is a known bug and is already on the TODO list
217      * The bug has been fixed in the current release
218      * The bug has been fixed but is not packaged yet in an official
219        release
220      * A request is made for more detailed information:
221           + Operating system
222           + PostgreSQL version
223           + Reproducible test case
224           + Debugging information
225           + Debugger backtrace output
226      * The bug is new. The following might happen:
227           + A patch is created and will be included in the next major or
228             minor release
229           + The bug cannot be fixed immediately and is added to the TODO
230             list
231        
232   1.9) How do I find out about known bugs or missing features?
233   
234    PostgreSQL supports an extended subset of SQL:2003. See our TODO list
235    for known bugs, missing features, and future plans.
236    
237    A feature request usually results in one of the following replies:
238      * The feature is already on the TODO list
239      * The feature is not desired because:
240           + It duplicates existing functionality that already follows the
241             SQL standard
242           + The feature would increase code complexity but add little
243             benefit
244           + The feature would be insecure or unreliable
245      * The new feature is added to the TODO list
246        
247    PostgreSQL does not use a bug tracking system because we find it more
248    efficient to respond directly to email and keep the TODO list
249    up-to-date. In practice, bugs don't last very long in the software,
250    and bugs that affect a large number of users are fixed rapidly. The
251    only place to find all changes, improvements, and fixes in a
252    PostgreSQL release is to read the CVS log messages. Even the release
253    notes do not list every change made to the software.
254    
255   1.10) What documentation is available?
256   
257    PostgreSQL includes extensive documentation, including a large manual,
258    manual pages, and some test examples. See the /doc directory. You can
259    also browse the manuals online at http://www.postgresql.org/docs.
260    
261    There are two PostgreSQL books available online at
262    http://www.postgresql.org/docs/books/awbook.html and
263    http://www.commandprompt.com/ppbook/. There are a number of PostgreSQL
264    books available for purchase. One of the most popular ones is by Korry
265    Douglas. A list of book reviews can be found at
266    http://www.postgresql.org/docs/books/. There is also a collection of
267    PostgreSQL technical articles at
268    http://wiki.postgresql.org/wiki/Community_Generated_Articles%2C_Guides
269    %2C_and_Documentation.
270    
271    The command line client program psql has some \d commands to show
272    information about types, operators, functions, aggregates, etc. - use
273    \? to display the available commands.
274    
275    Our web site contains even more documentation.
276    
277   1.11) How can I learn SQL?
278   
279    First, consider the PostgreSQL-specific books mentioned above. Many of
280    our users also like The Practical SQL Handbook, Bowman, Judith S., et
281    al., Addison-Wesley. Others like The Complete Reference SQL, Groff et
282    al., McGraw-Hill.
283    
284    There are also many nice tutorials available online:
285      * http://www.intermedia.net/support/sql/sqltut.shtm
286      * http://sqlcourse.com
287      * http://www.w3schools.com/sql/default.asp
288      * http://mysite.verizon.net/Graeme_Birchall/id1.html
289      * http://sqlzoo.net
290        
291   1.12) How do I submit a patch or join the development team?
292   
293    See the Developer's FAQ.
294    
295   1.13) How does PostgreSQL compare to other DBMSs? Can PostgreSQL be embedded?
296   
297    There are several ways of measuring software: features, performance,
298    reliability, support, and price.
299    
300    Features
301           PostgreSQL has most features present in large commercial DBMSs,
302           like transactions, subselects, triggers, views, foreign key
303           referential integrity, and sophisticated locking. We have some
304           features they do not have, like user-defined types,
305           inheritance, rules, and multi-version concurrency control to
306           reduce lock contention.
307           
308    Performance
309           PostgreSQL's performance is comparable to other commercial and
310           open source databases. It is faster for some things, slower for
311           others. Our performance is usually +/-10% compared to other
312           databases.
313           
314    Reliability
315           We realize that a DBMS must be reliable, or it is worthless. We
316           strive to release well-tested, stable code that has a minimum
317           of bugs. Each release has at least one month of beta testing,
318           and our release history shows that we can provide stable, solid
319           releases that are ready for production use. We believe we
320           compare favorably to other database software in this area.
321           
322    Support
323           Our mailing lists provide contact with a large group of
324           developers and users to help resolve any problems encountered.
325           While we cannot guarantee a fix, commercial DBMSs do not always
326           supply a fix either. Direct access to developers, the user
327           community, manuals, and the source code often make PostgreSQL
328           support superior to other DBMSs. There is commercial
329           per-incident support available for those who need it. (See FAQ
330           section 1.7.)
331           
332    Price
333           We are free for all use, both commercial and non-commercial.
334           You can add our code to your product with no limitations,
335           except those outlined in our BSD-style license stated above.
336           
337    PostgreSQL is designed as a client/server architecture, which requires
338    separate processes for each client and server, and various helper
339    processes. Many embedded architectures can support such requirements.
340    However, if your embedded architecture requires the database server to
341    run inside the application process, you cannot use Postgres and should
342    select a lighter-weight database solution.
343    
344   1.14) Will PostgreSQL handle recent daylight saving time changes in various
345   countries?
346   
347    USA daylight saving time changes are included in PostgreSQL release
348    8.0.[4+], and all later major releases, e.g. 8.1. Canada and Western
349    Australia changes are included in 8.0.[10+], 8.1.[6+], and all later
350    major releases. PostgreSQL releases prior to 8.0 use the operating
351    system's timezone database for daylight saving information.
352    
353   1.15) How do I unsubscribe from the PostgreSQL email lists? How do I avoid
354   receiving duplicate emails?
355   
356    The PostgreSQL Majordomo page allows subscribing or unsubscribing from
357    any of the PostgreSQL email lists. (You might need to have your
358    Majordomo password emailed to you to log in.)
359    
360    All PostgreSQL email lists are configured so a group reply goes to the
361    email list and the original email author. This is done so users
362    receive the quickest possible email replies. If you would prefer not
363    to receive duplicate email from the list in cases where you already
364    receive an email directly, check eliminatecc from the Majordomo Change
365    Settings page. You can also prevent yourself from receiving copies of
366    emails you post to the lists by unchecking selfcopy.
367      _________________________________________________________________
368    
369                            User Client Questions
370                                       
371   2.1) What interfaces are available for PostgreSQL?
372   
373    The PostgreSQL install includes only the C and embedded C interfaces.
374    All other interfaces are independent projects that are downloaded
375    separately; being separate allows them to have their own release
376    schedule and development teams.
377    
378    Some programming languages like PHP include an interface to
379    PostgreSQL. Interfaces for languages like Perl, TCL, Python, and many
380    others are available at http://pgfoundry.org.
381    
382   2.2) What tools are available for using PostgreSQL with Web pages?
383   
384    A nice introduction to Database-backed Web pages can be seen at:
385    http://www.webreview.com
386    
387    For Web integration, PHP (http://www.php.net) is an excellent
388    interface.
389    
390    For complex cases, many use the Perl and DBD::Pg with CGI.pm or
391    mod_perl.
392    
393   2.3) Does PostgreSQL have a graphical user interface?
394   
395    There are a large number of GUI Tools that are available for
396    PostgreSQL from both commercial and open source developers. A detailed
397    list can be found in the Community Guide to PostgreSQL GUI Tools.
398      _________________________________________________________________
399    
400                           Administrative Questions
401                                       
402   3.1) How do I install PostgreSQL somewhere other than /usr/local/pgsql?
403   
404    Specify the --prefix option when running configure.
405    
406   3.2) How do I control connections from other hosts?
407   
408    By default, PostgreSQL only allows connections from the local machine
409    using Unix domain sockets or TCP/IP connections. Other machines will
410    not be able to connect unless you modify listen_addresses in the
411    postgresql.conf file, enable host-based authentication by modifying
412    the $PGDATA/pg_hba.conf file, and restart the database server.
413    
414   3.3) How do I tune the database engine for better performance?
415   
416    There are three major areas for potential performance improvement:
417    
418    Query Changes
419           This involves modifying queries to obtain better performance:
420           
421           + Creation of indexes, including expression and partial indexes
422           + Use of COPY instead of multiple INSERTs
423           + Grouping of multiple statements into a single transaction to
424             reduce commit overhead
425           + Use of CLUSTER when retrieving many rows from an index
426           + Use of LIMIT for returning a subset of a query's output
427           + Use of Prepared queries
428           + Use of ANALYZE to maintain accurate optimizer statistics
429           + Regular use of VACUUM or pg_autovacuum
430           + Dropping of indexes during large data changes
431             
432    Server Configuration
433           A number of postgresql.conf settings affect performance. For
434           more details, see Administration Guide/Server Run-time
435           Environment/Run-time Configuration for a full listing, and for
436           commentary see
437           http://www.varlena.com/varlena/GeneralBits/Tidbits/annotated_co
438           nf_e.html and
439           http://www.varlena.com/varlena/GeneralBits/Tidbits/perf.html.
440           
441    Hardware Selection
442           The effect of hardware on performance is detailed in
443           http://www.powerpostgresql.com/PerfList/ and
444           http://momjian.us/main/writings/pgsql/hw_performance/index.html
445           .
446           
447   3.4) What debugging features are available?
448   
449    There are many log_* server configuration variables at
450    http://www.postgresql.org/docs/current/interactive/runtime-config-logg
451    ing.html that enable printing of query and process statistics which
452    can be very useful for debugging and performance measurements.
453    
454   3.5) Why do I get "Sorry, too many clients" when trying to connect?
455   
456    You have reached the default limit of 100 database sessions. You need
457    to increase the server's limit on how many concurrent backend
458    processes it can start by changing the max_connections value in
459    postgresql.conf and restarting the server.
460    
461   3.6) What is the upgrade process for PostgreSQL?
462   
463    See http://www.postgresql.org/support/versioning for a general
464    discussion about upgrading, and
465    http://www.postgresql.org/docs/current/static/install-upgrading.html
466    for specific instructions.
467    
468   3.7) What computer hardware should I use?
469   
470    Because PC hardware is mostly compatible, people tend to believe that
471    all PC hardware is of equal quality. It is not. ECC RAM, SCSI, and
472    quality motherboards are more reliable and have better performance
473    than less expensive hardware. PostgreSQL will run on almost any
474    hardware, but if reliability and performance are important it is wise
475    to research your hardware options thoroughly. Our email lists can be
476    used to discuss hardware options and tradeoffs.
477      _________________________________________________________________
478    
479                            Operational Questions
480                                       
481   4.1) How do I SELECT only the first few rows of a query? A random row?
482   
483    To retrieve only a few rows, if you know at the number of rows needed
484    at the time of the SELECT use LIMIT . If an index matches the ORDER BY
485    it is possible the entire query does not have to be executed. If you
486    don't know the number of rows at SELECT time, use a cursor and FETCH.
487    
488    To SELECT a random row, use:
489     SELECT col
490     FROM tab
491     ORDER BY random()
492     LIMIT 1;
494   4.2) How do I find out what tables, indexes, databases, and users are
495   defined? How do I see the queries used by psql to display them?
496   
497    Use the \dt command to see tables in psql. For a complete list of
498    commands inside psql you can use \?. Alternatively you can read the
499    source code for psql in file pgsql/src/bin/psql/describe.c, it
500    contains SQL commands that generate the output for psql's backslash
501    commands. You can also start psql with the -E option so it will print
502    out the queries it uses to execute the commands you give. PostgreSQL
503    also provides an SQL compliant INFORMATION SCHEMA interface you can
504    query to get information about the database.
505    
506    There are also system tables beginning with pg_ that describe these
507    too.
508    
509    Use psql -l will list all databases.
510    
511    Also try the file pgsql/src/tutorial/syscat.source. It illustrates
512    many of the SELECTs needed to get information from the database system
513    tables.
514    
515   4.3) How do you change a column's data type?
516   
517    Changing the data type of a column can be done easily in 8.0 and later
518    with ALTER TABLE ALTER COLUMN TYPE.
519    
520    In earlier releases, do this:
521     BEGIN;
522     ALTER TABLE tab ADD COLUMN new_col new_data_type;
523     UPDATE tab SET new_col = CAST(old_col AS new_data_type);
524     ALTER TABLE tab DROP COLUMN old_col;
525     COMMIT;
527    You might then want to do VACUUM FULL tab to reclaim the disk space
528    used by the expired rows.
529    
530   4.4) What is the maximum size for a row, a table, and a database?
531   
532    These are the limits:
533    
534    Maximum size for a database? unlimited (32 TB databases exist)
535    Maximum size for a table? 32 TB
536    Maximum size for a row? 400 GB
537    Maximum size for a field? 1 GB
538    Maximum number of rows in a table? unlimited
539    Maximum number of columns in a table? 250-1600 depending on column
540    types
541    Maximum number of indexes on a table? unlimited
542    
543    Of course, these are not actually unlimited, but limited to available
544    disk space and memory/swap space. Performance may suffer when these
545    values get unusually large.
546    
547    The maximum table size of 32 TB does not require large file support
548    from the operating system. Large tables are stored as multiple 1 GB
549    files so file system size limits are not important.
550    
551    The maximum table size, row size, and maximum number of columns can be
552    quadrupled by increasing the default block size to 32k. The maximum
553    table size can also be increased using table partitioning.
554    
555    One limitation is that indexes can not be created on columns longer
556    than about 2,000 characters. Fortunately, such indexes are rarely
557    needed. Uniqueness is best guaranteed by a function index of an MD5
558    hash of the long column, and full text indexing allows for searching
559    of words within the column.
560    
561   4.5) How much database disk space is required to store data from a typical
562   text file?
563   
564    A PostgreSQL database may require up to five times the disk space to
565    store data from a text file.
566    
567    As an example, consider a file of 100,000 lines with an integer and
568    text description on each line. Suppose the text string avergages
569    twenty bytes in length. The flat file would be 2.8 MB. The size of the
570    PostgreSQL database file containing this data can be estimated as 5.2
571    MB:
572     24 bytes: each row header (approximate)
573     24 bytes: one int field and one text field
574    + 4 bytes: pointer on page to tuple
575    ----------------------------------------
576     52 bytes per row
578    The data page size in PostgreSQL is 8192 bytes (8 KB), so:
580    8192 bytes per page
581    -------------------   =  158 rows per database page (rounded down)
582      52 bytes per row
584    100000 data rows
585    --------------------  =  633 database pages (rounded up)
586       158 rows per page
588 633 database pages * 8192 bytes per page  =  5,185,536 bytes (5.2 MB)
590    Indexes do not require as much overhead, but do contain the data that
591    is being indexed, so they can be large also.
592    
593    NULLs are stored as bitmaps, so they use very little space.
594    
595   4.6) Why are my queries slow? Why don't they use my indexes?
596   
597    Indexes are not used by every query. Indexes are used only if the
598    table is larger than a minimum size, and the query selects only a
599    small percentage of the rows in the table. This is because the random
600    disk access caused by an index scan can be slower than a straight read
601    through the table, or sequential scan.
602    
603    To determine if an index should be used, PostgreSQL must have
604    statistics about the table. These statistics are collected using
605    VACUUM ANALYZE, or simply ANALYZE. Using statistics, the optimizer
606    knows how many rows are in the table, and can better determine if
607    indexes should be used. Statistics are also valuable in determining
608    optimal join order and join methods. Statistics collection should be
609    performed periodically as the contents of the table change.
610    
611    Indexes are normally not used for ORDER BY or to perform joins. A
612    sequential scan followed by an explicit sort is usually faster than an
613    index scan of a large table. However, LIMIT combined with ORDER BY
614    often will use an index because only a small portion of the table is
615    returned.
616    
617    If you believe the optimizer is incorrect in choosing a sequential
618    scan, use SET enable_seqscan TO 'off' and run query again to see if an
619    index scan is indeed faster.
620    
621    When using wild-card operators such as LIKE or ~, indexes can only be
622    used in certain circumstances:
623      * The beginning of the search string must be anchored to the start
624        of the string, i.e.
625           + LIKE patterns must not start with %.
626           + ~ (regular expression) patterns must start with ^.
627      * The search string can not start with a character class, e.g.
628        [a-e].
629      * Case-insensitive searches such as ILIKE and ~* do not utilize
630        indexes. Instead, use expression indexes, which are described in
631        section 4.8.
632      * The default C locale must be used during initdb because it is not
633        possible to know the next-greatest character in a non-C locale.
634        You can create a special text_pattern_ops index for such cases
635        that work only for LIKE indexing. It is also possible to use full
636        text indexing for word searches.
637        
638   4.7) How do I see how the query optimizer is evaluating my query?
639   
640    See the EXPLAIN manual page.
641    
642   4.8) How do I perform regular expression searches and case-insensitive
643   regular expression searches? How do I use an index for case-insensitive
644   searches?
645   
646    The ~ operator does regular expression matching, and ~* does
647    case-insensitive regular expression matching. The case-insensitive
648    variant of LIKE is called ILIKE.
649    
650    Case-insensitive equality comparisons are normally expressed as:
651     SELECT *
652     FROM tab
653     WHERE lower(col) = 'abc';
655    This will not use an standard index. However, if you create an
656    expression index, it will be used:
657     CREATE INDEX tabindex ON tab (lower(col));
659    If the above index is created as UNIQUE, though the column can store
660    upper and lowercase characters, it can not have identical values that
661    differ only in case. To force a particular case to be stored in the
662    column, use a CHECK constraint or a trigger.
663    
664   4.9) In a query, how do I detect if a field is NULL? How do I concatenate
665   possible NULLs? How can I sort on whether a field is NULL or not?
666   
667    You test the column with IS NULL and IS NOT NULL, like this:
668    SELECT *
669    FROM tab
670    WHERE col IS NULL;
672    To concatentate with possible NULLs, use COALESCE(), like this:
673    SELECT COALESCE(col1, '') || COALESCE(col2, '')
674    FROM tab
676    To sort by the NULL status, use the IS NULL and IS NOT NULL modifiers
677    in your ORDER BY clause. Things that are true will sort higher than
678    things that are false, so the following will put NULL entries at the
679    top of the resulting list:
680    SELECT *
681    FROM tab
682    ORDER BY (col IS NOT NULL)
684   4.10) What is the difference between the various character types?
685   
686         Type    Internal Name                    Notes
687      VARCHAR(n) varchar       size specifies maximum length, no padding
688      CHAR(n)    bpchar        blank padded to the specified fixed length
689      TEXT       text          no specific upper limit on length
690      BYTEA      bytea         variable-length byte array (null-byte safe)
691      "char"     char          one character
692    
693    You will see the internal name when examining system catalogs and in
694    some error messages.
695    
696    The first four types above are "varlena" types (i.e., the first four
697    bytes on disk are the length, followed by the data). Thus the actual
698    space used is slightly greater than the declared size. However, long
699    values are also subject to compression, so the space on disk might
700    also be less than expected.
701    VARCHAR(n) is best when storing variable-length strings and it limits
702    how long a string can be. TEXT is for strings of unlimited length,
703    with a maximum of one gigabyte.
704    
705    CHAR(n) is for storing strings that are all the same length. CHAR(n)
706    pads with blanks to the specified length, while VARCHAR(n) only stores
707    the characters supplied. BYTEA is for storing binary data,
708    particularly values that include NULL bytes. All the types described
709    here have similar performance characteristics.
710    
711   4.11.1) How do I create a serial/auto-incrementing field?
712   
713    PostgreSQL supports a SERIAL data type. It auto-creates a sequence.
714    For example, this:
715     CREATE TABLE person (
716         id   SERIAL,
717         name TEXT
718     );
720    is automatically translated into this:
721     CREATE SEQUENCE person_id_seq;
722     CREATE TABLE person (
723         id   INT4 NOT NULL DEFAULT nextval('person_id_seq'),
724         name TEXT
725     );
727    Automatically created sequence are named <table>_<serialcolumn>_seq,
728    where table and serialcolumn are the names of the table and SERIAL
729    column, respectively. See the create_sequence manual page for more
730    information about sequences.
731    
732   4.11.2) How do I get the value of a SERIAL insert?
733   
734    The simplest way is to retrieve the assigned SERIAL value with
735    RETURNING. Using the example table in 4.11.1, it would look like this:
736     INSERT INTO person (name) VALUES ('Blaise Pascal') RETURNING id;
738    You can also call nextval() and use that value in the INSERT, or call
739    currval() after the INSERT.
740    
741   4.11.3) Doesn't currval() lead to a race condition with other users?
742   
743    No. currval() returns the current value assigned by your session, not
744    by all sessions.
745    
746   4.11.4) Why aren't my sequence numbers reused on transaction abort? Why are
747   there gaps in the numbering of my sequence/SERIAL column?
748   
749    To improve concurrency, sequence values are given out to running
750    transactions as needed and are not locked until the transaction
751    completes. This causes gaps in numbering from aborted transactions.
752    
753   4.12) What is an OID? What is a CTID?
754   
755    If a table is created WITH OIDS, each row gets a unique a OID. OIDs
756    are automatically assigned unique 4-byte integers that are unique
757    across the entire installation. However, they overflow at 4 billion,
758    and then the OIDs start being duplicated. PostgreSQL uses OIDs to link
759    its internal system tables together.
760    
761    To uniquely number rows in user tables, it is best to use SERIAL
762    rather than OIDs because SERIAL sequences are unique only within a
763    single table. and are therefore less likely to overflow. SERIAL8 is
764    available for storing eight-byte sequence values.
765    
766    CTIDs are used to identify specific physical rows with block and
767    offset values. CTIDs change after rows are modified or reloaded. They
768    are used by index entries to point to physical rows.
769    
770   4.13) Why do I get the error "ERROR: Memory exhausted in AllocSetAlloc()"?
771   
772    You probably have run out of virtual memory on your system, or your
773    kernel has a low limit for certain resources. Try this before starting
774    the server:
775     ulimit -d 262144
776     limit datasize 256m
778    Depending on your shell, only one of these may succeed, but it will
779    set your process data segment limit much higher and perhaps allow the
780    query to complete. This command applies to the current process, and
781    all subprocesses created after the command is run. If you are having a
782    problem with the SQL client because the backend is returning too much
783    data, try it before starting the client.
784    
785   4.14) How do I tell what PostgreSQL version I am running?
786   
787    From psql, type SELECT version();
788    
789   4.15) How do I create a column that will default to the current time?
790   
791    Use CURRENT_TIMESTAMP:
792     CREATE TABLE test (x int, modtime TIMESTAMP DEFAULT CURRENT_TIMESTAMP );
794   4.16) How do I perform an outer join?
795   
796    PostgreSQL supports outer joins using the SQL standard syntax. Here
797    are two examples:
798     SELECT *
799     FROM t1 LEFT OUTER JOIN t2 ON (t1.col = t2.col);
801    or
802     SELECT *
803     FROM t1 LEFT OUTER JOIN t2 USING (col);
805    These identical queries join t1.col to t2.col, and also return any
806    unjoined rows in t1 (those with no match in t2). A RIGHT join would
807    add unjoined rows of t2. A FULL join would return the matched rows
808    plus all unjoined rows from t1 and t2. The word OUTER is optional and
809    is assumed in LEFT, RIGHT, and FULL joins. Ordinary joins are called
810    INNER joins.
811    
812   4.17) How do I perform queries using multiple databases?
813   
814    There is no way to query a database other than the current one.
815    Because PostgreSQL loads database-specific system catalogs, it is
816    uncertain how a cross-database query should even behave.
817    
818    contrib/dblink allows cross-database queries using function calls. Of
819    course, a client can also make simultaneous connections to different
820    databases and merge the results on the client side.
821    
822   4.18) How do I return multiple rows or columns from a function?
823   
824    It is easy using set-returning functions,
825    http://wiki.postgresql.org/wiki/Return_more_than_one_row_of_data_from_
826    PL/pgSQL_functions.
827    
828   4.19) Why do I get "relation with OID ##### does not exist" errors when
829   accessing temporary tables in PL/PgSQL functions?
830   
831    In PostgreSQL versions < 8.3, PL/PgSQL caches function scripts, and an
832    unfortunate side effect is that if a PL/PgSQL function accesses a
833    temporary table, and that table is later dropped and recreated, and
834    the function called again, the function will fail because the cached
835    function contents still point to the old temporary table. The solution
836    is to use EXECUTE for temporary table access in PL/PgSQL. This will
837    cause the query to be reparsed every time.
838    
839    This problem does not occur in PostgreSQL 8.3 and later.
840    
841   4.20) What replication solutions are available?
842   
843    Though "replication" is a single term, there are several technologies
844    for doing replication, with advantages and disadvantages for each.
845    
846    Master/slave replication allows a single master to receive read/write
847    queries, while slaves can only accept read/SELECT queries. The most
848    popular freely available master-slave PostgreSQL replication solution
849    is Slony-I.
850    
851    Multi-master replication allows read/write queries to be sent to
852    multiple replicated computers. This capability also has a severe
853    impact on performance due to the need to synchronize changes between
854    servers. PGCluster is the most popular such solution freely available
855    for PostgreSQL.
856    
857    There are also commercial and hardware-based replication solutions
858    available supporting a variety of replication models.
859    
860   4.21) Why are my table and column names not recognized in my query? Why is
861   capitalization not preserved?
862   
863    The most common cause of unrecognized names is the use of
864    double-quotes around table or column names during table creation. When
865    double-quotes are used, table and column names (called identifiers)
866    are stored case-sensitive, meaning you must use double-quotes when
867    referencing the names in a query. Some interfaces, like pgAdmin,
868    automatically double-quote identifiers during table creation. So, for
869    identifiers to be recognized, you must either:
870      * Avoid double-quoting identifiers when creating tables
871      * Use only lowercase characters in identifiers
872      * Double-quote identifiers when referencing them in queries