fix regex error message parsing (GRegex indexes subgroups, not matches)
[geany-mirror.git] / HACKING
bloba49c03db413026b5226fc78fee34412469baafca
1 =============
2 Hacking Geany
3 =============
4 .. contents::
6 General
7 =======
9 About this file
10 ---------------
11 This file contains information for anyone wanting to work on the Geany
12 codebase. You should be aware of the open source licenses used - see
13 the README file or the documentation. It is reStructuredText; the
14 source file is HACKING. You can generate hacking.html by running ``make
15 hacking-doc`` from the doc/ subdirectory.
17 Writing plugins
18 ---------------
19 * src/plugindata.h contains the plugin API data types.
20 * See plugins/demoplugin.c for a very basic example plugin.
21 * src/plugins.c loads and unloads plugins (you shouldn't need to read
22   this really).
23 * The API documentation contains a few basic guidelines and hints to
24   write plugins.
26 You should generate and read the plugin API documentation, see below.
28 Plugin API documentation
29 ^^^^^^^^^^^^^^^^^^^^^^^^
30 You can generate documentation for the plugin API using the doxygen
31 tool. Run ``make api-doc`` in the doc subdirectory. The documentation
32 will be output to doc/reference/index.html.
33 Alternatively you can view the API documentation online at
34 http://www.geany.org/manual/reference/.
36 Patches
37 -------
38 We are happy to receive patches, but it's best to check with us by email
39 or mailing list whether a new feature is appropriate, and whether someone
40 is already working on similar code.
42 In general it's best to provide git-formatted patches made from the
43 current Git (see `Committing`_)::
45     $ git commit -a
46     $ git format-patch HEAD^
48 We also accept patches against other releases, but it's more work for us.
50 If you're not using Git, although you're strongly suggested to used it,
51 you can use the diff command::
53     $ diff -u originalpath modifiedpath > new-feature.patch
55 However, such a patch won't contain the authoring information nor the
56 patch's description.
58 .. note::
59     Please make sure patches follow the style of existing code - In
60     particular, use tabs for indentation. See `Coding`_.
62 Windows tools
63 -------------
64 * Git: http://git-scm.com/ and http://code.google.com/p/msysgit/
65 * diff, grep, etc: http://mingw.org/ or http://unxutils.sourceforge.net/
67 See also the 'Building on Windows' document on the website.
69 File organization
70 -----------------
71 callbacks.c is just for Glade callbacks.
72 Avoid adding code to geany.h if it will fit better elsewhere.
73 See the top of each ``src/*.c`` file for a brief description of what
74 it's for.
76 Plugin API code
77 ---------------
78 Please be aware that anything with a doc-comment (a comment with an
79 extra asterix: ``/**``) is something in the plugin API. Things like
80 enums and structs can usually still be appended to, ensuring that all
81 the existing elements stay in place - this will keep the ABI stable.
83 .. warning::
85     Some structs like GeanyCallback cannot be appended to without
86     breaking the ABI because they are used to declare structs by
87     plugins, not just for accessing struct members through a pointer.
88     Normally structs should never be allocated by plugins.
90 Keeping the plugin ABI stable
91 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
92 Before the 1.0 release series, the ABI can change when necessary, and
93 even the API can change. An ABI change just means that all plugins will
94 not load and they must be rebuilt. An API change means that some plugins
95 might not build correctly.
97 If you're reordering or changing existing elements of structs that are
98 used as part of the plugin API, you must increment GEANY_ABI_VERSION
99 in plugindata.h. This is usually not needed if you're just appending
100 fields to structs. The GEANY_API_VERSION value should be incremented
101 for any changes to the plugin API, including appending elements.
103 If you're in any doubt when making changes to plugin API code, just ask us.
105 Plugin API/ABI design
106 ^^^^^^^^^^^^^^^^^^^^^
107 You should not make plugins rely on the size of a struct. This means:
109 * Don't let plugins allocate any structs (stack or heap).
110 * Don't let plugins index any arrays of structs.
111 * Don't add any array fields to structs in case we want to change the
112   array size later.
114 Doc-comments
115 ^^^^^^^^^^^^
116 * The @file tag can go in the source .c file, but use the .h header name so
117   it appears normally in the generated documentation. See ui_utils.c for an
118   example.
119 * Function doc-comments should always go in the source file, not the
120   header, so they can be updated if/when the implementation changes.
122 Glade
123 -----
124 Add user-interface widgets to the Glade 3 file ``data/geany.glade``.
125 Callbacks for the user-interface should go in ``src/callbacks.c``.
127 GTK versions & API documentation
128 --------------------------------
129 Geany requires GTK >= 2.16 and GLib >= 2.20. API symbols from newer
130 GTK/GLib versions should be avoided or made optional to keep the source
131 code building on older systems.
133 The official GTK 2.16 API documentation may not be available online
134 anymore, so we put it on http://www.geany.org/manual/gtk/. There
135 is also a tarball with all available files for download and use with
136 devhelp.
138 Using the 2.16 API documentation of the GTK libs (including GLib, GDK
139 and Pango) has the advantages that you don't get confused by any
140 newer API additions and you don't have to take care about whether
141 you can use them or not.
143 Coding
144 ------
145 * Don't write long functions with a lot of variables and/or scopes - break
146   them down into smaller static functions where possible. This makes code
147   much easier to read and maintain.
148 * Use GLib types and functions - gint not int, g_free() not free().
149 * Your code should build against GLib 2.20 and GTK 2.16. At least for the
150   moment, we want to keep the minimum requirement for GTK at 2.16 (of
151   course, you can use the GTK_CHECK_VERSION macro to protect code using
152   later versions).
153 * Variables should be declared before statements. You can use
154   gcc's -Wdeclaration-after-statement to warn about this.
155 * Don't let variable names shadow outer variables - use gcc's -Wshadow
156   option.
157 * Do not use G_LIKELY or G_UNLIKELY (except in critical loops). These
158   add noise to the code with little real benefit.
160 Compiler options & warnings
161 ^^^^^^^^^^^^^^^^^^^^^^^^^^^
162 Use ``CFLAGS='-Wfoo' ./configure`` or ``CFLAGS='-Wfoo' ./autogen.sh``
163 to set warning options (as well as anything else e.g. -g -O2).
165 * Enable warnings - for gcc use '-Wall -W' (and optionally
166   -Wno-unused-parameter to avoid unused parameter warnings in Glade
167   callbacks).
168 * You should try to write ISO C99 code for portability, so always
169   use C ``/* */`` comments and function_name(void) instead of
170   function_name(). This is for compatibility with various Unix-like
171   compilers. You should use -std=c99 to help check this.
173 .. tip::
174     Remember for gcc you need to enable optimization to get certain
175     warnings like uninitialized variables, but for debugging it's
176     better to have no optimization on.
178 Style
179 ^^^^^
180 * We use a tab width of 4 and indent completely with tabs not spaces.
181   Note the documentation files use (4) spaces instead, so you may want
182   to use the 'Detect from file' indent pref.
183 * Do not add whitespace at the end of lines, this adds to commit noise.
184   When editing with Geany set preference files->Strip trailing spaces
185   and tabs.
186 * Use the multiline comment ``/* */`` to comment small blocks of code,
187   functions descriptions or longer explanations of code, etc. The more
188   comments are in your code the better. (See also
189   ``scripts/fix-cxx-comments.pl`` in Git).
190 * Lines should not be longer than about 100 characters and after 100
191   characters the lines should be wrapped and indented once more to
192   show that the line is continued.
193 * We don't put spaces between function names and the opening brace for
194   argument lists.
195 * Variable declarations come first after an opening brace, then one
196   newline to separate declarations and code.
197 * 2-operand operators should have a space each side.
198 * Function bodies should have 2 blank newlines after them.
199 * Align braces together on separate lines.
200 * Don't put assignments in 'if/while/etc' expressions except for loops,
201   for example ``for (int i = 0; i < some_limit; i++)``.
202 * if statements without brace bodies should have the code on a separate
203   line, then a blank line afterwards.
204 * Use braces after if/while statements if the body uses another
205   if/while statement.
206 * Try to fit in with the existing code style.
208 .. note::
209     A few of the above can be done with the Git
210     ``scripts/fix-alignment.pl``, but it is quite dumb and it's much better
211     to write it correctly in the first place.
212     ``scripts/rstrip-whitespace.py`` just removes trailing whitespace.
215 .. below tabs should be used, but spaces are required for reST.
217 Example::
219     struct Bar;
221     typedef struct Foo  /* struct names normally are the same as typedef names */
222     {
223         gint    foo;    /* names are somewhat aligned visually */
224         gint    bar;    /* fields don't share the same line */
225         SomeLongTypeName baz; /* alignment is not strict */
226         gchar   *ptr;   /* pointer symbol must go next to variable name, not type */
227         Bar     public; /**< only plugin API fields have a doc-comment */
228     }
229     Foo;
232     gint some_func(void);
234     gint some_other_func(void);
237     /* optional function comment explains something important */
238     gint function_long_name(gchar arg1, <too many args to fit on this line>,
239             gchar argN)
240     {
241         /* variable declarations always go before code in each scope */
242         /* variable names should NOT be aligned at all */
243         gint foo, bar;  /* variables can go on the same line */
244         gint baz;       /* but often don't */
245         gchar *ptr;     /* pointer symbol must go next to variable name, not type */
246         gchar *another; /* pointers should normally go on separate lines */
248         /* Some long comment block
249          * taking several different
250          * lines to explain */
251         if (foo)
252         {
253             /* variables only used in one scope should normally be declared there */
254             gint dir = -1;
256             bar = foo;
257             if ((bar & (guint)dir) != 7)
258                 some_code(arg1, <too many args to fit on this line>,
259                     argN - 1, argN);
261             some_func();
262         }
263     }
266     /** Explains using doc-comments for plugin API functions.
267      * First line should be short and use the third person tense - 'explains',
268      * not 'explain'.
269      *
270      * @return Some number.
271      * @since 1.22. */
272     gint another_function(void)
273     {
274         ...
277 Committing
278 ----------
280 * Commit one thing at a time, do small commits.  Commits should be
281   meaningful and not too big when possible; multiple small commits are
282   good if there is no good reason to group them.
283 * Use meaningful name and email in the Author and Committer fields.
284   This helps knowing who did what and allows to contact the author if
285   there is a good reason to do so (unlikely, but can happen).
286 * When working on a new feature, create a new branch for it.  When
287   merging it, use the --no-ff option to make sure a merge commit will
288   be created to better track what happened.  However, if the feature
289   only took one commit you might merge it fast-forward since there is
290   not history to keep together.
292 Commit messages
293 ^^^^^^^^^^^^^^^
294 Follow the standard Git formatting:
296 * No line should use more than about 80 characters (around 72 is best).
297 * The first line is the commit's summary and is followed by an empty
298   line.  This summary should be one line and one line only, thus less
299   than 80 characters.  This summary should not include any punctuation
300   unless really needed.  See it as the subject of an email: keep it
301   concise and as precise as you can, but not tool long.
302 * Following lines are optional detailed commit information, with
303   paragraphs separated by blank lines.  This part should be as long as
304   needed to describe the commit in depth, should use proper
305   punctuation and should include any useful information, like the
306   motivation for the patch and/or any valuable details the diff itself
307   don't provide or don't make clear.  Make it as complete as you think
308   it makes sense, but don't include an information that is better
309   explained by the commit's diff.
311   It is OK to use ASCII formatting like bullet list using "*" or "-",
312   etc. if useful, but emphasis (bold, italic, underline) should be
313   avoided.
315 Example::
317     Ask the user if spawn fails in utils_open_browser()
319     Ask the user to configure a valid browser command if spawning it
320     fails rather than falling back to some arbitrary hardcoded defaults.
322     This avoid spawning an unexpected browser when the configured one is
323     wrong, and gives the user a chance to correctly fix the preference.
326 Testing
327 -------
328 * Run with ``-v`` to print any debug messages.
329 * You can use a second instance (``geany -i``).
330 * To check first-run behaviour, use an alternate config directory by
331   passing ``-c some_dir`` (but make sure the directory is clean first).
332 * For debugging tips, see `GDB`_.
334 Bugs to watch out for
335 ---------------------
336 * Forgetting to check *doc->is_valid* when looping through
337   *documents_array* - instead use *foreach_document()*.
338 * Inserting fields into structs in the plugin API instead of appending.
339 * Not breaking the plugin ABI when necessary.
340 * Using an idle callback that doesn't check main_status.quitting.
341 * Forgetting to call vStringTerminate in CTags code.
342 * Forgetting CRLF line endings on Windows.
343 * Not handling Tabs & Spaces indent mode.
345 Libraries
346 ---------
347 We try to use an unmodified version of Scintilla - any new lexers or
348 other changes should be passed on to the maintainers at
349 http://scintilla.org. We normally update to a new Scintilla release
350 shortly after one is made. See also scintilla/README.
352 Tagmanager was originally taken from Anjuta 1.2.2, and parts of it
353 (notably c.c) have been merged from later versions of Anjuta and
354 CTags. The independent Tagmanager library itself ceased development
355 before Geany was started. It's source code parsing is mostly taken from
356 Exuberant CTags (see http://ctags.sf.net). If appropriate it's good to
357 pass language parser changes back to the CTags project.
360 Notes
361 =====
362 Some of these notes below are brief (or maybe incomplete) - please
363 contact the geany-devel mailing list for more information.
365 Using pre-defined autotools values
366 ----------------------------------
367 When you are use macros supplied by the autotools like GEANY_PREFIX,
368 GEANY_LIBDIR, GEANY_DATADIR and GEANY_LOCALEDIR be aware that these
369 might not be static strings when Geany is configured with
370 --enable-binreloc. Then these macros will be replaced by function calls
371 (in src/prefix.h). So, don't use anything like
372 printf("Prefix: " GEANY_PREFIX); but instead use
373 printf("Prefix: %s", GEANY_PREFIX);
375 Adding a source file foo.[hc] in src/ or plugins/
376 -------------------------------------------------
377 * Add foo.c, foo.h to SRCS in path/Makefile.am.
378 * Add foo.o to OBJS in path/makefile.win32.
379 * Add path/foo.c to geany_sources in wscript.
380 * Add path/foo.c to po/POTFILES.in (for string translation).
382 Adding a filetype
383 -----------------
384 You can add a filetype without syntax highlighting or tag parsing, but
385 check to see if those features have been written in upstream projects
386 first (scintilla or ctags).
388 **Custom:**
390 If you want to reuse an existing lexer and/or tag parser, making a
391 custom filetype is probably easier - it doesn't require any
392 changes to the source code. Follow instructions in the manual:
393 http://geany.org/manual/geany.html#custom-filetypes. Don't forget to
394 update the ``[Groups]`` section in ``filetype_extensions.conf``.
396 .. warning::
397   You should use the newer `[build-menu]` section for default build
398   commands - the older `[build_settings]` may not work correctly for
399   custom filetypes.
401 **Built-in:**
403 * Add GEANY_FILETYPES_FOO to filetypes.h.
404 * Initialize GEANY_FILETYPES_FOO in init_builtin_filetypes() of
405   filetypes.c.
406 * Update data/filetype_extensions.conf.
408 The remaining notes relate mostly to built-in filetypes.
410 filetypes.* configuration file
411 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
412 All languages need a data/filetypes.foo configuration file. See
413 the "Filetype definition files" section in the manual and/or
414 data/filetypes.c for an example.
416 Programming languages should have:
418 * [keywords] if the lexer supports it.
419 * [settings] mostly for comment settings.
420 * [build-menu] (or [build_settings]) for commands to run.
422 For languages with a Scintilla lexer, there should be a [styling] section,
423 to correspond to the styles used in highlighting_styles_FOO[] in
424 highlightingmappings.h - see below.
426 Syntax highlighting
427 ^^^^^^^^^^^^^^^^^^^
428 It may be possible to use an existing Scintilla lexer in the scintilla/
429 subdirectory - if not, you will need to find (or write) one,
430 LexFoo.cxx. Try the official Scintilla project first.
432 .. warning::
433     We won't accept adding a lexer that conflicts with one in
434     Scintilla. All new lexers should be submitted back to the Scintilla
435     project to save duplication of work.
437 When adding a lexer, update:
439 * scintilla/Makefile.am
440 * scintilla/makefile.win32
441 * wscript
442 * scintilla/src/Catalogue.cxx - add a LINK_LEXER command *manually*
444 For syntax highlighting, you will need to edit highlighting.c and
445 highlightingmappings.h and add the following things:
447 1. In highlightingmappings.h:
449    a. define ``highlighting_lexer_FOO`` to the Scintilla lexer ID for
450       this filtype, e.g. ``SCLEX_CPP``.
451    b. define the ``highlighting_styles_FOO`` array that maps Scintilla
452       style states to style names in the configuration file.
453    c. define ``highlighting_keywords_FOO`` to ``EMPTY_KEYWORDS`` if the
454       filtype has no keywords, or as an ``HLKeyword`` array mapping
455       the Scintilla keyword IDs to names in the configuration file.
456    d. define ``highlighting_properties_FOO`` to ``EMPTY_PROPERTIES``, or
457       as an array of ``HLProperty`` if the filetype requires some lexer
458       properties to be set.  However, note that properties should
459       normally be set in the ``[lexer_properties]`` section of the
460       configuration file instead.
462    You may look at other filtype's definitions for some examples
463    (Ada, CSS or Diff being good examples).
465 2. In highlighting.c:
467    a. Add ``init_styleset_case(FOO);`` in ``highlighting_init_styles()``.
468    b. Add ``styleset_case(FOO);`` in ``highlighting_set_styles()``.
470 3. Write data/filetypes.foo configuration file [styling] section. See
471    the manual and see data/filetypes.d for a named style example.
473 .. note::
474     Please try to make your styles fit in with the other filetypes'
475     default colors, and to use named styles where possible (e.g.
476     "commentline=comment"). Filetypes that share a lexer should have
477     the same colors. If not using named styles, leave the background color
478     empty to match the default color.
480 Error message parsing
481 ^^^^^^^^^^^^^^^^^^^^^
482 New-style error message parsing is done with an extended GNU-style regex
483 stored in the filetypes.foo file - see the [build_settings] information
484 in the manual for details.
486 Old-style error message parsing is done in
487 msgwin_parse_compiler_error_line() of msgwindow.c - see the ParseData
488 typedef for more information.
490 Other features
491 ^^^^^^^^^^^^^^
492 If the lexer has comment styles, you should add them in
493 highlighting_is_comment_style(). You should also update
494 highlighting_is_string_style() for string/character styles. For now,
495 this prevents calltips and autocompletion when typing in a comment
496 (but it can still be forced by the user).
498 For brace indentation, update lexer_has_braces() in editor.c;
499 indentation after ':' is done from on_new_line_added().
501 If the Scintilla lexer supports user type keyword highlighting (e.g.
502 SCLEX_CPP), update document_update_tags() in document.c.
504 Adding a TagManager parser
505 ^^^^^^^^^^^^^^^^^^^^^^^^^^
506 This assumes the filetype for Geany already exists.
508 First write or find a CTags compatible parser, foo.c. Note that there
509 are some language patches for CTags at:
510 http://sf.net/projects/ctags - see the tracker.
512 (You can also try the Anjuta project's tagmanager codebase.)
514 .. note::
515     From Geany 1.22 GLib's GRegex engine is used instead of POSIX
516     regex, unlike CTags. It should be close enough to POSIX to work
517     OK.
518     We no longer support regex parsers with the "b" regex flag
519     option set and Geany will print debug warnings if it's used.
520     CTags supports it but doesn't currently (2011) include any
521     parsers that use it. It should be easy to convert to extended
522     regex syntax anyway.
524 Method
525 ``````
526 * Add foo.c to SRCS in Makefile.am.
527 * Add foo.o to OBJS in makefile.win32.
528 * Add path/foo.c to geany_sources in wscript.
529 * Add Foo to parsers.h
530 * Add TM_PARSER_FOO to tagmanager/src/tm_parser.h.  The list here must follow
531   exactly the order in parsers.h.
533 In foo.c:
534 Edit FooKinds 3rd column to match a s_tag_type_names string in tm_tag.c.
535 (You may want to make the symbols.c change before doing this).
537 In filetypes.c, init_builtin_filetypes():
538 Set the 2nd argument of the FT_INIT() macro for this filetype to FOO.
540 In symbols.c:
541 Unless your parser uses C-like tag type kinds, update
542 add_top_level_items() for foo, calling tag_list_add_groups(). See
543 get_tag_type_iter() for which tv_iters fields to use.
545 Tests
546 `````
547 The tag parser tests checks if the proper tags are emitted
548 for a given source. Tests for tag parsers consist of two files: the
549 source to parse, and the expected output. Tests are run using ``make
550 check``.
552 The source to parse should be in the file ``tests/ctags/mytest.ext``,
553 where ``mytest`` is the name you choose for your test, and ``ext`` is an
554 extension recognized by Geany as the language the test file is for.
555 This file should contain a snippet of the language to test for.
556 It can be either long or short, depending on what it tests.
558 The expected output should be in the file ``tests/ctags/mytest.ext.tags``
559 (which is the same name as the source, but with ``.tags`` appended), and
560 should be in the format generated by ``geany -g``. This file contains
561 the tag information expected to be generated from the corresponding
562 source file.
564 When you have these two files, you have to list your new test along the
565 other ones in the ``test_source`` variable in ``tests/ctags/Makefile.am``.
566 Please keep this list sorted alphabetically.
571 Stop on warnings
572 ^^^^^^^^^^^^^^^^
573 When a GLib or GTK warning is printed, often you want to get a
574 backtrace to find out what code caused them. You can do that with the
575 ``--g-fatal-warnings`` argument, which will abort Geany on the first
576 warning it receives.
578 But for ordinary testing, you don't always want your editor to abort
579 just because of a warning - use::
581     (gdb) b handler_log if level <= G_LOG_LEVEL_WARNING
584 Running with batch commands
585 ^^^^^^^^^^^^^^^^^^^^^^^^^^^
586 Use::
588     $ gdb src/geany -x gdb-commands
590 Where ``gdb-commands`` is a file with the following lines::
592     set pagination off
593     b handler_log if level <= G_LOG_LEVEL_WARNING
594     r -v
597 Loading a plugin
598 ^^^^^^^^^^^^^^^^
599 This is useful so you can load plugins without installing them first.
600 Alternatively you can use a symlink in ~/.config/geany/plugins or
601 $prefix/lib/geany (where $prefix is /usr/local by default).
603 The gdb session below was run from the toplevel Geany source directory.
604 Start normally with e.g. "gdb src/geany".
605 Type 'r' to run.
606 Press Ctrl-C from the gdb window to interrupt program execution.
608 Example::
610     Program received signal SIGINT, Interrupt.
611     0x00d16402 in __kernel_vsyscall ()
612     (gdb) call plugin_new("./plugins/.libs/demoplugin.so")
613     ** INFO: Loaded:   ./plugins/.libs/demoplugin.so (Demo)
614     $1 = (Plugin *) 0x905a890
615     (gdb) c
616     Continuing.
618     Program received signal SIGINT, Interrupt.
619     0x00d16402 in __kernel_vsyscall ()
620     (gdb) call plugin_free(0x905a890)
621     ** INFO: Unloaded: ./plugins/.libs/demoplugin.so
622     (gdb) c
623     Continuing.
625 Building Plugins
626 ^^^^^^^^^^^^^^^^
628 The geany-plugins autotools script automatically detects the
629 installed system Geany and builds the plugins against that.
631 To use plugins with a development version of Geany built with
632 a different prefix, the plugins will need to be compiled against
633 that version if the ABI has changed.
635 To do this you need to specify both --prefix and --with-geany-libdir
636 to the plugin configure.  Normally the plugin prefix is the
637 same as the Geany prefix to keep plugins with the version of Geany
638 that they are compiled against, and with-geany-libdir is the Geany
639 prefix/lib.
641 Whilst it is possible for the plugin prefix to be different to
642 the prefix of the libdir (which is why there are two settings),
643 it is probably better to keep the version of Geany and its plugins
644 together.