These are taken care of
[apertium.git] / lttoolbox-unicode / lttoolbox / lt-proc.1
blob25a633ffb308562e62d6a9f137e15476e51a54a3
1 .TH lt-proc 1 2006-03-23 "" ""
2 .SH NAME
3 lt-proc \- This application is part of the lexical processing modules
4 and tools (
5 .B lttoolbox
7 .PP
8 This tool is part of the apertium machine translation
9 architecture: \fBhttp://apertium.sf.net\fR.
10 .SH SYNOPSIS
11 .B lt-proc
13 .B \-a \fR| 
14 .B \-g \fR|
15 .B \-n \fR|
16 .B \-p \fR|
17 .B \-s \fR|
18 .B \-v \fR|
19 .B \-h
20 ] fst_file [input_file [output_file]]
21 .PP
22 .B lt-proc
24 .B \-\-analysis \fR| 
25 .B \-\-generation \fR|
26 .B \-\-non-marked-gen \fR|
27 .B \-\-post-generation \fR|
28 .B \-\-sao \fR|
29 .B \-\-version \fR|
30 .B \-\-help
31 ] fst_file [input_file [output_file]]
32 .SH DESCRIPTION
33 .BR lt-proc 
34 is the application responsible of providing the four lexical
35 processing functionalities
37 .RS
38 \(bu \fImorphological analyser\fR  ( option \fB\-a\fR )
39 .PP
40 \(bu \fIlexical transfer\fR  ( option \fB\-n\fR )
41 .PP
42 \(bu \fImorphological generator\fR  ( option \fB\-g\fR )
43 .PP
44 \(bu \fIpost-generator\fR  ( option \fB\-p\fR )
45 .RE
46 \fR
47 .PP
48 It accomplishes these tasks by reading binary files containing a
49 compact and efficient representation of dictionaries (a class of
50 finite-state transducers called augmented letter transducers). These
51 files are generated by \fBlt\-comp(1)\fR.
52 .PP
53 It is worth to mention that some characters
54 (`\fB[\fR', `\fB]\fR', `\fB$\fR', `\fB^\fR', `\fB/\fR', `\fB+\fR') are
55 \fIspecial\fR chars used for format and encapsulation. They should be
56 escaped if they have to be used literally, for
57 instance: `\fB[\fR'...`\fB]\fR' are ignored and the format of a
58 \fIlinefeed\fR is `\fB^\fR...\fB$\fR'.
59 .SH OPTIONS
60 .TP
61 .B \-a, \-\-analysis
62 Tokenizes the text in surface forms (lexical units as they appear in
63 texts) and delivers, for each surface form, one or more lexical forms
64 consisting of lemma, lexical category and morphological inflection
65 information. Tokenization is not straightforward due to the existence,
66 on the one hand, of contractions, and, on the other hand, of
67 multi-word lexical units. For contractions, the system reads in a
68 single surface form and delivers the corresponding sequence of lexical
69 forms. Multi-word surface forms are analysed in a left-to-right,
70 longest-match fashion. Multi-word surface forms may be invariable
71 (such as a multi-word preposition or conjunction) or inflected (for
72 example, in es, \fI"echaban de menos"\fR, \(dqthey missed\(dq, is a
73 form of the imperfect indicative tense of the verb \fI"echar de
74 menos"\fR, \(dqto miss\(dq). Limited support for some kinds of
75 discontinuous multi-word units is also available. Single-word surface
76 forms analysis produces output like the one in these examples:
77 \fI"cantar"\fR \-> `\fI^cantar/cantar<vblex><inf>$\fR' or
78 \fI"cantaba"\fR \->
79 `\fI^cantaba/cantar<vblex><pii><p1><sg>/cantar<vblex><pii><p3><sg>$\fR'.
80 .TP
81 .B \-g, \-\-generation
82 Delivers a target-language surface form for each target-language
83 lexical form, by suitably inflecting it.
84 .TP
85 .B \-n, \-\-non-marked-gen
86 Morphological generation (like \fB-g\fR) but without unknown word
87 marks (asterisk `*').
88 .TP
89 .B \-p, \-\-post-generation
90 Performs orthographical operations such as contractions and
91 apostrophations. The post-generator is usually \fIdormant\fR (just
92 copies the input to the output) until a special \fIalarm\fR symbol
93 contained in some target-language surface forms \fIwakes\fR it up to
94 perform a particular string transformation if necessary; then it goes
95 back to sleep.
96 .TP
97 .B \-s, \-\-sao
98 Input processing is in \fIorthoepikon\fR (previosuly `\fIsao\fR')
99 annotation system format: \fBhttp://orthoepikon.sf.net\fR.
101 .B \-v, \-\-version
102 Display the version number.
104 .B \-h, \-\-help
105 Display this help.
106 .SH FILES
107 .B input_file
108 The input compiled dictionary.
109 .SH SEE ALSO
110 .I lt-expand\fR(1),
111 .I lt-comp\fR(1),
112 .I apertium-tagger\fR(1),
113 .I apertium-translator\fR(1).
114 .SH BUGS
115 Lots of...lurking in the dark and waiting for you!
116 .SH AUTHOR
117 (c) 2005,2006 Universitat d'Alacant / Universidad de Alicante. All rights
118 reserved.