Add verb
[apertium.git] / apertium-en-pl / English_to_Polish.txt
blob98cecc607e4426b52dcbce647674e47122cf439a
1 ==Roadmap==
3 ===apertium-en-pl 0.1===
5 *'''Vocabulary''': The [http://www.aqa.org.uk/qual/pdf/AQA-3686-W-SP-09.PDF GCSE Polish course specification] contains a dictionary of the most important words.
6 ::<u>Current coverage</u>: Monodix (499/2855, 17%) &mdash; Bidix: (599/2855, 19%) <small>[14:12, 28 October 2007 (UTC)]</small>
8 Note: the categorized vocabulary list contains some spelling errors, e.g. gogzina (godzina) w pót di dziesiąteh (w pół do dziesiątej).
10 ==Morphology==
12 ===Nouns===
13 Polish is a highly inflected language; nouns (and adjectives describing them) are declined according to gender, number, and case. Traditionally, Polish is considered to have 3 genders (masculine, feminine, and neuter), but the more modern view<ref>Jagodziński [http://grzegorj.w.interia.pl/gram/przypdys.html Jak przedstawić obraz polskiej deklinacji? – How to present a view of the Polish declension?]</ref>  is that is contains 5<ref>Though Willim mentions that it may contain as many as 9! - [http://ifa.amu.edu.pl/plm/files/Abstracts/PLM2007_Abstract_Willim.pdf On gender resolution in Polish]</ref>: masculine person (m1 in Apertium), masculine animate (m2), masculine inanimate (m3), feminine, and neuter. The masculine genders can be thought of as steps: in the absence of a particular rule for that case, the rule beneath applies -- a rule for m3 applies to m2 and m1, a rule for m2 applies to m1.
15 The cases are: nominative (subject), accusative (object), dative (indirect object), genitive (possessive, negative object, quantities), locative (used only with prepositions), instrumental (by means of something), and vocative (addressing something).
17 ===Verbs===
19 Polish has typically two forms for each verb, the perfective and the imperfective aspect. These usually come with a change in stem, for example:
21 {|class=wikitable
22 ! Imperfective !! Perfective !! Gloss
24 | widzieć      || zobaczyć   || to see
26 | stawiać      || postawić   || to set up
30 The perfective denotes a completed action. According to Wikipedia, "The aspectual distinctions exist on the lexical level &mdash; there is no unique method to form a perfective verb from a given imperfective one."<ref>Wikipedia [http://en.wikipedia.org/wiki/Grammatical_aspect#Aspect_in_Slavic_languages Grammatical aspect in Slavic languages]</ref>
32 The imperfective is used for the present tense ('Co robisz?': 'What are you doing?') and for negative commands ('Nie rób tego': 'don't (ever) do that', or to use Hiberno English 'don't be doing that'); the perfective for the simple future ('Czy zrobisz to?': 'Will you do it?') and for positive commands ('Zrób to szybciej': 'Do it faster')
34 <blockquote>
35 [I]n some verbs the perfective form (for example, napisać) is formed out of an underlying
36 imperfective form (pisać), via a prefixisation process that many linguists would argue
37 is a clear example of derivational morphology. On the other hand, in some verbs the
38 imperfective form (for example, kupować) is formed out of an underlying perfective
39 form (kupić), via a ‘suffixisational’ process that many linguists would argue is a clear
40 example of inflectional morphology. Furthermore, in yet other verbs (namely verbs
41 in suppletive pairs such as brać/wziąć) all linguists (as far as we are aware) would
42 agree that there is no morphological link whatsoever between the two verbs.
43 <ref name="pairing">Młynarczyk [http://igitur-archive.library.uu.nl/dissertations/2004-0309-140804/inhoud.htm Aspectual Pairing in Polish]</ref>
44 </blockquote>
46 ;Apertium notes
48 As this is lexicalised, there is only one way to deal with it, and that is in the dictionaries, each verb will have two entries in the bilingual dictionary, one for perfective and one for imperfective.
50 For example:
52 <pre>
53     <e><p><l>read<s n="vblex"/></l><r>czytać<s n="vblex"/><s n="imperf"/></r></p></e>
54     <e><p><l>read<s n="vblex"/></l><r>przeczytać<s n="vblex"/><s n="perf"/></r></p></e>
55 </pre>
57 ==== Further complications ====
59 As well as perfective/imperfective pairs, there are also habitual verbs (''czytywałem'' - I used to read from time to time), and there are pairs which distinguish between non-determined and determined motion (''chodzić'' - to go, with no particular destination in mind vs. ''iść'' - to go, with a destination in mind). 
61 Młynarczyk<ref name="pairing"/> argues that Polish aspect can be further divided, based on the addition of "empty" prefixes, the prefix ''po'', the infix ''ną'', or with a morphonological change, and provides this table:
63 {|class=wikitable
64 ! !! ep !! po- !! -ną- !! mpc
66 | class1 || yes || || || 
68 | class2 || || yes || || 
70 | class3 || yes || yes || || 
72 | class4 || yes || yes || yes ||
74 | class5 || || || || yes
78 Labenz <ref name="event">Labenz [http://staff.science.uva.nl/~michiell/docs/thesisPL.pdf Event-calculus semantics of Polish aspect]</ref> further refines this:
80 {|class=wikitable
81 ! Class !! Aspect and formant !! Aktionsart !! Example
84 | 1s || impfv || state || wierzyć 'to be believing'
86 | 1s || pfv, ep || inception of an ongoing state || uwierzyć 'to have started believing'
88 | 1t || impfv || transition || grubnąć 'to be growing fat(ter)'
90 | 1t || pfv, ep || completed transition || zgrubnąć 'to have grown fat'
92 | 2 || impfv || activity || siedzieć 'to be sitting'
94 | 2 || pfv, po- || terminated activity || posiedzieć 'to have been sitting a bit'
96 | 3 || impfv || ongoing accomplishment || czytać 'to be reading'
98 | 3 || pfv, ep || accomplishment || przeczytać 'to have read'
100 | 3 || pfv, po- || terminated accomplishment || poczytać 'to have been reading a bit'
102 | 4 || impfv || semelfactive activity || pukać 'to be knocking'
104 | 4 || pfv, ep || completed semelfactive || zapukać 'to have knocked'
106 | 4 || pfv, po- || non-minimal semelfactive || popukać 'to have been knocking a bit'
108 | 4 || pfv, -ną- || minimal semelfactive || puknąć 'to have knocked once'
110 | 5 || pfv, mp || achievement || kupić 'to have bought'
112 | 5 || impfv || ongoing achievement || kupować 'to be buying'
116 In Apertium, these aspect differences can be handled in the Polish monodix.
118 <!--- Russian is similar: http://www.unc.edu/depts/slavdept/lajanda/clustersrewritefinal.doc --->
120 ==Syntax==
122 ===Articles===
124 Polish doesn't have articles, so translating English→Polish, we'll need to remove them, translating Polish→English, we'll need to add them. 
126 <pre>
127    Mam               zegar
128    mieć+p1.sg.pres 
129    have+I            clock+nom
130 `I have a clock'
131 </pre>
133 ;Apertium notes
135 There aren't really any rules to this, so the fallback will be "if we can't tell for sure, leave them out".
137 ===Word order===
139 Basic English and Polish word order are the same, SVO; however, as Polish morphology details the part of speech, Polish word order can vary to provide emphasis.
141 "Ja kocham Ciebie" = "I love you"
143 "Ciebie ja kocham" = "I love ''you''"
145 ===Object dropping===
147 In answering questions, it is common in Polish to omit the object ("Czy kupiłeś piwo? - Kupiłem": "Did you buy beer? - I bought"). However, as Polish speakers of English commonly drop the object in English, perhaps it's acceptable for us to do so too.<ref>Kowaluk [http://www.rceal.cam.ac.uk/Publications/Working/Vol6/Kowaluk.pdf Null objects in Polish: Pronouns and determiners in Second Language Acquisition]</ref>
149 ==Resources==
151 ===Polish-English texts under free licences===
152 {{see-also|Corpora}}
153 *[http://www.oreilly.com/openbook/freedom/index.html Free As In Freedom] - [http://stallman.helion.pl/ W obronie wolności] ("In the Defense of Freedom")
154 *[http://www.gutenberg.org/dirs/etext04/lchch10.txt Chess and Checkers: the Way to Mastership] - [http://www.gutenberg.org/files/15201/15201-8.txt Szachy i Warcaby: Droga do mistrzostwa]
155 *[http://en.wikisource.org/wiki/The_Tragedy_of_Romeo_and_Juliet The Tragedy of Romeo and Juliet] - [http://pl.wikisource.org/wiki/Romeo_i_Julia Romeo i Julia]
156 *[http://en.wikisource.org/wiki/Robinson_Crusoe Robinson Crusoe] - [http://pl.wikisource.org/wiki/Robinson_Cruzoe Przypadki Robinsona Cruzoe]
157 **Wikisource has a mechanism where they ''try'' to present automatic bilingual editions of any works they have: see [http://pl.wikisource.org/wiki/Robinson_Cruzoe?match=en Robinson Crusoe] for example. Unfortunately, it doesn't work, as different choices have been made in the laying out of different language editions. But it looks interesting.
158 *[http://languagetool.cvs.sourceforge.net/*checkout*/languagetool/JLanguageTool/src/rules/false-friends.xml False friends dictionary] Also contains French and German.
159 *[http://jv.gilead.org.il/pg/7jrny10.txt Journey to the Centre of the Earth] - [http://jv.gilead.org.il/zydorczak/terre-pl00.htm Podróż do środka Ziemi]
160 *The Outpost (contained in [http://www.gutenberg.org/dirs/etext05/8pltl10.txt Selected Polish Tales]) - [http://pl.wikisource.org/wiki/Plac%C3%B3wka Placówka]
162 ===Polish texts under free licences===
163 *[http://www.mimuw.edu.pl/polszczyzna/ Enriched Corpus of the Frequency Dictionary] - Monolingual corpus of Polish. Manually tagged. A [http://korpus.pl/download/frek.bin.tar.bz2 compiled version] for [http://poliqarp.sourceforge.net/ Poliqarp] is also available.
165 ===Polish grammar===
166 *[http://free.of.pl/g/grzegorj/gram/gram00.html A Grammar of the Polish Language] by Grzegorz Jagodziński
167 *[http://polish.slavic.pitt.edu/grammar.pdf A Grammar of Contemporary Polish] by Oscar E. Swan