Added some words to the bidix
[apertium.git] / apertium-en-ca / lextor-data / README
blob2010b338a8200997f06c1bd328e24e6385f42412
1 IMPORTANT NOTE: This version of apertium-en-ca does *not* use the
2 apertium-lextor program to perform lexical selection. For those words
3 that can be translated in more than one way the default one is always
4 selected.
6 To train the co-occurrences models to be used for the lexical
7 selection two corpora need to be provided:
8   - 'ca.txt' should contain a *huge* Catalan corpus in RAW format
9   - 'en.txt' should contain a *huge* English corpus in RAW format