Added framework for creaky voice pitch change
[sgc2.git] / ManPages / Creating_a_new_word_list.man
blob527eed79f45b43ac7e42e1d642f298ddc7926320
1 ManPagesTextFile
2 "Creating a new word list" "R.J.J.H. van Son" 20140901 0
3 <intro> "How to create a new word list to @@Reading an existing word list|use with SpeakGoodChinese@. "
5 <entry> "Creating a word list"
6 <normal> "Word lists can be created by any text editor that can produce plain text files (%%.txt%) and by spreadsheet or database programs that can export to %%tab-separated-value% (%%.tsv%) tables. "
9 <entry> "Very simple word lists"
11 <normal> "The easiest and simplest way to create a word list is to create a pure text file (%%.txt%, or DOS file). 
12 The file should have the name of the word list and the extention should be %%.txt%. 
13 Each line should countain a single pinyin word."
15 <normal> "##Example: %%SGC2example1.txt%#"
16 <code> "chi1"
17 <code> "ta1"
18 <code> "jin1tian1"
19 <code> "can1ting1"
20 <code> "huan1ying2"
21 <code> "zhong1guo2"
22 <code> "duo1shao3"
23 <code> "zhi3you3"
25 <entry> "Simple word lists with characters and translations"
27 <normal> "Characters and translations can be added to the simple, text based word list descibed above. Again, create a pure text (.txt, or DOS file) file with the .txt extention. Each line should start with a pinyin word. Next, follow the pinyin by a tab or ';' character and the characters that correspond to the pinyin, again a tab or ';' character and the translation in free text. Translations can be in any language. For instance, 吃 can be entered as %%to eat%, कालो, 食べる, ჭამა or any other transcription in UTF8."
30 <normal> "##Example: %%SGC2example2.txt%#"
31 <code> "chi1;吃;to eat"
32 <code> "ta1;他;he, she, it"
33 <code> "jin1tian1;今天;today"
34 <code> "can1ting1;餐厅;restaurant"
35 <code> "huan1ying2;欢迎;to welcome"
36 <code> "zhong1guo2;中国;China"
37 <code> "duo1shao3;多少;how many"
38 <code> "zhi3you3;只有;only"
40 <normal> "Audio files can be added in the same manner. Just add an item with the extention of an audio file to the line (between tabs or ';' characters). For instance, chi1.mp3 will be interpreted as an audio example."
42 <normal> "These simple word lists do not contain information about the order and nature of the items. There can be errors in distinguishing characters, translations, and audio examples."
44 <entry> "Word list tables"
45 <normal> "Simple word lists based on text files can lead to errors in the values of the items. Large lists with both characters and translations should be constructed as tab-separated-values (%%.tsv%) tables. These can be exported (%%Save as%) from a spreadsheet or database program. The file extention of such a file should be %%.Table% or %%.tsv%."
47 <normal> "A SpeakGoodChinese wordlist table is a tab-separated-values table that starts with a header line which contains the column headers %%Pinyin, Character, Sound, Translation%. Then the column values are written on a line with tabs separating them."
49 <normal> "##Example: %%SGC2example3.tsv%#"
50 <code> "Pinyin          Character       Sound   Translation"
51 <code> "chi1            吃       -       to eat"
52 <code> "ta1             他       -       he, she, it"
53 <code> "jin1tian1               今天      -       today"
54 <code> "can1ting1               餐厅      -       restaurant"
55 <code> "huan1ying2              欢迎      -       to welcome"
56 <code> "zhong1guo2              中国      -       China"
57 <code> "duo1shao3               多少      -       how many"
58 <code> "zhi3you3                只有      -       only"
60 <entry> "Word lists with associated audio files"
62 <normal> "These word list distributions are simple ZIP files with the name <list name>.sgc. They contain a list of all the words in pinyin with the name %%wordlist.txt% or %%wordlist.Table%, as discussed above. Except that the name of the word list file itself should be either %%wordlist.txt% or %%wordlist.Table%. Other names are not allowed. The sound files should be named <pinyin word>.ext, where <pinyin word> is the pinyin transcription, eg, %%sheng1zi4%, and %%.ext% the sound extension type (eg, %%.wav%). Note that SpeakGoodChinese uses Praat to process the sound files. So only those sound files recognized by Praat can be used (see Praat: ##[Read from file...]#). SpeakGoodChinese will use WAV (%%.wav%), Flac (%%.flac%), MP3 (%%.mp3%), and Speex (%%.spx%) files as examples if they are present. "
64 <normal> "Don't forget to include a %%LICENSE.txt% file with the copyright and licensing information. If you use one of the Creative Commons licenses or the GNU GPL, we might be willing to put your list on our web-site."
66 <normal> "It is possible to use %%SpeakGoodChinese% to record example audio files for wordlists and student evaluation. On the %%Settings page%, press the %%Save Audio% button and select a folder to store the recordings. A blue dot will be displayed in the lower right corner of the %%Main page% as long as recordings are stored. The recorded files have file-names constructed of the pinyin spelling of the word and the extention %%.wav%. Every recording will overwrite existing recordings of the same pinyin word. The storage of recordings can be terminated by pressing the %%Save Audio% button again. Select those recordings you consider good enough as examples and copy them to the target wordlist directory for inclusion in the distribution. When available, %%SpeakGoodChinese% will display the stored recordings for evaluation until a new one is recorded. "
68 <entry> "Word lists with ""real"" Pinyin"
70 <normal> "It is often inconvennient to compile lists using a number scheme for pinyin. SGC2 will recognize standard UTF8 pinyin."
71 <normal> "##Example:#"
72 <code> "Pinyin          Character       Sound   Translation"
73 <code> "chī             吃       -       to eat"
74 <code> "zhǐ​yǒu         只有      -       only"
76 <normal> "However, in this type of pinyin, the syllable boundaries can be ambiguous, as in the 
77 combination ""nán​gōng"" or ""xīngān"". To prevent errors in SGC2, place a '-quote at the 
78 boundary, e.g., ""Xīng'ān""."
81 <entry> "Word selection and Lessons"
83 <normal> "Students can select the words to practise on the %%Main% page. 
84 When they click the %%Words% button on the right between the buttons to navigate 
85 the word lists, a form with a list of all the words currently available will be 
86 displayed. Students can add words from other word lists or by hand. They can select 
87 words based on tones and the lesson %%Part%. The wordlist table can contain a collumn 
88 with the label Lesson and a lesson number for each line. The words are sorted and 
89 displayed with lesson numbers in the word selection window. The student can select 
90 the lessons to study when starting."
92 <normal> "Example: SGC2example4.tsv"
93 <code> "Pinyin  Character       Sound   Translation     Lesson"
94 <code> "chi1            吃       -       to eat  1"
95 <code> "ta1             他       -       he, she, it     1"
96 <code> "jin1tian1               今天      -       today   1"
97 <code> "can1ting1               餐厅      -       restaurant      1"
98 <code> "huan1ying2              欢迎      -       to welcome      1"
99 <code> "zhong1guo2              中国      -       China   2"
100 <code> "duo1shao3               多少      -       how many        2"
101 <code> "zhi3you3                只有      -       only    2"
103 <normal> "The entries in the Lesson column do not have to be numbers. Any string is allowed, %%Lesson 2%, %%पाठ 2%, %%レッスン2% and %%第二课% are all valid lesson labels."
105 <entry> "Global installation of word lists"
107 <normal> "The wordlists a user installs are placed in her local settings directory:"
108 <list_item> "\bu MS Windows: %%C:\bsDocuments and Settings\bs<User name>\bsSpeakGoodChinese2\bswordlists%"
109 <list_item> "\bu Mac OSX: %%/Users/<User name>/Library/Preferences/SpeakGoodChinese2/wordlists%"
110 <list_item> "\bu Linux: %%/home/<User name>/.SpeakGoodChinese2/wordlists%"
112 <normal> "To install wordlists for all users, place them in:"
113 <list_item> "\bu MS Windows: %%C:\bsDocuments and Settings\bsAll Users\bsApplication Data\bsSpeakGoodChinese2\bswordlists%"
114 <list_item> "\bu Mac OSX: %%/Library/Preferences/SpeakGoodChinese2/wordlists%"
115 <list_item> "\bu Linux: %%/etc/SpeakGoodChinese2/wordlists%"
118 <entry> "Contents:"
119 <list_item> "\bu @@Reading an existing word list@"