Improving the arabic stopwords list
commitef8eecee8612be76c6eeb176c9599c9c4c265e5f
authorAssem Chelli <assem.ch@gmail.com>
Wed, 13 Jan 2016 18:41:45 +0000 (13 19:41 +0100)
committerAssem Chelli <assem.ch@gmail.com>
Wed, 13 Jan 2016 19:23:23 +0000 (13 20:23 +0100)
tree22793dd7a9df21dcc1380d8b56e5af046d9aae4d
parent7bc4510baffe5d7a2bcf5eaf0b66bbde4808f50a
Improving the arabic stopwords list
- sorting the list to make it easier for checking
- eliminate duplicates after normalizing shedda symbol
- eliminate some words that are rare and can come not as stop word having a full meaning.
- romove the todos list from the header comment
- add new stop words
xapian-core/languages/stopwords/arabic.txt