Re: [HACKERS] Updated Turkish stopwords list for Tsearch2

2010-03-22 Thread Devrim GÜNDÜZ
On Mon, 2010-03-22 at 08:55 -0400, Tom Lane wrote:
> It would be a good idea to submit this upstream at the snowball
> project, else it might get lost in future updates. 

Ok, will do.
-- 
Devrim GÜNDÜZ
PostgreSQL Danışmanı/Consultant, Red Hat Certified Engineer
PostgreSQL RPM Repository: http://yum.pgrpms.org
Community: devrim~PostgreSQL.org, devrim.gunduz~linux.org.tr
http://www.gunduz.org  Twitter: http://twitter.com/devrimgunduz


signature.asc
Description: This is a digitally signed message part


Re: [HACKERS] Updated Turkish stopwords list for Tsearch2

2010-03-22 Thread Tom Lane
Devrim =?ISO-8859-1?Q?G=DCND=DCZ?=  writes:
> Attached is updated Turkish stopword list for Tsearch2, against 8.4 and
> HEAD. 

It would be a good idea to submit this upstream at the snowball project,
else it might get lost in future updates.

regards, tom lane

-- 
Sent via pgsql-hackers mailing list (pgsql-hackers@postgresql.org)
To make changes to your subscription:
http://www.postgresql.org/mailpref/pgsql-hackers


[HACKERS] Updated Turkish stopwords list for Tsearch2

2010-03-22 Thread Devrim GÜNDÜZ
Hi,

Attached is updated Turkish stopword list for Tsearch2, against 8.4 and
HEAD. 

Please apply.

Regards,
-- 
Devrim GÜNDÜZ
PostgreSQL Danışmanı/Consultant, Red Hat Certified Engineer
PostgreSQL RPM Repository: http://yum.pgrpms.org
Community: devrim~PostgreSQL.org, devrim.gunduz~linux.org.tr
http://www.gunduz.org  Twitter: http://twitter.com/devrimgunduz
Index: src/backend/snowball/stopwords/turkish.stop
===
RCS file: /projects/cvsroot/pgsql/src/backend/snowball/stopwords/turkish.stop,v
retrieving revision 1.1
diff -u -r1.1 turkish.stop
--- src/backend/snowball/stopwords/turkish.stop	7 Sep 2007 14:46:43 -	1.1
+++ src/backend/snowball/stopwords/turkish.stop	22 Mar 2010 12:20:33 -
@@ -1,53 +1,224 @@
+a
 acaba
+altı
 ama
+ancak
+artık
+asla
 aslında
 az
+b
+bana
+bazen
 bazı
+bazıları
+bazısı
 belki
+ben
+beni
+benim
+beş
+bile
+bir
+birçoğu
+birçok
+birçokları
 biri
+birisi
 birkaç
+birkaçı
 birşey
+birşeyi
 biz
+bize
+bizi
+bizim
+böyle
+böylece
 bu
+buna
+bunda
+bundan
+bunu
+bunun
+burada
+bütün
+c
+ç
+çoğu
+çoğuna
+çoğunu
 çok
 çünkü
+d
 da
 daha
 de
-defa
+değil
+demek
+diğer
+diğeri
+diğerleri
 diye
-eğer
+dokuz
+dolayı
+dört
+e
+elbette
 en
+f
+fakat
+falan
+felan
+filan
+g
+gene
 gibi
+ğ
+h
+hâlâ
+hangi
+hangisi
+hani
+hatta
 hem
+henüz
 hep
 hepsi
+hepsine
+hepsini
 her
+her biri
+herkes
+herkese
+herkesi
 hiç
+hiç kimse
+hiçbiri
+hiçbirine
+hiçbirini
+ı
+i
 için
+içinde
+iki
 ile
 ise
-kez
+işte
+j
+k
+kaç
+kadar
+kendi
+kendine
+kendini
 ki
 kim
+kime
+kimi
+kimin
+kimisi
+l
+m
+madem
 mı
+mı
+mi
+mu
 mu
 mü
+mü
+n
 nasıl
 ne
+ne kadar
+ne zaman
 neden
+nedir
 nerde
 nerede
+nereden
 nereye
+nesi
+neyse
 niçin
 niye
 o
-sanki
-şey
+on
+ona
+ondan
+onlar
+onlara
+onlardan
+onların
+onların
+onu
+onun
+orada
+oysa
+oysaki
+ö
+öbürü
+ön
+önce
+ötürü
+öyle
+p
+r
+rağmen
+s
+sana
+sekiz
+sen
+senden
+seni
+senin
 siz
+sizden
+size
+sizi
+sizin
+son
+sonra
+ş
+şayet
+şey
+şeyden
+şeye
+şeyi
+şeyler
+şimdi
+şöyle
 şu
+şuna
+şunda
+şundan
+şunlar
+şunu
+şunun
+t
+tabi
+tamam
 tüm
+tümü
+u
+ü
+üç
+üzere
+v
+var
 ve
 veya
+veyahut
+y
 ya
+ya da
 yani
+yedi
+yerine
+yine
+yoksa
+z
+zaten
+zira



signature.asc
Description: This is a digitally signed message part