On Aug 19 11:22, Emre Sevinc wrote:
> >>>>> "VY" == Volkan YAZICI <[EMAIL PROTECTED]> writes:
> 
>     VY> On Aug 19 10:13, Emre Sevinc wrote:
>     >> Merak ettim acaba Common Lisp ya da Scheme icin SimMetrics
>     >> tarzi bir islev kitapligi var midir?
> 
>     VY> Levenshtein (yada Soundex) algoritmalarının herhangi bir
>     VY> programlama dilinde kütüphanesinin olmadığına şimdiye kadar
>     VY> şahit olmadım.
> 
> Dogrudur. Benim kast ettigim o degildi lakin. En bilinen bir iki
> algoritma disinda söz konusu Java kitapliginin icinde 30 kadar
> metrik uygulamasi görünüyor. Bunlarin tek bir kitapliktan erisilebilir
> olmasi güzel olabilir diye düsündüm.

Demek istediğinizi şimdi anladım. Hrmm... Bu konu hakkında o derece bir
bilgim yok. Benim bildiğim zaten 1-2 tane Levenshtein metriği var. 30
tane mi varmış? :D

> Bir de "kök" meselesi var (stemming) [1, 2], benim merak ettiğim acaba 
> Zemberek'i (yani Zemberek'in kök bulma islevselliginden faydalanip) bunu 
> Türkce tam metin arama islevini zenginlestirmek amaci ile kullanmis bir 
> proje var midir? (Konu disina ciktim, cagrisim yaptigi icin not düsmek 
> istedim).
>
> Yeri gelmisken sorayim, PostgreSQL tam metin arama ve indeksleme icin
> Ingilizce haricinde diller icin kök bulmadan faydalaniyor mu? Yukaridaki
> gibi bir seyi entegre etmek ne kadar kolay/zor olurdu (Java ile kodlandigi
> düsünüldügünde)?

PostgreSQL için TSearch2 adlı bir proje var. Burada, kendi sağladığınız
hazır lexeme kütüphanelerini kullanabileceğiniz gibi stemming'i
on-the-fly gerçekleştirebilecek bir yazılım kullanabilirsiniz. Çok
kabaca ifade edecek olursam, Zemberek'in stemming() çağrısını
PostgreSQL prosedürüne port etmemiz yeterli olacaktır. Açıkcası böyle
bir projenin altına ben elimi seve seve koyabilirim.

> Common Lisp ile epey optimize kod üretilebiliyor diye biliyorum,
> en basiti tür tanimlamalari, optimizasyon ayarlamalari, vs. SBCL
> ve Franz Inc.'in Allegro Common Lisp'i ürüne özgü parametreler
> de dahil edildiginde epey iyi is cikarabilmeli [3, 4, 5].
> 
> Diger yandan yani illa Lisp ile yazilmis olmasi sart degil,
> bir "foreing function interface" (FFI) seklinde de olabilir.

Haklısınız Lisp kodlamaktan, Lisp kodlamaya fark var. Hadi dilden
kaynaklı bazı hız sınırları oluştu diyelim, o zaman da FFI devreye
sokulabilir.


İyi çalışmalar.

_______________________________________________
cs-lisp mailing list
[email protected]
http://church.cs.bilgi.edu.tr/lcg
http://cs.bilgi.edu.tr/mailman/listinfo/cs-lisp

Cevap