>>>>> "VY" == Volkan YAZICI <[EMAIL PROTECTED]> writes:
VY> On Aug 19 10:13, Emre Sevinc wrote:
>> Merak ettim acaba Common Lisp ya da Scheme icin SimMetrics
>> tarzi bir islev kitapligi var midir?
VY> Levenshtein (yada Soundex) algoritmalarının herhangi bir
VY> programlama dilinde kütüphanesinin olmadığına şimdiye kadar
VY> şahit olmadım.
Dogrudur. Benim kast ettigim o degildi lakin. En bilinen bir iki
algoritma disinda söz konusu Java kitapliginin icinde 30 kadar
metrik uygulamasi görünüyor. Bunlarin tek bir kitapliktan erisilebilir
olmasi güzel olabilir diye düsündüm.
VY> Kısa bir Google araması sonucu şöyle bir şey buldum:
VY> [http://www.neilvandyke.org/levenshtein-scm/] This is a Scheme
VY> implementation of the Levenshtein Distance algorithm, which is
VY> an edit distance metric of string similarity. The Levenshtein
VY> Distance is a function of two strings that represents a count
VY> of single-character insertions, deletions, and substitions
VY> that will change the first string to the second.
VY> Özellikle veritabanındaki FTS (Full Text Search) zamazingoları
VY> için "lokum" diye tabir edebileceğimiz bir özellik. Ama şahsi
Bir de "kök" meselesi var (stemming) [1, 2], benim merak ettiğim acaba
Zemberek'i (yani Zemberek'in kök bulma islevselliginden faydalanip) bunu
Türkce tam metin arama islevini zenginlestirmek amaci ile kullanmis bir
proje var midir? (Konu disina ciktim, cagrisim yaptigi icin not düsmek
istedim).
Yeri gelmisken sorayim, PostgreSQL tam metin arama ve indeksleme icin
Ingilizce haricinde diller icin kök bulmadan faydalaniyor mu? Yukaridaki
gibi bir seyi entegre etmek ne kadar kolay/zor olurdu (Java ile kodlandigi
düsünüldügünde)?
VY> fikrim, bu tür fonksiyonların çok büyük veri kümeleri üzerine
VY> uygulanmalarından dolayı, makine diline yakın programlama
VY> dilleri ile geliştirilmelerinin daha doğru olduğu
VY> yönünde. Tabii şöyle bir gerçek de var ki, benim C ile
VY> geliştirdiğim Levenshtein algoritmasını herhangi bir Lisp
VY> dialektiği ile daha hızlı çalışacak şekilde geliştiribilecek
VY> bir programcı her daim mevcut olacaktır.
Common Lisp ile epey optimize kod üretilebiliyor diye biliyorum,
en basiti tür tanimlamalari, optimizasyon ayarlamalari, vs. SBCL
ve Franz Inc.'in Allegro Common Lisp'i ürüne özgü parametreler
de dahil edildiginde epey iyi is cikarabilmeli [3, 4, 5].
Diger yandan yani illa Lisp ile yazilmis olmasi sart degil,
bir "foreing function interface" (FFI) seklinde de olabilir.
1- http://en.wikipedia.org/wiki/Stemmer
2- http://en.wikipedia.org/wiki/Stemming_algorithm
3- http://www.gigamonkeys.com/book/conclusion-whats-next.html
4- http://www.cliki.net/Performance%20Benchmarks2
5- http://www.lispworks.com/products/myths_and_legends.html
--
Emre Sevinc
eMBA Software Developer Actively engaged in:
http://emba.bilgi.edu.tr http://ileriseviye.org
http://www.bilgi.edu.tr http://fazlamesai.net
Cognitive Science Student http://cazci.com
http://www.cogsci.boun.edu.tr
_______________________________________________
cs-lisp mailing list
[email protected]
http://church.cs.bilgi.edu.tr/lcg
http://cs.bilgi.edu.tr/mailman/listinfo/cs-lisp