Merhabalar, Elimde satirlardan buyuk dosyalar var. Dosyalarin toplam boyutu 17 GB kadar
Dosyalarin ve satrilarin formati: String1_1 String1_2 String1_3 String1_4 String2_1 String2_2 String2_3 String2_4 ... ... StringN_1 StringN_2 StringN_3 StringN_4 Seklinde Yani dosyanin icinde her satirda 4 stringden olusan bir yapi var. Yaklasik 1 milyar satir var elimde toplamda bu dosyalardan gelen. Bu stringlerin hepsi farkli degil, ayni olanlar da var. Hatta buyuk cogunlugu ayni olabilir. Yani bir string birden farkli satirda birden frakli sirada (yani bir satirda 1. string iken baska bir satirda 3. string olabilir) gecebilir. Sorum su sekilde; Bana oyle bir acik kaynak kodlu veritabani sistemi onerin ki, ve bana oyle bir depolama yapisi onerin ki, Ben bu satirlari veritabanina gireyim, ve mesela "aBAHSNAdjhaD" stringinin gectigi satirlari goster dedigimde hemen gostersin o satiri veya satirlari. Hatta kendisiyle join edebileyim. yani su turden bir sorgu String1i "ahsjajhah" olan satirlardan, string2si, herhangi baska bir satirdan string3e esit ise, o satirin string4u nedir? Yani eger hepsi bir tabloda ve bu formatta sutunlara girmis olsaydim suna benzer bir sogru olacakti: Select Tablo2.String4 FROM Tablo AS Tablo1, Tablo AS Tablo2 WHERE Tablo1.String1='ahsjajhah' AND Tablo1.String2=Tablo2.String3 Bu sekilde join sayisi da artabilir. Yani 7-8 defa bu sekilde kendisiyle join ettirme durumum olabilir. Cok zor mu boyle birseyi yapmak? Simdiden tesekkurler Not: Tablo simdilik, veriler bir defa girildikten sonra sadece read islemi yapilacakmis gibi dusunulebilir. Ama ilerde hem select hem insert islemleri olacak.
_______________________________________________ Linux-programlama mailing list [email protected] http://liste.linux.org.tr/mailman/listinfo/linux-programlama
