Aramak istediğiniz kalıbın maximum büyüklüğünü (max. kaç alt satır aranacak) bilmeniz gerekir. Aksi halde işleminiz verinize bağlı olarak uzun sürecektir. For i:=1 den i=(satırsayisi/2)-1 e kadar tüm olasıkları tek tek test etmeniz gerekecektir. i=2, 2 li satır grubu, i=3 3 lü satır gurubu .... Tüm satiri tek tek test etmek yerine satırları birer veritabani üzerine yerleştirirseniz ve bunların MD5 i gibi standart bir özet değerini alırsanız işleminiz daha hızlı olacaktır.
Örnek Veri Tablosu Yapısı : MD5_ID : (oluşturulan her MD5 e bir ID verebilirsiniz. Aynı MD5 olunca ID sini de aynı yaparsınız) MD5 : Satırın MD5 değeri Satır : Satırın Kendisi Örnek Test Tablosu Örnek Satır Sayısı : (i değeri max. karşılaştırılacak satır sayısı) MD5_ID : MD5_ID_TEKRAR : MD5 ID kaç defa var Bilmem bir fikir verebildim mi Kolay Gelsin; Zekeriya BOZKURT Date: Mon, 22 Aug 2011 12:24:52 +0300 From: [email protected] To: [email protected] Subject: [Linux-programlama] En çok tekrar eden satır kümelerini bulma Merhaba; Elimde şöyle bir text var, a b c a d e g h j a b c h n j r t b h n h ve n satırlar alt atla iki kere gelmiş(hn-2) a b c satırları alt alta 3 kere gelmiş(abc-3) Bu şekilde bir text içinde en çok tekrar eden satır kümelerini nasıl bulabilirim ? -- Onur AKTAŞ Kişisel, http://www.onuraktas.net Blog, http://www.alonon.net _______________________________________________ Linux-programlama mailing list [email protected] https://liste.linux.org.tr/mailman/listinfo/linux-programlama Liste kurallari: http://liste.linux.org.tr/kurallar.php
_______________________________________________ Linux-programlama mailing list [email protected] https://liste.linux.org.tr/mailman/listinfo/linux-programlama Liste kurallari: http://liste.linux.org.tr/kurallar.php
