dakujem za reakcie :-) doteraz som pouzival SOLR pre Lucene, skusim
pozriet ElasticSearch a pripadne ako pisete spravit pre Slovencinu.

zacal som tu, je to stemmer pre slovensky jazyk:

http://vi.ikt.ui.sav.sk/Projekty/Projekty_2008%2F%2F2009/Hana_Pifkov%C3%A1_-_Stemer

je to celkom dobre napisane, su tam aj 2 demo aplikacie, len stemmer a
potom spojenie s lucene.

Ivan

2014-06-11 16:59 GMT+02:00 Michal Babacek <michal.baba...@gmail.com>:
> Prisaham, ze to neni pokus o Czech/Slovak flame :-),
> ale kdyz existuje [1], urcite by to slo implementovat i slovensky...
>
>
> [1]
> http://www.elasticsearch.org/guide/en/elasticsearch/reference/current/analysis-lang-analyzer.html#czech-analyzer
>
>
> On 06/11/2014 04:48 PM, Ivan Polak wrote:
>>
>> Zdravim konferenciu,
>>
>> potreboval by som poradit s analyzou textu. Texty su v slovencine a
>> potreboval by som v nich vyhladat klucove slova, ktore mam dopredu
>> definovane. Napriklad:
>>
>> Definovana mnozina klucovych slov:
>>
>> {"Bratislava", "Zvolen", "Košice", "Poprad"}
>>
>> text na analyzu:
>>
>> "Vitajte na oficiálnej stránke Letiska Bratislava! Ako významný
>> dopravný uzol v stredoeurópskom regióne Vám ponúkame množstvo
>> atraktívnych destinácií."
>>
>> v tomto texte nie je problem, aj ked by som pouzil primitivne riesenie
>> splitnut to podla medzier a potom jednotlive slova z textu vyhladavat
>> v definovanej mnozine.
>>
>> ale:
>>
>> "Po Bratislave by sa tak mohli dočkať nových nemocníc aj ďalšie
>> regióny. „Investície do rekonštrukcie existujúcich budov a následné
>> zvyšovanie ..."
>>
>> a tu uz je problem z predchadzajucim pristupom, pretoze v slovencine
>> je sklonovanie.
>>
>> aj ked velmi nepredpokladam, neviete niekto o nejakej kniznici, ktora
>> by dokazala hore popisane v slovencine, teda vyhladavat definovane
>> slova a aj ich vysklonovane tvary.
>>
>> dakujem
>>
>> Ivan
>>
>

Odpovedet emailem