Zdravim konferenciu,
potreboval by som poradit s analyzou textu. Texty su v slovencine a
potreboval by som v nich vyhladat klucove slova, ktore mam dopredu
definovane. Napriklad:
Definovana mnozina klucovych slov:
{Bratislava, Zvolen, Košice, Poprad}
text na analyzu:
Vitajte na oficiálnej
Zdravím,
to, co hledáte, je buď lemmatizace vstupního textu (převedení na základní
tvary), nebo naopak stemming klíčových slov (odvození dalších tvarů ze
základního tvaru). Nějaké knihovny určitě existují pro Lucene.
Filip Jirsák
2014-06-11 16:48 GMT+02:00 Ivan Polak ivan.po...@f4s.sk:
Prisaham, ze to neni pokus o Czech/Slovak flame :-),
ale kdyz existuje [1], urcite by to slo implementovat i slovensky...
[1]
http://www.elasticsearch.org/guide/en/elasticsearch/reference/current/analysis-lang-analyzer.html#czech-analyzer
On 06/11/2014 04:48 PM, Ivan Polak wrote:
Zdravim
dakujem za reakcie :-) doteraz som pouzival SOLR pre Lucene, skusim
pozriet ElasticSearch a pripadne ako pisete spravit pre Slovencinu.
zacal som tu, je to stemmer pre slovensky jazyk:
http://vi.ikt.ui.sav.sk/Projekty/Projekty_2008%2F%2F2009/Hana_Pifkov%C3%A1_-_Stemer
je to celkom dobre
Někde jsem to řešili, že jako klíčová slova jsme dávali slovní základ a
ten pak hledali. Celkem to fungovalo.
Takže
{Bratislav, Zvolen, Košic, Poprad}
Michal
Dne 11.6.2014 16:48, Ivan Polak napsal(a):
Zdravim konferenciu,
potreboval by som poradit s analyzou textu. Texty su v slovencine a
Pozdravujem,
skuste pozriet niektory z projektov v [1]. Prakticke skusenosti sice
nemam, ale viackrat sa spominalo pouzitie hunspellu, napr. v [2].
[1] http://www.sk-spell.sk.cx/
[2]
http://www.zdrojak.cz/clanky/elasticsearch-vyhledavame-hezky-cesky-ii-a-taky-slovensky/
On 11.6.2014 16:48,