Revision: 10050
http://sourceforge.net/p/languagetool/code/10050
Author: arysin
Date: 2013-05-07 02:49:56 +0000 (Tue, 07 May 2013)
Log Message:
-----------
Updated Ukrainian dictionary and rules
Modified Paths:
--------------
trunk/languagetool/languagetool-language-modules/uk/src/main/java/org/languagetool/rules/uk/SimpleReplaceRule.java
trunk/languagetool/languagetool-language-modules/uk/src/main/resources/org/languagetool/resource/uk/ukrainian.dict
trunk/languagetool/languagetool-language-modules/uk/src/main/resources/org/languagetool/resource/uk/ukrainian_synth.dict
trunk/languagetool/languagetool-language-modules/uk/src/main/resources/org/languagetool/resource/uk/ukrainian_tags.txt
trunk/languagetool/languagetool-language-modules/uk/src/main/resources/org/languagetool/rules/uk/grammar.xml
trunk/languagetool/languagetool-language-modules/uk/src/main/resources/org/languagetool/rules/uk/replace.txt
trunk/languagetool/languagetool-language-modules/uk/src/test/java/org/languagetool/tagging/disambiguation/rules/uk/UkrainianRuleDisambiguatorTest.java
Modified:
trunk/languagetool/languagetool-language-modules/uk/src/main/java/org/languagetool/rules/uk/SimpleReplaceRule.java
===================================================================
---
trunk/languagetool/languagetool-language-modules/uk/src/main/java/org/languagetool/rules/uk/SimpleReplaceRule.java
2013-05-06 16:31:36 UTC (rev 10049)
+++
trunk/languagetool/languagetool-language-modules/uk/src/main/java/org/languagetool/rules/uk/SimpleReplaceRule.java
2013-05-07 02:49:56 UTC (rev 10050)
@@ -110,7 +110,11 @@
for (AnalyzedTokenReadings tokenReadings: tokens) {
String tokenString = tokenReadings.getToken();
- List<String> replacements = isCaseSensitive() ?
wrongWords.get(tokenString) :
wrongWords.get(tokenString.toLowerCase(getLocale()));
+ if( ! isCaseSensitive() ) {
+ tokenString = tokenString.toLowerCase(getLocale());
+ }
+
+ List<String> replacements = wrongWords.get(tokenString);
if (replacements != null && replacements.size() > 0 ) {
RuleMatch potentialRuleMatch =
createRuleMatch(tokenReadings, replacements);
@@ -150,6 +154,10 @@
continue;
}
+ if( ! isCaseSensitive() ) {
+ line = line.toLowerCase(getLocale());
+ }
+
String[] parts = line.split("=");
if (parts.length != 2) {
throw new IOException("Format error in file "
Modified:
trunk/languagetool/languagetool-language-modules/uk/src/main/resources/org/languagetool/resource/uk/ukrainian.dict
===================================================================
(Binary files differ)
Modified:
trunk/languagetool/languagetool-language-modules/uk/src/main/resources/org/languagetool/resource/uk/ukrainian_synth.dict
===================================================================
(Binary files differ)
Modified:
trunk/languagetool/languagetool-language-modules/uk/src/main/resources/org/languagetool/resource/uk/ukrainian_tags.txt
===================================================================
---
trunk/languagetool/languagetool-language-modules/uk/src/main/resources/org/languagetool/resource/uk/ukrainian_tags.txt
2013-05-06 16:31:36 UTC (rev 10049)
+++
trunk/languagetool/languagetool-language-modules/uk/src/main/resources/org/languagetool/resource/uk/ukrainian_tags.txt
2013-05-07 02:49:56 UTC (rev 10050)
@@ -1,157 +1,94 @@
-:bad
adj
+adj:comp:f:v_dav
+adj:comp:f:v_dav:bad
+adj:comp:f:v_naz
+adj:comp:f:v_naz:bad
+adj:comp:f:v_oru
+adj:comp:f:v_oru:bad
+adj:comp:f:v_rod
+adj:comp:f:v_rod:bad
+adj:comp:f:v_zna
+adj:comp:f:v_zna:bad
+adj:comp:m:v_dav
+adj:comp:m:v_dav:bad
+adj:comp:m:v_mis
+adj:comp:m:v_mis:bad
+adj:comp:m:v_naz
+adj:comp:m:v_oru
+adj:comp:m:v_oru:bad
+adj:comp:m:v_rod
+adj:comp:m:v_rod:bad
+adj:comp:m:v_zna
+adj:comp:m:v_zna:bad
+adj:comp:n:v_dav
+adj:comp:n:v_dav:bad
+adj:comp:n:v_mis
+adj:comp:n:v_mis:bad
+adj:comp:n:v_naz
+adj:comp:n:v_naz:bad
+adj:comp:n:v_oru
+adj:comp:n:v_oru:bad
+adj:comp:n:v_rod
+adj:comp:n:v_rod:bad
+adj:comp:p:v_dav
+adj:comp:p:v_dav:bad
+adj:comp:p:v_mis
+adj:comp:p:v_mis:bad
+adj:comp:p:v_naz
+adj:comp:p:v_naz:bad
+adj:comp:p:v_oru
+adj:comp:p:v_oru:bad
+adj:comp:p:v_rod
+adj:comp:p:v_rod:bad
+adj:comp:p:v_zna
+adj:comp:p:v_zna:bad
adj:f:v_dav
adj:f:v_dav:bad
-adj:f:v_davбагаторазовий
-adj:f:v_davвладущий
-adj:f:v_davнавколишній
-adj:f:v_davнавчальний
-adj:f:v_davнападний
adj:f:v_mis
adj:f:v_naz
adj:f:v_naz:bad
-adj:f:v_nazбагаторазовий
-adj:f:v_nazвладущий
-adj:f:v_nazнавколишній
-adj:f:v_nazнавчальний
-adj:f:v_nazнападний
adj:f:v_oru
adj:f:v_oru:bad
-adj:f:v_oruбагаторазовий
-adj:f:v_oruвладущий
-adj:f:v_oruнавколишній
-adj:f:v_oruнавчальний
-adj:f:v_oruнападний
adj:f:v_rod
adj:f:v_rod:bad
-adj:f:v_rodбагаторазовий
-adj:f:v_rodвладущий
-adj:f:v_rodнавколишній
-adj:f:v_rodнавчальний
-adj:f:v_rodнападний
adj:f:v_zna
adj:f:v_zna:bad
-adj:f:v_znaбагаторазовий
-adj:f:v_znaвладущий
-adj:f:v_znaнавколишній
-adj:f:v_znaнавчальний
-adj:f:v_znaнападний
adj:m:v_dav
adj:m:v_dav:bad
-adj:m:v_davбагаторазовий
-adj:m:v_davвладущий
-adj:m:v_davнавколишній
-adj:m:v_davнавчальний
-adj:m:v_davнападний
adj:m:v_mis
adj:m:v_mis:bad
-adj:m:v_misбагаторазовий
-adj:m:v_misвладущий
-adj:m:v_misнавколишній
-adj:m:v_misнавчальний
-adj:m:v_misнападний
adj:m:v_naz
adj:m:v_oru
adj:m:v_oru:bad
-adj:m:v_oruбагаторазовий
-adj:m:v_oruвладущий
-adj:m:v_oruнавколишній
-adj:m:v_oruнавчальний
-adj:m:v_oruнападний
adj:m:v_rod
adj:m:v_rod:bad
-adj:m:v_rodбагаторазовий
-adj:m:v_rodвладущий
-adj:m:v_rodнавколишній
-adj:m:v_rodнавчальний
-adj:m:v_rodнападний
adj:m:v_zna
adj:m:v_zna:bad
-adj:m:v_znaбагаторазовий
-adj:m:v_znaвладущий
-adj:m:v_znaнавколишній
-adj:m:v_znaнавчальний
-adj:m:v_znaнападний
adj:n:v_dav
adj:n:v_dav:bad
-adj:n:v_davбагаторазовий
-adj:n:v_davвладущий
-adj:n:v_davнавколишній
-adj:n:v_davнавчальний
-adj:n:v_davнападний
adj:n:v_mis
adj:n:v_mis:bad
-adj:n:v_misбагаторазовий
-adj:n:v_misвладущий
-adj:n:v_misнавколишній
-adj:n:v_misнавчальний
-adj:n:v_misнападний
adj:n:v_naz
adj:n:v_naz:bad
-adj:n:v_nazбагаторазовий
-adj:n:v_nazвладущий
-adj:n:v_nazнавколишній
-adj:n:v_nazнавчальний
-adj:n:v_nazнападний
adj:n:v_oru
adj:n:v_oru:bad
-adj:n:v_oruбагаторазовий
-adj:n:v_oruвладущий
-adj:n:v_oruнавколишній
-adj:n:v_oruнавчальний
-adj:n:v_oruнападний
adj:n:v_rod
adj:n:v_rod:bad
-adj:n:v_rodбагаторазовий
-adj:n:v_rodвладущий
-adj:n:v_rodнавколишній
-adj:n:v_rodнавчальний
-adj:n:v_rodнападний
adj:n:v_zna
adj:n:v_zna:bad
adj:nv
adj:p:v_dav
adj:p:v_dav:bad
-adj:p:v_davбагаторазовий
-adj:p:v_davвладущий
-adj:p:v_davнавколишній
-adj:p:v_davнавчальний
-adj:p:v_davнападний
adj:p:v_mis
adj:p:v_mis:bad
-adj:p:v_misбагаторазовий
-adj:p:v_misвладущий
-adj:p:v_misнавколишній
-adj:p:v_misнавчальний
-adj:p:v_misнападний
adj:p:v_naz
adj:p:v_naz:bad
-adj:p:v_nazбагаторазовий
-adj:p:v_nazвладущий
-adj:p:v_nazнавколишній
-adj:p:v_nazнавчальний
-adj:p:v_nazнападний
adj:p:v_oru
adj:p:v_oru:bad
-adj:p:v_oruбагаторазовий
-adj:p:v_oruвладущий
-adj:p:v_oruнавколишній
-adj:p:v_oruнавчальний
-adj:p:v_oruнападний
adj:p:v_rod
adj:p:v_rod:bad
-adj:p:v_rodбагаторазовий
-adj:p:v_rodвладущий
-adj:p:v_rodнавколишній
-adj:p:v_rodнавчальний
-adj:p:v_rodнападний
adj:p:v_zna
adj:p:v_zna:bad
-adj:p:v_znaбагаторазовий
-adj:p:v_znaвладущий
-adj:p:v_znaнавколишній
-adj:p:v_znaнавчальний
-adj:p:v_znaнападний
adj:supr:f:v_dav
adj:supr:f:v_dav:bad
adj:supr:f:v_naz
@@ -197,102 +134,80 @@
adj:supr:p:v_zna:bad
adv
adv:bad
-cnoj
conj
dieprysl:imperf
dieprysl:imperf:bad
dieprysl:imperf:rev
-dieprysl:imperf:rev:bad
dieprysl:perf
dieprysl:perf:bad
dieprysl:perf:rev
-dieprysl:perfзбігатися
+dieprysl:rev:imperf
+dieprysl:rev:imperf:bad
dieprysl:rev:perf
dieprysl:rev:perf:bad
excl
impers
+impers:bad
insert_sl
noun:f:nv
noun:f:v_dav
noun:f:v_dav:bad
-noun:f:v_davпоперек
noun:f:v_kly
noun:f:v_mis
noun:f:v_mis:bad
-noun:f:v_misпоперек
noun:f:v_naz
noun:f:v_oru
noun:f:v_oru:bad
-noun:f:v_oruпоперек
-noun:f:v_oruрядок
noun:f:v_rod
noun:f:v_rod:bad
-noun:f:v_rodпоперек
-noun:f:v_rodрядок
noun:f:v_zna
noun:f:v_zna:bad
-noun:f:v_znaпоперек
-noun:f:v_znaрядок
noun:m:nv
noun:m:v_dav
noun:m:v_dav:bad
-noun:m:v_davнежить
noun:m:v_dv
noun:m:v_dv:bad
noun:m:v_kly
noun:m:v_kly:bad
noun:m:v_mis
noun:m:v_mis:bad
-noun:m:v_misнежить
noun:m:v_naz
noun:m:v_naz//n:v_naz
noun:m:v_oru
noun:m:v_oru:bad
-noun:m:v_oruнежить
noun:m:v_rod
noun:m:v_rod:bad
-noun:m:v_rodнежить
noun:m:v_zna
noun:m:v_zna:bad
noun:n:nv
noun:n:v_dav
noun:n:v_dav:bad
-noun:n:v_davзахід
noun:n:v_mis
noun:n:v_mis:bad
-noun:n:v_misзахід
noun:n:v_naz
noun:n:v_oru
noun:n:v_oru:bad
-noun:n:v_oruзахід
noun:n:v_rod
noun:n:v_rod:bad
-noun:n:v_rodзахід
noun:n:v_zna
noun:n:v_zna:bad
noun:p:nv
noun:p:v_dav
noun:p:v_dav:bad
-noun:p:v_davрядок
noun:p:v_mis
noun:p:v_mis:bad
-noun:p:v_misрядок
noun:p:v_naz
noun:p:v_naz/v_zna
noun:p:v_naz:bad
-noun:p:v_nazрядок
noun:p:v_oru
noun:p:v_oru:bad
-noun:p:v_oruрядок
noun:p:v_rid
noun:p:v_rod
noun:p:v_rod:bad
-noun:p:v_rodрядок
noun:p:v_rov
noun:p:v_rov:bad
noun:p:v_zna
noun:p:v_zna:bad
-noun:p:v_znaрядок
noun:pl:nv
noun:todo
noun:v_dav
@@ -361,46 +276,34 @@
todo
verb:futr:p:1
verb:futr:p:1:bad
-verb:futr:p:1збігатися
verb:futr:p:2
verb:futr:p:2:bad
-verb:futr:p:2збігатися
verb:futr:p:3
verb:futr:p:3:bad
-verb:futr:p:3збігатися
verb:futr:s:1
verb:futr:s:1:bad
-verb:futr:s:1збігатися
verb:futr:s:2
verb:futr:s:2:bad
-verb:futr:s:2збігатися
verb:futr:s:3
verb:futr:s:3:bad
-verb:futr:s:3збігатися
verb:imper:p:1
verb:imper:p:2
verb:imper:s:2
verb:impr:p:1
verb:impr:p:1:bad
-verb:impr:p:1збігатися
verb:impr:p:2
verb:impr:p:2:bad
-verb:impr:p:2збігатися
verb:impr:s:2
verb:impr:s:2:bad
-verb:impr:s:2збігатися
verb:inf
verb:inf:rev
verb:inf:rev:bad
verb:past:f
verb:past:f:bad
-verb:past:fзбігатися
verb:past:m
verb:past:m:bad
-verb:past:mзбігатися
verb:past:n
verb:past:n:bad
-verb:past:nзбігатися
verb:past:p
verb:past:p:3
verb:past:p:bad
@@ -408,7 +311,6 @@
verb:past:p:m
verb:past:p:n
verb:past:p:p
-verb:past:pзбігатися
verb:past:s:f
verb:past:s:m
verb:past:s:n
@@ -416,22 +318,16 @@
verb:pres:p/1/2/3
verb:pres:p:1
verb:pres:p:1:bad
-verb:pres:p:1збігатися
verb:pres:p:2
verb:pres:p:2:bad
-verb:pres:p:2збігатися
verb:pres:p:3
verb:pres:p:3:bad
-verb:pres:p:3збігатися
verb:pres:s:1
verb:pres:s:1:bad
-verb:pres:s:1збігатися
verb:pres:s:2
verb:pres:s:2:bad
-verb:pres:s:2збігатися
verb:pres:s:3
verb:pres:s:3:bad
-verb:pres:s:3збігатися
verb:rev:futr:p:1
verb:rev:futr:p:1:bad
verb:rev:futr:p:2
Modified:
trunk/languagetool/languagetool-language-modules/uk/src/main/resources/org/languagetool/rules/uk/grammar.xml
===================================================================
---
trunk/languagetool/languagetool-language-modules/uk/src/main/resources/org/languagetool/rules/uk/grammar.xml
2013-05-06 16:31:36 UTC (rev 10049)
+++
trunk/languagetool/languagetool-language-modules/uk/src/main/resources/org/languagetool/rules/uk/grammar.xml
2013-05-07 02:49:56 UTC (rev 10050)
@@ -306,16 +306,17 @@
</category>
<category name="Стиль">
-<!--
- TODO: треба виключити випадки де самий не є частиною творення найвищого
ступеня
+
<rulegroup name="Самий з прикметниками" id="SAMYI">
<rule>
<pattern>
<token inflected="yes">самий
<exception scope="previous" regexp="yes"
inflected="yes">(такий|той)</exception>
</token>
- <token postag_regexp="yes" postag="adj:.*">
+ <token postag_regexp="yes" postag="adj:(comp|supr).*">
+ <!--
<exception regexp="yes"
inflected="yes">такий</exception>
+ -->
<exception postag_regexp="yes"
postag="noun.*"></exception>
</token>
</pattern>
@@ -324,11 +325,14 @@
<example type="correct">Сама прийшла</example>
<example type="correct">Саме такий</example>
<example type="correct">Ті ж самі пісні</example>
+ <example type="incorrect"><marker>Самий
кращий</marker>.</example>
+ <example type="incorrect"><marker>Сама
гірша</marker>.</example>
+<!-- TODO:
<example type="incorrect"><marker>Самий
сильний</marker>.</example>
<example type="incorrect"><marker>Сама
тривала</marker>.</example>
+-->
</rule>
</rulegroup>
--->
<!--
Уживання складеноє форми є дозволеним, хоча перевага надається простій
формі
<rulegroup name="Більш/менш з прикметниками" id="BILSH_WITH_ADJ">
@@ -650,6 +654,78 @@
<example type="correct">Прийдуть любі друзі</example>
<example type="correct">Принесла Люба метелика</example>
</rule>
+ <rule>
+ <pattern>
+ <token>ні</token>
+ <token>в</token>
+ <token>якому</token>
+ <token>разі</token>
+ </pattern>
+ <message>Правильно: <suggestion>у жодному разі</suggestion></message>
+ <example type="incorrect"><marker>Ні в якому разі</marker> не можна
панікувати.</example>
+ <example type="correct">В такому разі не можна панікувати.</example>
+ </rule>
+ <rule>
+ <pattern>
+ <token>так</token>
+ <token>як</token>
+ </pattern>
+ <message>Правильно: <suggestion>бо</suggestion>, <suggestion>через
те, що</suggestion>, <suggestion>тому, що</suggestion>,
<suggestion>оскільки</suggestion></message>
+ <example type="incorrect">Збори не відбулися, <marker>так як</marker>
прийшло мало людей.</example>
+ <example type="correct">Збори не відбулися тому, що прийшло мало
людей.</example>
+ </rule>
+ <rule>
+ <pattern>
+ <token>до</token>
+ <token>цих</token>
+ <token>пір</token>
+ </pattern>
+ <message>Правильно: <suggestion>досі</suggestion></message>
+ <example type="incorrect">Чому економіці <marker>до цих пір</marker>
не вистачає кредитів?</example>
+ <example type="correct">Чому економіці досі не вистачає
кредитів?</example>
+ </rule>
+ <rule>
+ <pattern>
+ <token inflected="yes" regexp="yes">(прийняти|приймати)</token>
+ <token>міри</token>
+ </pattern>
+ <message>Правильно: <suggestion>вживати заходів</suggestion></message>
+ <example type="incorrect"><marker>Прийняти міри</marker> щодо
цього.</example>
+ <example type="incorrect"><marker>Прийняли міри</marker>, щоб цього
не сталося.</example>
+ <example type="incorrect"><marker>Приймуть міри</marker>, щоб цього
не сталося.</example>
+ <example type="correct">Приняли мірою ваги кілограм.</example>
+ </rule>
+ <rule>
+ <pattern>
+ <marker>
+ <token inflected="yes">рахувати</token>
+ </marker>
+ <token>,</token>
+ <token>що</token>
+ </pattern>
+ <message>Правильно: <suggestion>вважати</suggestion>,
<suggestion>гадати</suggestion></message>
+ <example type="incorrect">Він <marker>рахував</marker>, що все буде
гаразд.</example>
+ <example type="correct">Він вважав, що все буде гаразд.</example>
+ </rule>
+ <rule>
+ <pattern>
+ <token>мова</token>
+ <token>йде</token>
+ <token>про</token>
+ </pattern>
+ <message>Правильно: <suggestion>йдеться про</suggestion></message>
+ <example type="incorrect"><marker>Мова йде про</marker> наслідки
перемовин.</example>
+ <example type="correct">Йдеться про наслідки перемовин.</example>
+ </rule>
+ <rule>
+ <pattern> <!-- TODO: make it more generic -->
+ <token regexp="yes">(дві|три|чотири)</token>
+ <token>неділі</token>
+ </pattern>
+ <message>Правильно: <suggestion>... тижні</suggestion></message>
+ <example type="incorrect">Це зайняло нам <marker>дві
неділі</marker></example>
+ <example type="correct">Це зайняло нам два тижні.</example>
+ </rule>
<!--
<rule>
<pattern>
Modified:
trunk/languagetool/languagetool-language-modules/uk/src/main/resources/org/languagetool/rules/uk/replace.txt
===================================================================
---
trunk/languagetool/languagetool-language-modules/uk/src/main/resources/org/languagetool/rules/uk/replace.txt
2013-05-06 16:31:36 UTC (rev 10049)
+++
trunk/languagetool/languagetool-language-modules/uk/src/main/resources/org/languagetool/rules/uk/replace.txt
2013-05-07 02:49:56 UTC (rev 10050)
@@ -1,24 +1,77 @@
-# Format:
-# word=suggestion
-# or
-# word=suggestion1|suggestion2|suggestion3...
-#
+# Simple replace table
+# Format: word=suggestion1|suggestion2|suggestion3...
+
# TODO: add inflection support
-# незмінювані
-накінець=нарешті
-
-# лексеми
+азарт=запал|газард
атакуючий=атакувальний|нападний
багатократний=багаторазовий
-лишнiй=зайвий
-мiроприємство=захід
+багатообіцяючий=багатонадійний|багатообіцяльний
+багаточисельний=численний|рясний
+бажаючий=охочий
+баранка=бублик|обарінок
+бархатний=оскамитовий|бархатовий
+безпорядок=безлад|безладдя|безладнява|нелагода|нелад|розгардіяш|непорядок|безуряддя
+безпосадочний=безперервний
+безчинство=бешкет
+благоговіти=побожно схилятися|побожно (святобожно) шанувати|з побожною
(святобожною) пошаною ставитися|побожно коритися
+благовонний=запашний|запашистий|пахучий
+будь-ласка=будь ласка
+булижник=буковий камінь|кругляк|бурківка
+вважаючий=разючий
+визивати=викликати
+визиватися=викликатися
+високопарність=високомовність|пишномовність
+відключений=відімкнений|роз'єднаний
+відключати=відмикати|роз'єднувати
+відключити=відімкнути|роз'єднати
+відлагодження=налагодження|зневадження
+відлагоджувати=налагоджувати|зневаджуати
+відлагодити=налагодити|зневадити
+відлагоджувальний=налагоджувальний|зневаджувальний
+відслідкувати=прослідкувати|простежити
+вмішуватися=втручатися
+вникання=вдавання|вглядання
+вникати=вдаватися|вглядатися
+вникаючи=вдаючись
+вникнути=вдатися
+войлок=повсть
+вотчина=батьківщина|дідивщина
+всерйоз=серйозно|навсправжки
+вторгатися=вдиратися|впиратися
+вторгнутися=вдертися|впертися
+грасирувати=гаркавити
+достоїнство=гідність|достойність
+заказний=замовний
+заключний=прикінцевий|кінцевий|остаточний
+застінок=катівня
+землеробство=хліборобство|рільництво|ратайство
+злучка=парування|припуск|спуск
+клянчити=канючити|циганити|лабзюкати|лабзюкувати|жебрати|миркати
+лишній=зайвий
+міроприємство=захід
+накінець=нарешті
нападаючий=нападник|нападальний|нападний
насморк=нежить
+обширний=широкий|просторий|розлогий|широкополий|широкопросторий|ширококраїй
+осилити=перемагати|перемогти|подужати|здоліти|подолати
оточуючий=навколишній
+оціночний=оцінний|цінувальний
+під'єднати=приєднати|підімкнути|умикнути
+під'єднувати=приєднувати|підмикати|умикати
+понятний=зрозумілий
+посадочний=посадковий|висадковий
поясниця=поперек
правлячий=керівний|керівничий|владущий
працюючий=що працює|працівний|робітний|працівник|робітник
+слідуючий=наступний|черговий|подальший|другий|такий
+спасати=рятувати
+спасатися=рятуватися
співпадати=збігатися
+співставляти=зіставляти
+співставити=зіставити
строчка=рядок
учбовий=навчальний
+уяснити=з'ясувати|усвідомити|зрозуміти
+центробіжний=відцентровий
+шатер=намет|шатро|таш|таша
Modified:
trunk/languagetool/languagetool-language-modules/uk/src/test/java/org/languagetool/tagging/disambiguation/rules/uk/UkrainianRuleDisambiguatorTest.java
===================================================================
---
trunk/languagetool/languagetool-language-modules/uk/src/test/java/org/languagetool/tagging/disambiguation/rules/uk/UkrainianRuleDisambiguatorTest.java
2013-05-06 16:31:36 UTC (rev 10049)
+++
trunk/languagetool/languagetool-language-modules/uk/src/test/java/org/languagetool/tagging/disambiguation/rules/uk/UkrainianRuleDisambiguatorTest.java
2013-05-07 02:49:56 UTC (rev 10050)
@@ -21,10 +21,11 @@
import java.io.IOException;
import org.languagetool.TestTools;
+import org.languagetool.language.Ukrainian;
import org.languagetool.tagging.disambiguation.rules.DisambiguationRuleTest;
+import org.languagetool.tagging.disambiguation.uk.UkrainianHybridDisambiguator;
import org.languagetool.tagging.disambiguation.xx.DemoDisambiguator;
import org.languagetool.tagging.uk.UkrainianTagger;
-import org.languagetool.language.Ukrainian;
import org.languagetool.tokenizers.SRXSentenceTokenizer;
import org.languagetool.tokenizers.uk.UkrainianWordTokenizer;
@@ -33,7 +34,7 @@
private UkrainianTagger tagger;
private UkrainianWordTokenizer tokenizer;
private SRXSentenceTokenizer sentenceTokenizer;
- private UkrainianRuleDisambiguator disambiguator;
+ private UkrainianHybridDisambiguator disambiguator;
private DemoDisambiguator demoDisambiguator;
@Override
@@ -41,7 +42,7 @@
tagger = new UkrainianTagger();
tokenizer = new UkrainianWordTokenizer();
sentenceTokenizer = new SRXSentenceTokenizer(new Ukrainian());
- disambiguator = new UkrainianRuleDisambiguator();
+ disambiguator = new UkrainianHybridDisambiguator();
demoDisambiguator = new DemoDisambiguator();
}
@@ -51,6 +52,11 @@
public void testChunker() throws IOException {
+ TestTools.myAssert("Танцювати до впаду",
+ "/[null]SENT_START Танцювати/[танцювати]verb:inf /[null]null до/[до
впаду]<adv>|до/[до]pryim:rv_rod /[null]null " +
+ "впаду/[впасти]verb:pres:s:1|впаду/[до впаду]</adv>",
+ tokenizer, sentenceTokenizer, tagger, disambiguator);
+
TestTools.myAssert("Прийшла Люба додому.",
"/[null]SENT_START Прийшла/[прийти]verb:past:f /[null]null
Люба/[Люба]noun:f:v_naz|Люба/[любий]adj:f:v_naz /[null]null додому/[додому]adv
./[null]null",
tokenizer, sentenceTokenizer, tagger, demoDisambiguator);
This was sent by the SourceForge.net collaborative development platform, the
world's largest Open Source development site.
------------------------------------------------------------------------------
Learn Graph Databases - Download FREE O'Reilly Book
"Graph Databases" is the definitive new guide to graph databases and
their applications. This 200-page book is written by three acclaimed
leaders in the field. The early access version is available now.
Download your free book today! http://p.sf.net/sfu/neotech_d2d_may
_______________________________________________
Languagetool-commits mailing list
[email protected]
https://lists.sourceforge.net/lists/listinfo/languagetool-commits