Revision: 9669
http://languagetool.svn.sourceforge.net/languagetool/?rev=9669&view=rev
Author: jaumeortola
Date: 2013-03-11 12:24:35 +0000 (Mon, 11 Mar 2013)
Log Message:
-----------
[ca] Multiple fixes in tagger dictionary. Additions to multiwords.txt. Fixed
some false alarms.
Modified Paths:
--------------
trunk/languagetool/languagetool-language-modules/ca/src/main/resources/org/languagetool/resource/ca/catalan.dict
trunk/languagetool/languagetool-language-modules/ca/src/main/resources/org/languagetool/resource/ca/catalan_synth.dict
trunk/languagetool/languagetool-language-modules/ca/src/main/resources/org/languagetool/resource/ca/disambiguation.xml
trunk/languagetool/languagetool-language-modules/ca/src/main/resources/org/languagetool/resource/ca/multiwords.txt
trunk/languagetool/languagetool-language-modules/ca/src/main/resources/org/languagetool/rules/ca/grammar.xml
trunk/languagetool/languagetool-language-modules/ca/src/main/resources/org/languagetool/rules/ca/wrongWordInContext.txt
Modified:
trunk/languagetool/languagetool-language-modules/ca/src/main/resources/org/languagetool/resource/ca/catalan.dict
===================================================================
(Binary files differ)
Modified:
trunk/languagetool/languagetool-language-modules/ca/src/main/resources/org/languagetool/resource/ca/catalan_synth.dict
===================================================================
(Binary files differ)
Modified:
trunk/languagetool/languagetool-language-modules/ca/src/main/resources/org/languagetool/resource/ca/disambiguation.xml
===================================================================
---
trunk/languagetool/languagetool-language-modules/ca/src/main/resources/org/languagetool/resource/ca/disambiguation.xml
2013-03-11 03:33:56 UTC (rev 9668)
+++
trunk/languagetool/languagetool-language-modules/ca/src/main/resources/org/languagetool/resource/ca/disambiguation.xml
2013-03-11 12:24:35 UTC (rev 9669)
@@ -3111,7 +3111,7 @@
<pattern>
<marker>
<and>
- <token postag="V.*" postag_regexp="yes"
regexp="yes">així|mes|pas|espasa|aroma|sorra|nom|sols?|via|vies|arbres?|tres|des|dos|com|res|tal|millor|pitjor|nombres?|entorn|davall|només</token>
+ <token postag="V.*" postag_regexp="yes"
regexp="yes">carro|així|mes|pas|espasa|aroma|sorra|nom|sols?|via|vies|arbres?|tres|des|dos|com|res|tal|millor|pitjor|nombres?|entorn|davall|només</token>
<token postag="V.*" postag_regexp="yes" negate_pos="yes" />
</and>
</marker>
Modified:
trunk/languagetool/languagetool-language-modules/ca/src/main/resources/org/languagetool/resource/ca/multiwords.txt
===================================================================
---
trunk/languagetool/languagetool-language-modules/ca/src/main/resources/org/languagetool/resource/ca/multiwords.txt
2013-03-11 03:33:56 UTC (rev 9668)
+++
trunk/languagetool/languagetool-language-modules/ca/src/main/resources/org/languagetool/resource/ca/multiwords.txt
2013-03-11 12:24:35 UTC (rev 9669)
@@ -1,6 +1,12 @@
#Catalan multiwords file used for chunking
A base d' LOC_PREP
A base de LOC_PREP
+A bastament LOC_ADV
+A bastança LOC_ADV
+A betzef LOC_ADV
+A bocons LOC_ADV
+A bondó LOC_ADV
+A burro-barra LOC_ADV
A bé d' LOC_PREP
A bé de LOC_PREP
A canvi d' LOC_PREP
@@ -15,6 +21,7 @@
A cient de LOC_PREP
A cobert d' LOC_PREP
A cobert de LOC_PREP
+A collbotet LOC_ADV
A collibè LOC_ADV
A coneguda d' LOC_PREP
A coneguda de LOC_PREP
@@ -22,8 +29,16 @@
A coneixença de LOC_PREP
A conseqüència d' LOC_PREP
A conseqüència de LOC_PREP
+A contracor LOC_ADV
+A contrafibra LOC_ADV
+A contrafil LOC_ADV
+A contrapèl LOC_ADV
A cop d' LOC_PREP
A cop de LOC_PREP
+A corre-corrents LOC_ADV
+A corre-cuita LOC_ADV
+A cremadent LOC_ADV
+A cuita-corrents LOC_ADV
A costa d' LOC_PREP
A costa de LOC_PREP
A càrrec d' LOC_PREP
@@ -52,6 +67,7 @@
A l caient de LOC_PREP
A l cap d' LOC_PREP
A l cap de LOC_PREP
+A l capdamunt LOC_ADV
A l capdamunt d' LOC_PREP
A l capdamunt de LOC_PREP
A l capdavall LOC_ADV
@@ -92,6 +108,7 @@
A l tombant de LOC_PREP
A l voltant d' LOC_PREP
A l voltant de LOC_PREP
+A l' engròs LOC_ADV
A l' instant LOC_ADV
A l'abast d' LOC_PREP
A l'abast de LOC_PREP
@@ -103,6 +120,8 @@
A l'empara de LOC_PREP
A l'entrant d' LOC_PREP
A l'entrant de LOC_PREP
+A la babalà LOC_ADV
+A la biorxa LOC_ADV
A la claror d' LOC_PREP
A la llarga LOC_ADV
A la claror de LOC_PREP
@@ -178,6 +197,7 @@
Arran de LOC_PREP
Arreu d' LOC_PREP
Arreu de LOC_PREP
+Art déco NCMS000
Atenent que LOC_CONJ
Avinent d' LOC_PREP
Avinent de LOC_PREP
@@ -201,6 +221,8 @@
D' allò més LOC_ADV
D' altra banda LOC_CONJ
D' amagat LOC_ADV
+D' amagatotis LOC_ADV
+D' amagatons LOC_ADV
D' amagat d' LOC_PREP
D' amagat de LOC_PREP
D' antuvi LOC_ADV
@@ -240,11 +262,13 @@
De bell principi LOC_ADV
De biaix LOC_ADV
De bo de bo LOC_ADV
+De bocadents LOC_ADV
De bocaterrosa LOC_ADV
De bona font LOC_ADV
De bona gana LOC_ADV
De cap manera LOC_ADV
De cara a LOC_PREP
+De copdescuit LOC_ADV
De debò LOC_ADV
De dretes LOC_ADV
De facto LOC_ADV
@@ -439,6 +463,8 @@
Pel que fa a LOC_PREP
Pels volts d' LOC_PREP
Pels volts de LOC_PREP
+Per capita LOC_ADV
+Per càpita LOC_ADV
Per causa d' LOC_PREP
Per causa de LOC_PREP
Per comparació a LOC_PREP
@@ -509,6 +535,12 @@
Vox populi NCFS000
a base d' LOC_PREP
a base de LOC_PREP
+a bastament LOC_ADV
+a bastança LOC_ADV
+a betzef LOC_ADV
+a bocons LOC_ADV
+a bondó LOC_ADV
+a burro-barra LOC_ADV
a bé d' LOC_PREP
a bé de LOC_PREP
a canvi d' LOC_PREP
@@ -523,6 +555,7 @@
a cient de LOC_PREP
a cobert d' LOC_PREP
a cobert de LOC_PREP
+a collbotet LOC_ADV
a collibè LOC_ADV
a coneguda d' LOC_PREP
a coneguda de LOC_PREP
@@ -530,8 +563,16 @@
a coneixença de LOC_PREP
a conseqüència d' LOC_PREP
a conseqüència de LOC_PREP
+a contracor LOC_ADV
+a contrafibra LOC_ADV
+a contrafil LOC_ADV
+a contrapèl LOC_ADV
a cop d' LOC_PREP
a cop de LOC_PREP
+a corre-corrents LOC_ADV
+a corre-cuita LOC_ADV
+a cremadent LOC_ADV
+a cuita-corrents LOC_ADV
a costa d' LOC_PREP
a costa de LOC_PREP
a càrrec d' LOC_PREP
@@ -560,6 +601,7 @@
a l caient de LOC_PREP
a l cap d' LOC_PREP
a l cap de LOC_PREP
+a l capdamunt LOC_ADV
a l capdamunt d' LOC_PREP
a l capdamunt de LOC_PREP
a l capdavall LOC_ADV
@@ -600,6 +642,7 @@
a l tombant de LOC_PREP
a l voltant d' LOC_PREP
a l voltant de LOC_PREP
+a l' engròs LOC_ADV
a l' instant LOC_ADV
a l'abast d' LOC_PREP
a l'abast de LOC_PREP
@@ -611,6 +654,8 @@
a l'empara de LOC_PREP
a l'entrant d' LOC_PREP
a l'entrant de LOC_PREP
+a la babalà LOC_ADV
+a la biorxa LOC_ADV
a la claror d' LOC_PREP
a la claror de LOC_PREP
a la llarga LOC_ADV
@@ -686,6 +731,7 @@
arran de LOC_PREP
arreu d' LOC_PREP
arreu de LOC_PREP
+art déco NCMS000
atenent que LOC_CONJ
avinent d' LOC_PREP
avinent de LOC_PREP
@@ -708,6 +754,8 @@
d' allò més LOC_ADV
d' altra banda LOC_CONJ
d' amagat LOC_ADV
+d' amagatotis LOC_ADV
+d' amagatons LOC_ADV
d' amagat d' LOC_PREP
d' amagat de LOC_PREP
d' antuvi LOC_ADV
@@ -748,10 +796,12 @@
de biaix LOC_ADV
de bo de bo LOC_ADV
de bocaterrosa LOC_ADV
+de bocadents LOC_ADV
de bona font LOC_ADV
de bona gana LOC_ADV
de cap manera LOC_ADV
de cara a LOC_PREP
+de copdescuit LOC_ADV
de debò LOC_ADV
de dretes LOC_ADV
de facto LOC_ADV
@@ -794,6 +844,7 @@
de viu en viu LOC_ADV
de viva veu LOC_ADV
del tot LOC_ADV
+delírium trèmens NCMN000
deçà i dellà d' LOC_PREP
deçà i dellà de LOC_PREP
dia i nit LOC_ADV
@@ -950,6 +1001,8 @@
pel que fa a LOC_PREP
pels volts d' LOC_PREP
pels volts de LOC_PREP
+per capita LOC_ADV
+per càpita LOC_ADV
per causa d' LOC_PREP
per causa de LOC_PREP
per comparació a LOC_PREP
Modified:
trunk/languagetool/languagetool-language-modules/ca/src/main/resources/org/languagetool/rules/ca/grammar.xml
===================================================================
---
trunk/languagetool/languagetool-language-modules/ca/src/main/resources/org/languagetool/rules/ca/grammar.xml
2013-03-11 03:33:56 UTC (rev 9668)
+++
trunk/languagetool/languagetool-language-modules/ca/src/main/resources/org/languagetool/rules/ca/grammar.xml
2013-03-11 12:24:35 UTC (rev 9669)
@@ -2999,7 +2999,7 @@
<marker>
<token>tan</token>
</marker>
- <token postag="AQ.[MC][SN].*|V.P.*SM.?"
postag_regexp="yes" skip="10"/>
+ <token postag="AQ.[MC][SN].*|V.P.*SM.?"
postag_regexp="yes" skip="10"><exception scope="next">tant</exception></token>
<token>com</token>
<token postag="AQ.[MC][SN].*|V.P.*SM.?"
postag_regexp="yes"/>
</pattern>
@@ -7323,7 +7323,7 @@
<token>ma</token>
</marker>
<token postag="AQ.FS.*|V.P..SF." postag_regexp="yes"/>
- <token><exception
regexp="yes">mare|cosina|tia|germana</exception></token>
+ <token><exception
regexp="yes">iaia|mare|cosina|tia|germana|àvia|besàvia|rebesàvia|bestia|néta|besnéta|rebesnéta</exception></token>
</pattern>
<message>S'accentua quan és nom:
<suggestion>mà</suggestion>.</message>
<short>S'accentua quan és nom.</short>
@@ -7331,6 +7331,7 @@
<example type="incorrect" correction="mà">Amb
<marker>ma</marker> decidida.</example>
<example type="correct">A ma estimada mare.</example>
<example type="correct">A ma mare.</example>
+ <example type="correct">Fou ma venerada besàvia.</example>
</rule>
</rulegroup>
<rulegroup id="SI" name="si/sí">
@@ -17754,7 +17755,7 @@
<rulegroup id="EXIGEIX_VERBS_CENTRAL" name="Exigeix formes verbals del
català central">
<rule>
<pattern>
- <token postag="V.{6}[VBZ]"
postag_regexp="yes"><exception postag="V.{6}[0CXY]|_possible_nompropi|N.*"
postag_regexp="yes"/><exception>vinga</exception></token>
+ <token postag="V.{6}[VBZ]"
postag_regexp="yes"><exception postag="V.{6}[0CXY]|_possible_nompropi|N.*|AQ.*"
postag_regexp="yes"/><exception>vinga</exception></token>
</pattern>
<message>Forma verbal valenciana o balear.</message>
<suggestion><match no="1" postag="(V.+)."
postag_regexp="yes" postag_replace="$1[CXY0]"/></suggestion>
@@ -17862,7 +17863,7 @@
<rulegroup id="EXIGEIX_VERBS_VALENCIANS" name="Exigeix formes verbals
valencianes" default="off">
<rule>
<pattern>
- <token postag="V.{6}[CBY]"
postag_regexp="yes"><exception postag="V.{6}[0VXZ]|_possible_nompropi|N.*"
postag_regexp="yes"/><exception>vinga</exception></token>
+ <token postag="V.{6}[CBY]"
postag_regexp="yes"><exception postag="V.{6}[0VXZ]|_possible_nompropi|N.*|AQ.*"
postag_regexp="yes"/><exception>vinga</exception></token>
</pattern>
<message>Forma verbal no valenciana.</message>
<suggestion><match no="1" postag="(V.+)."
postag_regexp="yes" postag_replace="$1[0VXZ]"/></suggestion>
@@ -17906,7 +17907,7 @@
<rulegroup id="EXIGEIX_VERBS_BALEARS" name="Exigeix formes verbals
balears" default="off">
<rule>
<pattern>
- <token postag="V.{6}[CVX]"
postag_regexp="yes"><exception postag="V.{6}[0BYZ]|_possible_nompropi|N.*"
postag_regexp="yes"/><exception>vinga</exception></token>
+ <token postag="V.{6}[CVX]"
postag_regexp="yes"><exception postag="V.{6}[0BYZ]|_possible_nompropi|N.*|AQ.*"
postag_regexp="yes"/><exception>vinga</exception></token>
</pattern>
<message>Forma verbal no balear.</message>
<suggestion><match no="1" postag="(V.+)."
postag_regexp="yes" postag_replace="$1[0BYZ]"/></suggestion>
@@ -17995,7 +17996,7 @@
</rule>
<rule>
<pattern>
- <token regexp="yes">vostés?|allén|atés</token> <!-- atés
que: loc_conj en disambiguation -->
+ <token
regexp="yes">vostés?|allén|atés|Filomé|Godofré|Josués?|Manfré|Mercés?</token>
<!-- atés que: loc_conj en disambiguation -->
</pattern>
<message>Accentuació valenciana.</message>
<suggestion><match no="1" regexp_match="^(.+)é(n|s)?"
regexp_replace="$1è$2"></match></suggestion>
@@ -18235,7 +18236,7 @@
<category name="C5) Formes de plural opcionals" default="off">
<rule id="EXIGEIX_PLURALS_S" name="Exigeix plurals en -s: homes,
joves..." default="off">
<pattern>
- <token
regexp="yes">àsens|còvens|fréixens|hòmens|jóvens|màrgens|òrfens|ràvens|térmens|vèrgens</token>
+ <token
regexp="yes">àsens|còvens|fréixens|hòmens|jóvens|màrgens|òrfens|(bleda-|col)?ràvens|térmens|vèrgens|(clavi)?òrguens</token>
</pattern>
<message>Existeix una forma de plural en -s.</message>
<short>Hi ha un plural en -s.</short>
@@ -18244,7 +18245,7 @@
</rule>
<rule id="EXIGEIX_PLURALS_NS" name="Exigeix plurals en -ns: hòmens,
jóvens..." default="off">
<pattern>
- <token
regexp="yes">ases|coves|freixes|homes|joves|marges|orfes|raves|termes|verges</token>
+ <token
regexp="yes">ases|coves|freixes|homes|joves|marges|orfes|(bleda-|col)?raves|termes|verges|(clavi)?orgues</token>
</pattern>
<message>Existeix una forma de plural en -ns.</message>
<short>Hi ha un plural en -ns.</short>
Modified:
trunk/languagetool/languagetool-language-modules/ca/src/main/resources/org/languagetool/rules/ca/wrongWordInContext.txt
===================================================================
---
trunk/languagetool/languagetool-language-modules/ca/src/main/resources/org/languagetool/rules/ca/wrongWordInContext.txt
2013-03-11 03:33:56 UTC (rev 9668)
+++
trunk/languagetool/languagetool-language-modules/ca/src/main/resources/org/languagetool/rules/ca/wrongWordInContext.txt
2013-03-11 12:24:35 UTC (rev 9669)
@@ -50,6 +50,6 @@
#bóta/bota
(?i)bót(a|es) (?i)bot(a|es) ót ot
(?i)congrenyada|bodega|bodegues|vaixells?|vi|vins|racó|racons|cellers?|nassos|olis?|ferment.*|envell[ieí].+
(?i)peus?|cal[çc].+|muntar|enllustr.+ recipient calçat
#arxivament/arxiu
-(?i)arxivaments? (?i)arxius? vament iu
(?i)denúnci(a|es)|diligènci(a|es)|expedients?|investigació (?i)històrics?
acció o efecte d'arxivar conjunt de documentació; edifici
+(?i)arxivaments? (?i)arxius? ivament iu
(?i)denúnci(a|es)|diligènci(a|es)|expedients?|investigació (?i)històrics?
acció o efecte d'arxivar conjunt de documentació; edifici
#compte/conte/comte
#mil·liar,millar,miliar,miler
This was sent by the SourceForge.net collaborative development platform, the
world's largest Open Source development site.
------------------------------------------------------------------------------
Symantec Endpoint Protection 12 positioned as A LEADER in The Forrester
Wave(TM): Endpoint Security, Q1 2013 and "remains a good choice" in the
endpoint security space. For insight on selecting the right partner to
tackle endpoint security challenges, access the full report.
http://p.sf.net/sfu/symantec-dev2dev
_______________________________________________
Languagetool-commits mailing list
[email protected]
https://lists.sourceforge.net/lists/listinfo/languagetool-commits