Revision: 8554
http://languagetool.svn.sourceforge.net/languagetool/?rev=8554&view=rev
Author: jaumeortola
Date: 2012-12-15 17:46:48 +0000 (Sat, 15 Dec 2012)
Log Message:
-----------
[ca]
- Improved rules: ReflexiveVerbs, TANT_TAN
- New rules: FULLA_FULL, ALTRE_ALTRA
Modified Paths:
--------------
trunk/JLanguageTool/src/main/java/org/languagetool/rules/ca/ReflexiveVerbsRule.java
trunk/JLanguageTool/src/main/resources/org/languagetool/resource/ca/disambiguation.xml
trunk/JLanguageTool/src/main/resources/org/languagetool/resource/ca/multiwords.txt
trunk/JLanguageTool/src/main/resources/org/languagetool/rules/ca/grammar.xml
trunk/JLanguageTool/src/test/java/org/languagetool/rules/ca/ReflexiveVerbsRuleTest.java
Modified:
trunk/JLanguageTool/src/main/java/org/languagetool/rules/ca/ReflexiveVerbsRule.java
===================================================================
---
trunk/JLanguageTool/src/main/java/org/languagetool/rules/ca/ReflexiveVerbsRule.java
2012-12-15 15:50:18 UTC (rev 8553)
+++
trunk/JLanguageTool/src/main/java/org/languagetool/rules/ca/ReflexiveVerbsRule.java
2012-12-15 17:46:48 UTC (rev 8554)
@@ -50,6 +50,8 @@
private static final Pattern VERBS_MOVIMENT =
Pattern.compile("anar|pujar|baixar");
private static final Pattern VERBS_SOVINT_PRONOMINALS =
Pattern.compile("deixar|fer|veure");
private static final Pattern VERBS_DEIXAR_FER =
Pattern.compile("deixar|fer");
+ private static final Pattern VERBS_PORTAR_DUR =
Pattern.compile("portar|dur");
+ private static final Pattern VERB_PORTAR = Pattern.compile("portar");
//list of potentially pronominal verbs from GDLC (eliminat: estudiar)
private static final Pattern VERBS_POTENCIALMENT_PRONOMINALS =
Pattern.compile("abaixar|abandonar|abarrocar|abellir|abismar|abissar|ablamar|ablanir|abocar|aboldronar|abonançar|abonar|abonir|abonyegar|abordar|abraonar|abraçar|abrivar|abroquerar|abrusar|absentar|abstraure|abstreure|aburgesar|acabar|acalar|acalorar|acantonar|acarrerar|acastellanar|acatalanar|accelerar|acetificar|acidificar|aclarir|aclimatar|aclivellar|aclucar|acoblar|acollir|acollonir|acomiadar|acomodar|acomplexar|acomplir|aconductar|aconsellar|acontentar|acopar|acoquinar|acordar|acorruar|acostar|acostumar|acotar|acotxar|acovardir|acreditar|acréixer|acubar|acubillar|acudir|acugular|acuitar|acular|acumular|acusar|adaptar|adargar|adherir|adjudicar|adollar|adolorir|adondar|adormir|adossar|adotzenar|adreçar|adscriure|adunar|afalconar|afanyar|afartar|afeblir|afectar|afermar|aferrar|afigurar|afilar|afilerar|afiliar|afillar|afinar|aflaquir|afligir|aflonjar|afluixar|afogar|afollar|afrancesar|afrevolir|afuar|afusar|agabellar|agafar|agarbar|agarbonar|agitar|aglomerar|aglutinar|agombolar|agostejar|agradar|agregar|agremiar|agreujar|agrir|agrisar|agrumar|aguantar|aguditzar|aigualir|airejar|aixecar|aixoplugar|ajaure|ajaçar|ajeure|ajornalar|ajudar|ajuntar|ajupir|ajustar|alabar|alarmar|alcalinitzar|alcoholitzar|alegrar|alentir|aliar|alimentar|alinear|allarar|allargar|allargassar|allerar|alleugerir|alleujar|alliberar|alligar|allistar|allitar|allotjar|allunyar|alterar|alzinar|alçar|amagar|amagrir|amanerar|amanir|amansar|amansir|amassar|ambientar|americanitzar|amistançar|amistar|amollar|amorar|amorosir|amorrar|amorriar|amotinar|amoïnar|amuntegar|anastomitzar|angoixar|anguniejar|animar|anomenar|anticipar|apagar|apaivagar|apanyar|aparellar|apariar|apartar|aparèixer|apassionar|apercebre|apilotar|apinyar|apitrar|aplanar|aplaçar|aplicar|apocar|apoderar|aposentar|apostar|apostemar|apregonar|aprendre|apressar|aprimar|aprofitar|apropar|apropiar|aprovisionar|aproximar|apujar|apuntalar|aquedar|aquietar|aquilotar|arborar|arbrar|arcar|argollar|aristocratitzar|armar|arquejar|arraconar|arramadar|arrambar|arramellar|arranjar|arrapar|arraulir|arrear|arrecerar|arredossar|arreglar|arrelar|arremangar|arremolinar|arremorar|arrenglerar|arreplegar|arrestar|arribar|arrimar|arriscar|arrissar|arrodonir|arromangar|arrombollar|arronsar|arrossegar|arrufar|arrugar|arruïnar|articular|asfixiar|assabentar|assaonar|assecar|assegurar|assentar|assenyalar|asserenar|assessorar|asseure|assimilar|associar|assolar|assolellar|assossegar|assotar|astorar|atabalar|ataconar|atalaiar|atandar|atansar|atapeir|atardar|atavellar|aterrir|aterrossar|atipar|atiplar|atonir|atorrollar|atracar|atribolar|atribuir|atrinxerar|atrofiar|atropellar|atrotinar|aturar|avalotar|avançar|avarar|avariar|avenir|aventurar|avergonyir|avesar|aviar|aviciar|avidar|avivar|avorrir|aïllar|aïrar|badar|balancejar|balandrejar|baldar|banyar|barallar|barrejar|basar|basquejar|bastar|batre|befar|bellugar|beneficiar|bleir|blocar|bolcar|bombar|bonificar|botir|brindar|brossar|bufar|buidar|burocratitzar|cabrejar|cabussar|cagar|calar|calmar|calçar|campar|cansar|cap|capalçar|capbussar|capficar|capgirar|captar|captrencar|caracteritzar|caragirar|carbonar|carbonatar|carbonitzar|cardar|cargolar|carregar|cartejar|casar|cascar|cenyir|cerciorar|cicatritzar|circumscriure|clamar|classificar|clavar|clivellar|cloure|coagular|cobrir|colar|colgar|colltorçar|colltòrcer|colrar|coltellejar|col·lapsar|col·legiar|col·locar|comanar|combinar|compadir|compaginar|compatir|compensar|complementar|complexificar|complicar|complir|complànyer|compondre|comportar|comprendre|comprimir|comprometre|compungir|comunicar|concentrar|concertar|conciliar|concordar|concretar|condemnar|condensar|conduir|confabular|confederar|confessar|confinar|confirmar|confitar|conformar|congelar|congestionar|conglomerar|conglutinar|congratular|congregar|congriar|conhortar|conjuminar|conjunyir|conjurar|connaturalitzar|consagrar|conscienciar|consentir|conservar|consolar|consolidar|constipar|consumir|contagiar|contaminar|contemperar|contenir|contorbar|contornar|contradir|contraposar|contreure|controlar|convertir|convèncer|corbar|corcar|cordar|coronar|corporificar|corregir|correspondre|corrompre|corsecar|cotitzar|covar|crebantar|cremar|creure|criar|crispar|cucar|cuidar|cuixatrencar|curar|curullar|damnar|debatre|decantar|decidir|declarar|decuplicar|decurvar|dedicar|defendre|defensar|definir|deformar|defugir|degradar|deixar|deixatar|deixondar|deixondir|deixuplinar|delectar|delir|delitar|denudar|departir|depauperar|depilar|deportar|depositar|depravar|deprimir|depurar|derivar|desabillar|desabonar|desabrigar|desacalorar|desacoblar|desaconductar|desaconduir|desacordar|desacostumar|desacreditar|desadherir|desaferrar|desafinar|desagafar|desagermanar|desagradar|desagregar|desajustar|desalinear|desamarrar|desamigar|desamistançar|desamorrar|desanar|desanimar|desaparellar|desapariar|desaparroquianar|desaplicar|desapropiar|desar|desarborar|desarmar|desarramadar|desarrambar|desarranjar|desarrapar|desarreglar|desarregussar|desarrelar|desarrengar|desarrenglar|desarrenglerar|desarrimar|desarrissar|desarromangar|desarrufar|desarrugar|desarticular|desassossegar|desatansar|desatapeir|desatendar|desavesar|desaveïnar|desballestar|desbaratar|desbarbar|desbarrar|desbordar|desbrancar|desbraonar|descabalar|descabdellar|descabellar|descalcificar|descalçar|descaminar|descantellar|descarbonatar|descarbonitzar|descarburar|descargolar|descarnar|descarregar|descarrerar|descartar|descastellanitzar|descatalanitzar|descelerar|descentrar|descenyir|desclassar|desclavar|descloure|descoagular|descobrir|descolgar|descollar|descolorar|descolorir|descol·locar|descompassar|descompensar|descompondre|descomprometre|descomptar|desconceptuar|desconcertar|desconfortar|descongelar|descongestionar|desconhortar|desconjuntar|desconnectar|descoratjar|descordar|descosir|descotxar|descrostar|descular|desdaurar|desdelitar|desdenyar|desdibuixar|desdinerar|desdir|desdoblar|desdoblegar|deseixir|deselectritzar|desembabaiar|desembadalir|desembadocar|desemballestar|desemboirar|desembolcallar|desembolcar|desembolicar|desembotir|desembotjar|desembotornar|desemboçar|desembravir|desembrocar|desembromallar|desembromar|desembullar|desembussar|desembutllofar|desemmandrir|desemmurriar|desempallar|desempastar|desemperesir|desempernar|desempipar|desempobrir|desempolainar|desempolsar|desempolvorar|desenamorar|desencadenar|desencaixar|desencalimar|desencalitjar|desencallar|desencaminar|desencantar|desencaparrar|desencapotar|desencaputxar|desencarar|desencarcarar|desencarranquinar|desencartonar|desencastar|desencaterinar|desencauar|desencavalcar|desencavallar|desencebar|desencerclar|desencercolar|desencimbellar|desencisar|desenclavar|desencoblar|desencolar|desencongir|desencoratjar|desencorbar|desencordillar|desencrespar|desencrostar|desendegar|desendeutar|desendogalar|desendolcir|desendollar|desendropir|desenfadar|desenfadeir|desenfarfegar|desenfellonir|desenferrissar|desenfetgegar|desenfilar|desenfitar|desenflocar|desenfocar|desenfrenar|desenfuriar|desenfurismar|desengandulir|desenganxar|desenganyar|desengatjar|desengavanyar|desengomar|desengormandir|desengorronir|desengreixar|desengrescar|desengruixir|desengrutar|desenguantar|desenguerxir|desenllaminir|desenllaçar|desenlleganyar|desenllepolir|desenllorar|desenlluernar|desenllustrar|desennuegar|desennuvolar|desenquadernar|desenquadrar|desenquimerar|desenrampar|desenredar|desenrederar|desenrolar|desenrotllar|desensabonar|desensenyorir|desensonyar|desensopir|desensuperbir|desentaular|desentelar|desentendre|desentenebrar|desentenebrir|desenterbolir|desenterrar|desentestar|desentortolligar|desentrampar|desentranyar|desentravessar|desentrecuixar|desentrenar|desentristir|desentumir|desentusiasmar|desenutjar|desenvelar|desenvernissar|desenvescar|desenvolupar|desenyorar|desequilibrar|desertitzar|desesmar|desesperançar|desesperar|desespessir|desestancar|desestanyar|desestovar|desfaixar|desfaiçonar|desfanatitzar|desfardar|desfasar|desfermar|desferrar|desficiar|desficiejar|desfigurar|desfilar|desflorir|desfocar|desfogar|desfonar|desfrarar|desfrenar|desfrunzir|desfullar|desganar|desgastar|desgavellar|desglaçar|desgraciar|desgranar|desgruixar|desguarnir|desguerxar|desguitarrar|deshabitar|deshabituar|deshidratar|deshumanitzar|desigualar|desil·lusionar|desimantar|desincorporar|desincrustar|desinfatuar|desinflamar|desinflar|desinhibir|desintegrar|desinteressar|desintoxicar|desionitzar|desjunyir|deslligar|deslliurar|desllodrigar|desllogar|deslloriguerar|deslluir|desllustrar|desmagnetitzar|desmaiar|desmallar|desmanegar|desmaquillar|desmarcar|desmembrar|desmillorar|desmoralitzar|desmorriar|desmudar|desmuntar|desnacionalitzar|desnaturar|desniar|desnierar|desnivellar|desnuar|desnucar|desobligar|desobstruir|desocupar|desorbitar|desordenar|desorganitzar|desorientar|despacientar|desparar|desparellar|despariar|despassar|despenjar|despentinar|despenyar|despersonalitzar|despertar|despintar|despistar|despitar|desplaçar|desplegar|desplomar|despoblar|despolir|desposseir|desprendre|desprestigiar|desprisar|despullar|despuntar|desrengar|desroentar|dessaborir|dessagnar|dessecar|dessolar|dessoldar|dessonillar|dessoterrar|dessuar|dessucar|destacar|destapar|destarotar|destemprar|destenyir|desteular|destintar|destorçar|destravar|destrempar|destrenar|destriar|destrossar|destòrcer|desunglar|desunir|desusar|desvariar|desvariejar|desvesar|desvestir|desvetllar|desviar|desvincular|desvitrificar|detenir|deteriorar|determinar|deturar|devaluar|dialitzar|dibuixar|diferenciar|difondre|diftongar|difuminar|dignificar|dilatar|diluir|dipositar|dirigir|disbauxar|disciplinar|disculpar|disfressar|disgregar|disgustar|dislocar|disparar|dispersar|disposar|disputar|disseminar|dissimilar|dissipar|dissociar|dissoldre|distanciar|distendre|distingir|distreure|distribuir|diversificar|divertir|dividir|divorciar|divulgar|doblar|doblegar|doctorar|documentar|doldre|domesticar|domiciliar|dominar|donar|dopar|dreçar|drogar|dubtar|dulcificar|duplicar|dutxar|eclipsar|efectuar|efeminar|eixamar|eixamenar|eixamorar|eixamplar|eixancar|eixancarrar|eixarrancar|eixarreir|eixorivir|eixugar|electritzar|electrocutar|elevar|elidir|emancipar|embabaiar|embadalir|embadocar|embajanir|embalar|embalbar|embalbir|embancar|embarbollar|embarcar|embardissar|embarracar|embarrancar|embarranquinar|embarrar|embarumar|embarzerar|embasardir|embassar|embastardir|embellir|embeure|embicar|emblanquir|emblavir|embofegar|embogir|emboirar|embolicar|emborbollar|emborratxar|emboscar|embossar|embotinar|embotir|emboçar|embrancar|embravir|embretolir|embriagar|embrocar|embrollar|embromar|embrossar|embrunir|embrutar|embrutir|embullar|embussar|embutllofar|embutxacar|emmagrir|emmalaltir|emmaleir|emmallar|emmandrir|emmarcir|emmaridar|emmascarar|emmatxucar|emmerdar|emmerdissar|emmetzinar|emmirallar|emmotllar|emmudir|emmusteir|emmustigar|emocionar|empadronar|empal·lidir|empantanar|empantanegar|empanxonar|empapatxar|emparar|emparaular|emparentar|emparrar|empastellar|empastifar|empastissar|empatxar|empedreir|empeguntar|empellar|empeltar|empenyorar|emperesir|emperlar|empernar|empetitir|empilar|empinar|empipar|empitjorar|empitrar|empixonar|emplenar|emplomallar|empobrir|empolainar|empolistrar|empolsar|empolsegar|empolsimar|empolsinar|empolvorar|empoquir|emporcar|emporprar|empotingar|emprendre|emprenyar|emprovar|enagrir|enamorar|enamoriscar|enarborar|enarbrar|enarcar|enardir|enasprar|enasprir|encabassar|encabir|encaboriar|encadarnar|encadenar|encaixar|encalbir|encalimar|encalitjar|encallar|encallir|encambrar|encamellar|encaminar|encamisar|encantar|encaparrar|encapellar|encaperonar|encaperullar|encaperutxar|encapirotar|encapotar|encapsular|encapullar|encaputxar|encaramel·lar|encarar|encarbonar|encarir|encarnar|encarranquinar|encarregar|encarrerar|encarrilar|encartonar|encasquetar|encastellar|encauar|encavallar|encegar|encendre|encepar|encertir|encetar|encimbellar|enciriar|enclaustrar|enclotar|encloure|encoblar|encofurnar|encoixir|encomanar|enconar|enconcar|encongir|encontrar|encoratjar|encorbar|encordar|encotillar|encotxar|encovar|encrespar|encreuar|encrostar|encrostimar|encrostissar|encruelir|endarreriar|endarrerir|endegar|endentar|endenyar|enderrocar|endeutar|endinsar|endogalar|endolcir|endolentir|endossar|endropir|endurir|enemistar|enervar|enfadar|enfadeir|enfangar|enfarfegar|enfarinar|enfastidir|enfastijar|enfellonir|enfervorir|enfetgegar|enfigassar|enfilar|enfistular|enfitar|enflocar|enflorar|enfondir|enfonsar|enfonyar|enforfoguir|enforinyar|enfortir|enfosquir|enfredar|enfredolicar|enfredorar|enfredorir|enfrontar|enfuriar|enfurir|enfurismar|engabiar|engalavernar|engallar|engallardir|engallir|engallofir|engalonar|engalvanir|enganar|engandulir|enganxar|enganyar|engatar|engatjar|engelosir|enginjolar|enginyar|engiponar|englotir|engolar|engolir|engordir|engorjar|engormandir|engorronir|engrandir|engreixar|engrescar|engrevir|engroguir|engronsar|engronyar|engrossir|engruixar|engruixir|engrutar|enguantar|enguerxir|enherbar|enjoiar|enjoiellar|enjoncar|enjullar|enlairar|enllacar|enllaminir|enllangorir|enllardar|enllardissar|enllaçar|enllefernar|enllefiscar|enllepissar|enllepolir|enllestir|enlletgir|enllistar|enllorar|enllordar|enllotar|enllustrar|ennegrir|ennoblir|ennovar|ennuegar|ennuvolar|enorgullar|enquadrar|enquibir|enquimerar|enrabiar|enramar|enrampar|enrancir|enrarir|enrasar|enravenar|enredar|enrederar|enrederir|enrellentir|enretirar|enrevenxinar|enriallar|enrigidir|enrinxolar|enriquir|enrobustir|enrocar|enrogir|enrolar|enronquir|enrosar|enrossir|enrotllar|enrullar|enrunar|ensabonar|ensagnar|ensalivar|ensangonar|enseguir|ensenyorir|ensonyar|ensopegar|ensopir|ensordir|ensorrar|ensotar|ensulsir|ensuperbir|entaforar|entatxonar|entaular|entebeir|entebionar|entelar|entendre|entendrir|entenebrar|entenebrir|enterbolir|enterrar|enterrossar|entestar|entollar|entonar|entornar|entortellar|entortolligar|entrampar|entrapar|entravessar|entrebancar|entregar|entregirar|entrellaçar|entrelligar|entremesclar|entrenar|entretenir|entreveure|entrevistar|entristar|entristir|entumir|enturar|entusiasmar|enutjar|envanir|envellir|envellutar|enverdir|enverinar|envermellir|envescar|enviar|envigorir|envilir|environar|enviscar|enviscolar|envitricollar|envoltar|enxarxar|enxiquir|enyorar|equilibrar|equivaler|equivocar|erigir|eriçar|errar|esbadiar|esbadinar|esbadocar|esbalair|esbaldir|esbaldregar|esbandir|esbardellar|esbargir|esbarriar|esbarzerar|esberlar|esbocinar|esboirar|esboldregar|esbombar|esbombolar|esborifar|esborrar|esborrifar|esborronar|esbotifarrar|esbotzar|esbrancar|esbraonar|esbraveir|esbullar|escabellar|escabellonar|escabotar|escaldar|escaldufar|escalfar|escalfeir|escalivar|escalonar|escamarlar|escamnar|escampar|escandalitzar|escantellar|escantonar|escanyar|escapar|escarmentar|escarrabillar|escarxar|escaure|escindir|esclafar|esclafassar|esclarir|esclerosar|escolar|escoltar|escometre|escondir|escotar|escridar|escridassar|escrostar|escrostissar|escrostonar|escruixir|escuar|escudar|escuixar|escular|escurçar|escórrer|esdernegar|esdevenir|esduir|esfacelar|esfereir|esfilagarsar|esfondrar|esfreixurar|esfullar|esfumar|esgallar|esgardissar|esgarrar|esgarrifar|esgarrinxar|esgarrinyar|esgarronar|esgavellar|esglaonar|esgotar|esgratinyar|esguardar|esguerrar|esllenegar|esllomar|esmadeixar|esmalucar|esmenar|esmicar|esmicolar|esmolar|esmorrellar|esmorronar|esmortir|esmunyir|esmussar|espalmar|espantar|espanyolitzar|espaordir|espargir|esparpallar|esparpillar|esparracar|esparverar|espassar|espatllar|espaventar|espavilar|especejar|especialitzar|espedaçar|espellifar|espellir|espellissar|espenyar|esperançar|esperar|espesseir|espessir|espicassar|espigar|espinar|espitrar|esplaiar|esplugar|espolsar|espoltrir|esponjar|esporuguir|esposar|esprémer|espuar|espuntar|espunyir|espuçar|esqueixar|esquerar|esquerdar|esquerdillar|esquerdissar|esquinçar|esquitxar|esquivar|est|estabilitzar|establir|estacionar|estalviar|estamordir|estancar|estandarditzar|estantolar|estanyar|estarrufar|estellar|estendre|estepitzar|estilitzar|estimbar|estintolar|estirar|estireganyar|estiuar|estontolar|estovar|estrangeritzar|estranyar|estratificar|estrenar|estressar|estretir|estrinxolar|estripar|estroncar|estropellar|estrènyer|estubar|estufar|esvair|esvalotar|esventar|esvorar|esvorellar|eternitzar|europeïtzar|evadir|evaporar|exacerbar|exaltar|examinar|exasperar|excedir|excitar|exclamar|excloure|exculpar|excusar|exercitar|exfoliar|exhalar|exhaurir|exhibir|exiliar|eximir|exornar|expandir|expatriar|explicar|exposar|expressar|extasiar|extenuar|exterioritzar|extingir|extraviar|extremar|faixar|familiaritzar|fanatitzar|fastiguejar|fatigar|federar|felicitar|feminitzar|ferir|fiar|ficar|figurar|filtrar|fingir|firar|fixar|flagel·lar|florir|folrar|foraviar|forcar|forjar|formalitzar|formar|fortificar|fossilitzar|fotre|fraccionar|fracturar|fragmentar|francesitzar|franquejar|fregar|fregir|frisar|fumar|fundar|gabar|gastar|gaudir|gelar|generalitzar|gestar|ginyar|girar|gitar|glaçar|gloriejar|governar|graduar|gramaticalitzar|gratar|gratular|gravar|grecitzar|grillar|gronxar|gronxejar|gronxolar|guanyar|guardar|guarir|guarnir|guerxar|guiar|guillar|habituar|hebraïtzar|hel·lenitzar|hemodialitzar|herniar|hibridar|hidratar|hissar|honorar|honrar|horripilar|horroritzar|hostatjar|humanitzar|humiliar|humitejar|identificar|igualar|il·luminar|il·lusionar|il·lustrar|imaginar|immergir|immolar|impacientar|implicar|imposar|impressionar|imprimir|impurificar|incarcerar|incendiar|inclinar|incomodar|incorporar|incrementar|incrustar|independitzar|indignar|indisposar|inebriar|infatuar|infectar|infestar|infiltrar|inflamar|inflar|informar|ingerir|inhabilitar|inhibir|iniciar|inquietar|inscriure|insinuar|inspirar|instal·lar|instruir|insubordinar|insultar|insurreccionar|integrar|intensificar|interessar|interferir|internar|interposar|interrompre|intranquil·litzar|introduir|inundar|invaginar|inventar|ionitzar|irritar|islamitzar|isolar|jubilar|jugar|junyir|justificar|lamentar|laxar|lignificar|limitar|llampar|llançar|llassar|llatinitzar|llepar|lletrejar|llevar|llicenciar|lligar|lliurar|llogar|lluir|localitzar|lucrar|macerar|malacostumar|malavesar|maliciar|mallar|malpensar|mamar|mancomunar|manegar|manejar|manifestar|mantenir|maquillar|marcir|marejar|marginar|maridar|marinejar|mascarar|massificar|masturbar|materialitzar|matricular|matxucar|mecanitzar|mediumitzar|menar|menjar|mentalitzar|menysprear|meravellar|merèixer|mesclar|metal·litzar|metamorfosar|meteoritzar|migrar|millorar|mineralitzar|mirar|mobilitzar|mocar|moderar|modernitzar|modificar|molestar|morfondre|morir|morrejar|mortificar|mossegar|mostrar|moure|mudar|mullar|multiplicar|musteir|mustiar|mustigar|mutilar|nacionalitzar|naturalitzar|necrosar|negar|neguitejar|netejar|nonuplicar|normalitzar|nuar|oblidar|obligar|obnubilar|obscurir|occidentalitzar|occitanitzar|ocultar|ocupar|ofegar|oferir|ofuscar|ombrar|omplir|operar|oposar|ordenar|orejar|organitzar|orgullar|orientalitzar|orientar|originar|orinar|oscar|oxigenar|pacificar|paganitzar|pagar|pansir|parapetar|parar|parlar|particularitzar|partir|passar|passejar|pedregar|pedrejar|pellar|penjar|pensar|pentinar|percaçar|perfeccionar|perfilar|permetre|persignar|persuadir|pessigar|petar|picar|pintar|pirar|plantar|plantificar|podrir|polaritzar|polir|pol·linitzar|pondre|popularitzar|portar|posar|possessionar|posticar|postrar|prear|precipitar|prendre|preocupar|preparar|presentar|prestar|prevaler|privar|proclamar|prodigar|produir|professionalitzar|proletaritzar|prometre|pronunciar|propagar|propalar|proposar|prostituir|prostrar|prou|proveir|pujar|punxar|purificar|putejar|quadrar|qualificar|quallar|quedar|quitar|rabejar|radicalitzar|rarificar|ratificar|reafirmar|realitzar|rebaixar|rebentar|reblir|rebolcar|rebullir|recargolar|reciclar|reciprocar|recloure|recobrar|recollir|recolzar|reconcentrar|reconciliar|reconstituir|recordar|recrear|recriminar|rectificar|reencarnar|reenganxar|refer|referir|refermar|reflectir|refocil·lar|reforçar|refractar|refredar|refrenar|refrescar|refringir|refugiar|refusar|regalar|regelar|regirar|rehabilitar|rehidratar|reincorporar|reinflar|reinstal·lar|reintegrar|rejovenir|relacionar|relaxar|rellentir|relligar|rellogar|remenar|remetre|remirar|remollir|remudar|remuntar|rendir|renovar|renovellar|rentar|repatriar|repensar|repetir|repintar|replegar|replujar|repodrir|reportar|reposar|representar|reprimir|reproduir|repuntar|rescabalar|reservar|resguardar|resignar|resinificar|resistir|resoldre|responsabilitzar|resquitar|ressecar|ressobinar|restablir|retardar|retenir|retintar|retirar|retractar|retre|retreure|retrobar|reunir|reveixinar|revelar|revellir|revenxinar|revestir|revifar|reviscolar|revoltar|rifar|rinxolar|riure|romanitzar|rombollar|rompre|rostir|rovellar|ruboritzar|russificar|sacrificar|salmorrar|salsir|salvar|santificar|satel·litzar|secularitzar|sedimentar|segar|segregar|seguir|sentir|senyar|separar|significar|silicificar|sincerar|sindicar|singularitzar|sinitzar|situar|sobrealimentar|sobreexcitar|sobreposar|sobresaltar|sobresanar|sobresaturar|sobtar|socarrar|solapar|solar|solaçar|soldar|solidaritzar|solidificar|sollar|sollevar|solvatar|somorgollar|soplujar|sostreure|sotaplujar|sotmetre|suberificar|suberitzar|subestimar|submergir|subscriure|suggestionar|sulfatar|sulfurar|sumar|sumir|superar|tallar|tancar|tant|tapar|temperar|tenyir|terraplenar|tirar|titular|tocar|tombar|torbar|torejar|tornar|torrar|trabucar|tractar|tranquil·litzar|transfigurar|transformar|translimitar|transmetre|transmutar|transparentar|transvasar|trasmudar|trasplantar|trastocar|trastornar|triar|tribular|trifurcar|trobar|tòrcer|ulcerar|ullar|unir|universalitzar|untar|vaporitzar|velar|venjar|ventar|vessar|vestir|viciar|vinclar|vincular|vitrificar|volar|volatilitzar|xalar|xutar");
private static final Pattern NO_VERBS_POTENCIALMENT_PRONOMINALS =
Pattern.compile("voler");
@@ -102,6 +104,9 @@
private static final Pattern LEMMA_PRONOM_CD = Pattern.compile("jo|tu|ell");
private static final Pattern POSTAG_PRONOM_CD =
Pattern.compile("P0.*|PP3CP000|PP3..A00");
+ private static final Pattern POSTAG_ADVERBI =
Pattern.compile("RG.*|.*LOC_ADV.*");
+ private static final Pattern ANYMESDIA = Pattern.compile("any|mes|dia");
+
private static final Pattern REFLEXIU_POSPOSAT =
Pattern.compile("-[mts]|-[mts]e|'[mts]|-nos|'ns|-vos|-us",Pattern.CASE_INSENSITIVE|Pattern.UNICODE_CASE);
//private static final Pattern REFLEXIU_ANTEPOSAT =
Pattern.compile("e[mts]|[mts]e|ens|us|-[mts]|-[mts]e|'[mts]|[mts]'|-nos|'ns|-vos|-us",Pattern.CASE_INSENSITIVE|Pattern.UNICODE_CASE);
@@ -152,6 +157,25 @@
if (i > 1 && mUpperCase.matches())
continue loop;
+ // Comprova: portar-se/emportar-se
+ if (i+2<tokens.length
+ && matchLemmaRegexp(tokens[i],
VERBS_PORTAR_DUR)
+ && isThereReflexivePronoun(tokens, i)
// ens portem, ens hem de portar
+ &&
!isThereVerbBefore(tokens,i,VERBS_DEIXAR_FER) // es deixen portar
+ && !matchPostagRegexp(tokens[i+1],
POSTAG_ADVERBI) // es porten bé
+ && !matchPostagRegexp(tokens[i+2],
POSTAG_ADVERBI) // hem de portar-nos bé
+ && !matchLemmaRegexp(tokens[i+2],
ANYMESDIA) // ens portem tres anys
+ ) {
+ // the rule matches
+ String msg;
+ if (matchLemmaRegexp(tokens[i], VERB_PORTAR))
{msg= "Cal escriure: <suggestion>em"+token+"</suggestion>."; }
+ else {msg= "Cal escriure:
<suggestion>en"+token+"</suggestion>.";}
+ final RuleMatch ruleMatch = new RuleMatch(this,
+ tokens[i].getStartPos(),
tokens[i].getStartPos()
+ +
token.length(), msg, "Ús incorrecte");
+ ruleMatches.add(ruleMatch);
+ }
+
//PERÍFRASI AMB VERB PRONOMINAL: el fan
*agenollar-se/agenollar
if (i+1<tokens.length
&& matchPostagRegexp(tokens[i],
VERB_INFGER)
@@ -162,9 +186,9 @@
final String msg = "En aquesta
perífrasi verbal el pronom reflexiu posterior és
redundant.<suggestion></suggestion>";
final RuleMatch ruleMatch = new
RuleMatch(this,
tokens[i+1].getStartPos(), tokens[i+1].getStartPos()
- +
tokens[i+1].getToken().length(), msg,
- "Pronom redundant");
+ +
tokens[i+1].getToken().length(), msg, "Pronom redundant");
ruleMatches.add(ruleMatch);
+ continue loop;
}
//VERBS PRONOMINALS: Cal que hi hagi pronom reflexiu.
@@ -186,6 +210,7 @@
+
token.length(), msg,
"Verb pronominal: falta un
pronom");
ruleMatches.add(ruleMatch);
+ continue loop;
}
// //FRASE IMPERSONAL
Modified:
trunk/JLanguageTool/src/main/resources/org/languagetool/resource/ca/disambiguation.xml
===================================================================
---
trunk/JLanguageTool/src/main/resources/org/languagetool/resource/ca/disambiguation.xml
2012-12-15 15:50:18 UTC (rev 8553)
+++
trunk/JLanguageTool/src/main/resources/org/languagetool/resource/ca/disambiguation.xml
2012-12-15 17:46:48 UTC (rev 8554)
@@ -4550,12 +4550,11 @@
<token postag="AQ.*|NC.*|SPS.*" postag_regexp="yes"/>
</pattern>
<disambig action="filter" postag="R.*"></disambig>
- </rule>
-
+ </rule>
<rule id="aa3" name="aa1">
<pattern>
<marker>
- <token postag="RG_anteposat" regexp="yes"><exception
regexp="yes">molt|poc|tant|tan|força</exception></token>
+ <token postag="RG_anteposat" regexp="yes"><exception
regexp="yes">molt|poc|tant|tan|força|massa</exception></token>
</marker>
<token postag="AQ.*|V.P.*" postag_regexp="yes"><exception
postag="V.[NMIS].*|_GV_" postag_regexp="yes"/></token>
</pattern>
@@ -4563,7 +4562,7 @@
</rule>
<rule id="aa4" name="aa1">
<pattern>
- <token postag="RG_anteposat" regexp="yes"><exception
regexp="yes">molt|poc|tant|tan|força</exception></token>
+ <token postag="RG_anteposat" regexp="yes"><exception
regexp="yes">molt|poc|tant|tan|força|massa</exception></token>
<marker>
<token postag="AQ.*|V.P.*" postag_regexp="yes"><exception
postag="V.[NMIS].*|N.*|_GV_" postag_regexp="yes"/></token>
<!-- exc. força restaurants
@@ -4576,7 +4575,7 @@
<rule id="aa5" name="aa1"><!-- amb més públic, per a tal objectiu.
Excep: en gairebé tots els; de més alta qualitat -->
<pattern>
<token postag="SPS00"/>
- <token postag="RG_anteposat" regexp="yes"><exception
regexp="yes">molt|poc|tant|tan|.+ment</exception></token>
+ <token postag="RG_anteposat" regexp="yes"><exception
regexp="yes">molt|poc|tant|tan|.+ment|massa</exception></token>
<marker>
<token postag="NC.*" postag_regexp="yes"><exception
postag="D.*|PI.*" postag_regexp="yes"/></token>
</marker>
@@ -4596,7 +4595,7 @@
</marker>
<and>
<token postag="AQ.*|V.P.*" postag_regexp="yes"></token>
- <token postag="N.*" postag_regexp="yes"></token>
+ <token postag="N.*" postag_regexp="yes"><exception
postag="N.[MC][SN].*" postag_regexp="yes"/></token>
</and>
</pattern>
<disambig action="filter" postag="RG.*"></disambig>
@@ -4652,7 +4651,7 @@
<marker>
<token postag="RG_anteposat"><exception postag="NC.*"
postag_regexp="yes">força</exception></token>
</marker>
- <token postag="AQ.*|V.P.*|PX.*" postag_regexp="yes"><!--
<exception postag="V.[^P].*" postag_regexp="yes"/> --></token>
+ <token postag="AQ.*|V.P.*|PX.*" postag_regexp="yes"><exception
postag="N.[MC][SN].*" postag_regexp="yes"/></token> <!-- <exception
postag="V.[^P].*" postag_regexp="yes"/> -->
</pattern>
<disambig action="filter" postag="RG.*"></disambig>
</rule>
@@ -4663,7 +4662,7 @@
<marker>
<token postag="RG_anteposat"/>
</marker>
- <token postag="AQ.*|V.P.*|PX.*" postag_regexp="yes"><!--
<exception postag="V.[^P].*" postag_regexp="yes"/> --></token>
+ <token postag="AQ.*|V.P.*|PX.*" postag_regexp="yes"><exception
postag="N.[MC][SN].*" postag_regexp="yes"/></token> <!-- <exception
postag="V.[^P].*" postag_regexp="yes"/> -->
</pattern>
<disambig action="filter" postag="RG.*"></disambig>
</rule>
@@ -5534,7 +5533,7 @@
<rule> <!-- Nom si ha concordat-->
<pattern>
<and>
- <token postag="N.*" postag_regexp="yes"
regexp="yes">tot</token>
+ <token postag="N.*" postag_regexp="yes">tot</token>
<token postag="_GN_MS"></token>
</and>
</pattern>
@@ -5543,7 +5542,7 @@
<rule> <!-- No nom si no ha concordat-->
<pattern>
<and>
- <token postag="N.*" postag_regexp="yes"
regexp="yes">tot</token>
+ <token postag="N.*" postag_regexp="yes">tot</token>
<token postag="N.*" postag_regexp="yes"
negate_pos="yes"></token>
</and>
</pattern>
@@ -5603,7 +5602,16 @@
</unify>
</pattern>
<disambig action="filter" postag="D.*"></disambig>
- </rule>
+ </rule>
+ <rule> <!-- tot això-->
+ <pattern>
+ <marker>
+ <token postag="DI.*" postag_regexp="yes">tot</token>
+ </marker>
+ <token postag="PD0NS000"/>
+ </pattern>
+ <disambig action="filter" postag="DI.*"></disambig>
+ </rule>
</rulegroup>
<rule id="P0_DA" name="pronom feble i article: pronom feble">
<!--mogut per "L'ens"-->
@@ -7210,6 +7218,45 @@
<disambig action="filter" postag="<LOC_ADV>"></disambig>
</rule>
</rulegroup>
+ <rulegroup id="molt_no_adverbi" name="molt no adverbi">
+ <rule>
+ <pattern>
+ <marker>
+ <and>
+ <token postag="RG.*" postag_regexp="yes"/>
+ <token postag="DI.[MC][SN].*" postag_regexp="yes"/>
+ </and>
+ </marker>
+ <token regexp="yes">de|d'</token>
+ <token postag="N.[MC][SN].*"
postag_regexp="yes"><exception>fons</exception></token>
+ </pattern>
+ <disambig action="filter" postag="[^R].*"></disambig>
+ </rule>
+ <rule>
+ <pattern>
+ <marker>
+ <and>
+ <token postag="RG.*" postag_regexp="yes"/>
+ <token postag="DI.[MC][SN].*" postag_regexp="yes"/>
+ </and>
+ </marker>
+ <token postag="N.[MC][SN].*"
postag_regexp="yes"><exception>fons</exception></token>
+ </pattern>
+ <disambig action="filter" postag="[^R].*"></disambig>
+ </rule>
+ <rule> <!-- massa coses -->
+ <pattern>
+ <marker>
+ <and>
+ <token postag="RG.*" postag_regexp="yes"/>
+ <token postag="DI.CN.*" postag_regexp="yes"/>
+ </and>
+ </marker>
+ <token postag="N.*"
postag_regexp="yes"><exception>fons</exception></token>
+ </pattern>
+ <disambig action="filter" postag="[^R].*"></disambig>
+ </rule>
+ </rulegroup>
<rule id="car" name="car (si no ha concordat com a nom o adjectiu)">
<pattern>
<token><exception postag="RG.*" postag_regexp="yes"/></token>
Modified:
trunk/JLanguageTool/src/main/resources/org/languagetool/resource/ca/multiwords.txt
===================================================================
---
trunk/JLanguageTool/src/main/resources/org/languagetool/resource/ca/multiwords.txt
2012-12-15 15:50:18 UTC (rev 8553)
+++
trunk/JLanguageTool/src/main/resources/org/languagetool/resource/ca/multiwords.txt
2012-12-15 17:46:48 UTC (rev 8554)
@@ -233,6 +233,7 @@
Ultra mesura LOC_ADV
Un per un LOC_ADV
Un poc LOC_ADV
+Un pèl LOC_ADV
Un xic LOC_ADV
Una mica LOC_ADV
Una per una LOC_ADV
@@ -474,6 +475,7 @@
ultra mesura LOC_ADV
un per un LOC_ADV
un poc LOC_ADV
+un pèl LOC_ADV
un xic LOC_ADV
una mica LOC_ADV
una per una LOC_ADV
Modified:
trunk/JLanguageTool/src/main/resources/org/languagetool/rules/ca/grammar.xml
===================================================================
---
trunk/JLanguageTool/src/main/resources/org/languagetool/rules/ca/grammar.xml
2012-12-15 15:50:18 UTC (rev 8553)
+++
trunk/JLanguageTool/src/main/resources/org/languagetool/rules/ca/grammar.xml
2012-12-15 17:46:48 UTC (rev 8554)
@@ -1192,6 +1192,20 @@
<example type="incorrect">Vaig llegir aquella
<marker>editorial</marker> horrorosa</example>
<example type="correct">Vaig llegir l'editorial</example>
</rule>
+ <rule id="ALTRE_ALTRA" name="confusió altre/altra">
+ <pattern>
+ <marker>
+ <token>altre</token>
+ </marker>
+ <token postag="N.FS.*" postag_regexp="yes"><exception
postag="_GN_MS"/></token>
+ </pattern>
+ <message>¿Volíeu dir <suggestion>altra</suggestion>?</message>
+ <short>Possible error de concordança</short>
+ <example type="incorrect" correction="altra">en qualsevol
<marker>altre</marker> lliga europea</example>
+ <example type="correct">en un o altre ordre</example>
+ <example type="correct">a un altre jove</example>
+ <example type="correct">escrigué un altre final</example>
+ </rule>
</rulegroup>
<rulegroup id="CONCORDANCES_ADJECTIUS_NEUTRES" name="concordances amb
adjectius neutres">
<rule>
@@ -1322,7 +1336,7 @@
</rulegroup>
</category>
- <category name="Verbs">
+ <category name="Verbs">
<rulegroup id="DORMIR_ADORMIRSE" name="*dormir-se / adormir-se">
<rule>
<pattern>
@@ -2674,6 +2688,32 @@
<rule>
<pattern>
<marker>
+ <token>tan</token>
+ <token>mal</token>
+ </marker>
+ <token><exception postag="V.P.*"
postag_regexp="yes"/></token>
+ </pattern>
+ <message>Si 'mal' és nom, cal escriure: <suggestion>tant
mal</suggestion> o <suggestion>tant de mal</suggestion>. Si és adverbi, potser
cal escriure: <suggestion>tan malament</suggestion>.</message>
+ <short>Possible confusió</short>
+ <example type="incorrect">¿Per què tan pocs fan <marker>tan
mal</marker> a tants.</example>
+ <example type="incorrect">Ho has fet <marker>tan
mal</marker>!</example>
+ <example type="correct">Ho veig tan mal fet!</example>
+ </rule>
+ <rule>
+ <pattern>
+ <marker>
+ <token regexp="yes">tants|tantes</token>
+ <token regexp="yes" inflected="yes">poc|poquet</token>
+ </marker>
+ </pattern>
+ <message>Cal dir: <suggestion>tan <match
no="2"/></suggestion>.</message>
+ <short>Construcció incorrecta.</short>
+ <example type="incorrect" correction="tan poques">Tinc
<marker>tantes poques</marker> ganes de fer-ho!</example>
+ <example type="correct">Hi ha tan pocs escriptors
bons.</example>
+ </rule>
+ <rule>
+ <pattern>
+ <marker>
<token>un</token>
<token>tant</token>
</marker>
@@ -11195,10 +11235,10 @@
<marker>
<token>poc</token>
<token>a</token>
- <token>poc</token>
+ <token regexp="yes">poc|poquet</token>
</marker>
</pattern>
- <message>Cal dir <suggestion>a poc a
poc</suggestion>.</message>
+ <message>Cal dir <suggestion>a poc a <match
no="4"/></suggestion>.</message>
<short>Expressió incorrecta</short>
<example type="incorrect"><marker>poc a poc</marker>
remuntarem el riu</example>
<example type="correct"><marker>a poc a poc</marker>
remuntarem el riu</example>
@@ -11206,9 +11246,9 @@
<rule>
<pattern>
<token>poca</token>
- <token>poc</token>
+ <token regexp="yes">poc|poquet</token>
</pattern>
- <message>¿Volíeu dir <suggestion>poc a
poc</suggestion>?.</message>
+ <message>¿Volíeu dir <suggestion>poc a <match
no="2"/></suggestion>?.</message>
<short>Possible confusió.</short>
<example type="incorrect"><marker>poca poc</marker></example>
<example type="correct">poc a poc</example>
@@ -11956,6 +11996,33 @@
<!-- #nomenar/anomenar
(?i)nomen.+ (?i)anomen.+ nom anom
(?i)càrrecs?|senadors?|.*presidents?|diputa.*|.*conseller.*|.*ministre.*|.*director.*|capit.+|.*general.*|vicari.*|rector.*|.*bisbe.*|alcalde.*|batl?le.*|tribunals?|consell|comit[éè]s?|entrenador.*|encarrega[td].*
ddXd,6dDd3d designar per a un càrrec donar nom -->
+ <rulegroup id="FULLA_FULL" name="fulla/full">
+ <rule>
+ <pattern>
+ <marker>
+ <token regexp="yes">full(a|es)</token>
+ </marker>
+ <token
regexp="yes">dominicals?|volants?|blastod.*|embrion.*|electrònic.*</token>
+ </pattern>
+ <message>En aquest sentit, cal dir <suggestion><match no="1"
postag="NCF(.).*" postag_regexp="yes"
postag_replace="NCM$1000">full</match></suggestion> (nom masculí).</message>
+ <short>Gènere incorrecte.</short>
+ <example type="incorrect" correction="fulls">no tinc les
<marker>fulles</marker> dominicals</example>
+ <example type="correct">jo tinc el full dominical</example>
+ </rule>
+ <rule>
+ <pattern>
+ <marker>
+ <token regexp="yes">full(a|es)</token>
+ </marker>
+ <token>de</token>
+ <token regexp="yes">serveis|càlculs?|programació</token>
+ </pattern>
+ <message>En aquest sentit, cal dir <suggestion><match no="1"
postag="NCF(.).*" postag_regexp="yes"
postag_replace="NCM$1000">full</match></suggestion> (nom masculí).</message>
+ <short>Gènere incorrecte.</short>
+ <example type="incorrect" correction="full">Obre la
<marker>fulla</marker> de càlcul</example>
+ <example type="correct">jo tinc el full dominical</example>
+ </rule>
+ </rulegroup>
<rule id="PORGAR_PURGAR" name="porgar/purgar">
<pattern>
<token inflected="yes">porgar</token>
Modified:
trunk/JLanguageTool/src/test/java/org/languagetool/rules/ca/ReflexiveVerbsRuleTest.java
===================================================================
---
trunk/JLanguageTool/src/test/java/org/languagetool/rules/ca/ReflexiveVerbsRuleTest.java
2012-12-15 15:50:18 UTC (rev 8553)
+++
trunk/JLanguageTool/src/test/java/org/languagetool/rules/ca/ReflexiveVerbsRuleTest.java
2012-12-15 17:46:48 UTC (rev 8554)
@@ -43,6 +43,9 @@
public void testRule() throws IOException {
// correct sentences:
+ assertCorrect("Ens portem força bé");
+ assertCorrect("Hem de portar-nos bé");
+ assertCorrect("Ells es porten tres anys");
assertCorrect("Fan que em malfiï.");
assertCorrect("Em fan malfiar.");
assertCorrect("El fan agenollar.");
@@ -145,6 +148,9 @@
assertCorrect("Joan no es va a jugar la feina.");
// errors:
+ assertIncorrect("en aquesta vida ens portem moltes sorpreses");
+ assertIncorrect("Ens hem portat massa material al campament");
+ assertIncorrect("Hem de dur-nos tot això.");
assertIncorrect("L'has fet tornar-se vermell.");
assertIncorrect("un dels pocs moviments que poden fer és
intentar pujar-se al carro de la indignació.");
assertIncorrect("és intentar pujar-se al carro de la
indignació.");
This was sent by the SourceForge.net collaborative development platform, the
world's largest Open Source development site.
------------------------------------------------------------------------------
LogMeIn Rescue: Anywhere, Anytime Remote support for IT. Free Trial
Remotely access PCs and mobile devices and provide instant support
Improve your efficiency, and focus on delivering more value-add services
Discover what IT Professionals Know. Rescue delivers
http://p.sf.net/sfu/logmein_12329d2d
_______________________________________________
Languagetool-commits mailing list
[email protected]
https://lists.sourceforge.net/lists/listinfo/languagetool-commits