Re: [Apertium-catala] Maniquí

2018-04-16 Thread Juan Pablo Martínez

Bon dia,

Es poden fer entrades dobles amb els paradigmes abdominal__adj y 
abundante__adj, pero potser és millor tenir un nou paradigme per a 
aquests adjectius (/marroquí, ceutí, israelí, pakistaní/

/​,.../).
Així serà més fácil que si s'incorporen nous casos més endavant no s'hi 
oblide una de les dues possibles terminacions de plural.


Juan Pablo

El 17/04/2018 a las 0:06, Donís Seguí escribió:
Bon dia, Hi ha un tema que ja vaig tractar la setmana passada amb 
Jaume. Es tracta de paraules com/bisturí/, que ens va eixir en 
castellà en plurarl, /bisturíes,/ que el programa no va traduir, i és 
perquè remet a/abismo/, model que només accepta el plural acabat 
en/-s, bisturís/. Aleshores, Jaume em va dir que tant/bisturí 
/com/esquí, frenesí... /han de remetre a/club/, substantiu masculí, 
que fa/clubs /i/clubes/.


També tenim com a paradigma "*maniquí*" que és un substantiu masculí i 
femení que


​també ​
fa plural en /-ís/ i /-íes/.

Penseu, però, que també caldrà tenir un paradigma

​per las adjectius
, masculí i femení, al qual pugue
​m assignar
els gentilicis, com ara /marroquí, ceutí, israelí, pakistaní/
/​, //yemení//, tu​necí/
/./.. que tenen doble terminació en plural /-ís/ i -/íes/
/​/i són masculí i femení?​


Gràcies


Donís Seguí


--
Check out the vibrant tech community on one of the world's most
engaging tech sites, Slashdot.org! http://sdm.link/slashdot


___
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala


--
Check out the vibrant tech community on one of the world's most
engaging tech sites, Slashdot.org! http://sdm.link/slashdot___
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala


Re: [Apertium-catala] Fwd: Noms propis

2018-04-16 Thread Donís Seguí
Bon dia, tal com vaig expressar l’altre dia, en la Conselleria d’Educació
estem a punt de presentar el nou Salt, molt possiblement dins d’un parell
de setmanes, i volem avançar tant com siga possible. Tenim clar que no
podem introduir tot el que tenim, ni de bon tros, abans de la presentació,
ja que tenim un bon paquet d’entrades preparades per a introduir, tant de
vocabulari com de noms propis. Per això, ens interessa tindre clar quin
criteri volem seguir amb els noms propis, alguns dels quals volem introduir
ja aquesta setmana.



Marc diu que es partidari d’especificar al màxim possible, i posa l’exemple
de Núria, i entenc que en aquests casos podem fer dues entrades, una “ant”
i una altra “top”.



M’agradaria que quedara clar el tema dels noms propis, per poder seguir a
partir d’ara un criteri comú.



Pel que he vist, observant les bases, pel que fa als noms propis tenim el
següent.

*En castellà tenim com a  paradigmes:*

Antropònims: n="Abad__np"/>

Topònims: n="Afganistán__np"

Altres: n="ABC__np"

*En el català:*

*Antropònims*: n="Abad__np"; n="Marc__np"; n="Maria__np": n="Saussure__np”

*Topònims: *n="Iran__np"; n="Àfrica__np"; n="Pau__np";
n="Estats_Units__np"; n="Balears__np"

*Altres: *Abans hi havia ="ABC__np", però ara veig que s’està optant per
distingir gènere i hi ha n="Linux__np" i n="Wikipedia__np"



*Bilingüe*

Ací és on he detectat diversitat de tractament. En pose uns exemples
diferenciats en els tres grups (antropònims, topònims, altres). Podem
concretar quin dels models de cada grup usem a partir d’ara?

*Topònims:*

   Montblanc

   Kosovo

   Mequinensa

   Alborache  Alboraig

   Albión Albió

*Antropònims*:

   Jackson

   Jacinto

   Mendel

   MercéMercè

*Altres:*

   Logse

   Altavista

   Kremlin



​Gràcies

Donís​


> --
> Check out the vibrant tech community on one of the world's most
> engaging tech sites, Slashdot.org! http://sdm.link/slashdot
> ___
> Apertium-catala mailing list
> Apertium-catala@lists.sourceforge.net
> https://lists.sourceforge.net/lists/listinfo/apertium-catala
>
>
--
Check out the vibrant tech community on one of the world's most
engaging tech sites, Slashdot.org! http://sdm.link/slashdot___
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala


Re: [Apertium-catala] Fwd: Noms propis

2018-04-16 Thread Xavi Ivars
Perdoneu per tardar tant.

En resum: estic d'acord amb tots :)

Anem per passos:

Entrant en el cas espanyol-català, ¿suggereixes que valdria més eliminar
> les marques d'invariable ?


Només en els casos on hi ha discrepància. Per exemple, no veig cap problema
en tindre Madrid. Algú veu un problema amb això?


la millor solució sempre hauria de ser desdoblar l'entrada en qüestió en
>  i  i tractar la discrepància al diccionari bilingüe i no afegir
> variants en un dels diccionaris monolingües per acceptar el que hi ha a
> l'altre.


Concidisc amb això, tot i que a vegades, la millor solució no és la
"viable". Com a exemple, quan es va fer tota la feina amb els noms propis a
apertium-cat, la manera més "senzilla" de que quasi tot continuara fu
ncionant a l'apertium spa-cat era aprendre a generar més coses de les que
s'analitzaven a l'apertium-spa i a l'apertium-cat. Es tractava, llavors,
d'una solució temporal (tot i que "indefinida") que, idealment s'anirà
resolent, tractant les diferències (si n'hi ha!) al monolingüe.


> Quant a la feina, si és productiva, o no, la meva impressió que ho és i
> molt. Per si mateixos, és cert, no donen gaire informació però són
> essencials per al desambiguador. Quan hi ha paraules desconegudes, va
> completament perdut. En cas d'ambigüitat, la paraula que hi ha després o
> abans no sap si és un verb, una preposició, un nom o el qui sigui. Per això
> sóc partidari, i he anat afegint, milers d'antropònims. I molts més que en
> falten! El que és cert, és que n'hi ha prou de tractar-los a l'engròs: una
> llista de cognoms, no te la mires gaire. Te la mires pel damunt per veure
> que no hi hagi errors evidents i, si pots, en carregues mil de cop.
>
> Hi ha un cas, com a mínim, però, que és que sí que aporten informació
> rellevant. En el cas de la concordança en gènere entre subjecte i atribut.
> La qüestió és que, per exemple, en el parell català-francès tens vora 1/3
> dels adjectius que són mf en un costat i m o f en l'altre. Sense informació
> de gènere, qui l'encerta l'endevina amb el gènere que poses per solucionar
> un GD.
>
>
+1

A la llarga, resulta productiu, i amb un diccionari bilingüe "net", no
generaria problemes. El cas actualment amb spa-cat és que no està net del
tot, amb moltes entrades com a  al bidix que tenen informació diferent
als respectius monolingües.


-- 
< Xavi Ivars >
< http://xavi.ivars.me >
--
Check out the vibrant tech community on one of the world's most
engaging tech sites, Slashdot.org! http://sdm.link/slashdot___
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala