Hola Jaume,

Al diccionari monolingüe català queden uns 450 noms propis de a categoria
"altres" pendents de classificar (si algú s'hi vol animar, són aquí [1], al
cinquè full).

Sobre les etiquetes, crec que la confusió ve principalment de la
(des)organització del diccionari bilingüe castellà-català. Hi ha
moltíssimes entrades, com les del missatge de Donís Seguí, que estan
definides com a invariables (<i>), per la qual cosa Apertium busca el
mateix lema amb les mateixes etiquetes a tots dos costats. Si coincideix
tot no hi ha problema, però a la mínima que hi ha un canvi a un dels dos
monolingües (com ha passat amb el català) l'entrada queda trencada.

A part d'això, com bé has dit, hi ha diferents criteris pel que fa a les
etiquetes que cal especificar a les entrades del diccionari bilingüe. Jo
sóc partidari d'especificar el màxim d'etiquetes possible per evitar
problemes inesperats. Poso un exemple amb el nom propi "Núria", que pot ser
un antropònim o un topònim:

<e><p><l>Núria<s n="np"/></l><r>Núria<s n="np"/></r></p></e>

Amb una entrada així, Apertium transfereix totes les etiquetes darrere de
<np> d'un costat a l'altre. Si "Núria" existeix en català com a
<np><ant><f><sg>, Apertium cercarà en castellà el mateix, i funcionaria. El
problema apareixeria si s'afegís "Núria" com a topònim en català
(<np><top><f><sg>), perquè Apertium el transferiria al castellà per aquesta
mateixa entrada. Com que només hi ha especificada l'etiqueta <np>,
qualsevol cosa que sigui "Núria" i tingui aquesta etiqueta en primera
posició es transferiria. Per tant, és molt important especificar més
etiquetes, com per exemple:

<e><p><l>Núria<s n="np"/><s n="ant"/></l><r>Núria<s n="np"/><s
n="ant"/></r></p></e>

Amb una entrada així, només es transferiria l'antropònim. Si després es
volgués afegir el topònim, només caldria afegir una altra entrada:

<e><p><l>Núria<s n="np"/><s n="top"/></l><r>Núria<s n="np"/><s
n="top"/></r></p></e>

D'aquesta manera no hi hauria conflictes entre els dos tipus de nom propi i
es podria ajustar millor la traducció.

Marc[1]
https://docs.google.com/spreadsheets/d/19eFQ2xS6bItbCUxUtPNk-bMBRPIMKzLR1oY6d0t84_M/edit?usp=sharing

El dia 13 d’abril de 2018 a les 13:30, Jaume Ortolà i Font <
jaumeort...@gmail.com> ha escrit:

> Bon dia,
>
> Donís Seguí, que fa contribucions al parell espanyol-català, m'envia
> aquesta qüestió sobre noms propis. Copie el missatge més avall. ¿Algú pot
> explicar com està tot això ara mateix? Quins criteris s'han de seguir, què
> està pendent de fer, etc. Ni tan sols estic segur del significat de totes
> les etiquetes que es fan servir.
>
> També tinc altres dubtes sobre noms propis. Tenen relació amb els que
> queden pendents en el testvoc spa-cat.[1] ¿Quins criteris convé seguir?
> Entenc que els noms de persones en general no els traduïm, siga Pedro,
> Juan... o Pere, Joan... Però hi ha molts casos problemàtics o dubtosos. Els
> noms propis de persona poden coincidir amb topònims o amb noms comuns o
> altres coses: Nuria, Victoria, Gracia, Olimpia, Penedés... ¿Es poden
> establir unes orientacions generals o simplement hem de posar el que
> intuïtivament tinga més sentit en cada cas?
>
> Salutacions,
> Jaume Ortolà
>
> [1] https://github.com/apertium/apertium-spa-cat/blob/
> master/dev/testvoc.spa-cat.txt
>
>
> ---------- Missatge reenviat ----------
> De: Donís <segui_...@gva.es>
> Data: 13 d’abril de 2018 a les 13:11
> Assumpte: Noms propis
> Per a: Jaume Ortolà i Font <jaumeort...@gmail.com>
>
>
> Bon dia, Jaume, estem preparant una bona llista de noms propis, i hem vist
> que hi ha divergència de criteris. Mira estos casos
>
> *En estos antropònims:*
> <e>    <i>Adoración<s n="*np*"/></i></e>
> <e>    <i>Albentosa<s n="*np*"/></i></e>
> <e>    <i>Afrodita<s n="*np"/><s n="ant"*/></i></e>
> <e>    <i>Al<b/>Capone<s n=*"np"/><s n="ant"*/></i></e>
>
>
> *Ens estos topònims, en un posa que és "np" i en l'altre que és "ant" o
> "top"*
> <e>    <i>Albalat<b/>dels<b/>Tarongers<s n="*np*"/></i></e>
> <e>    <i>Albalat<s n="np"/><s n="*ant*"/></i></e>
> <e>    <i>Daimús<s n="np"/></i></e>
> <e>    <i>Dajla<s n="np"/><s n="*loc*"/></i></e>
>
> *En noms propis diversos:*
> <e a="GVA">    <i>Ciutat<b/>de<b/>les<b/>Arts<b/>i<b/>les<b/>Ciencies<s
> *n="np"/><s n="al"*/></i></e>
> <e><p><l>Govern<b/>Valencià<s n="np"/></l><r>Govern<b/>Valencià<s n=
> *"np"/>*</r></p></e>
>
>
> ------------------------------------------------------------
> ------------------
> Check out the vibrant tech community on one of the world's most
> engaging tech sites, Slashdot.org! http://sdm.link/slashdot
> _______________________________________________
> Apertium-catala mailing list
> Apertium-catala@lists.sourceforge.net
> https://lists.sourceforge.net/lists/listinfo/apertium-catala
>
>


-- 

*Marc Riera Irigoyen*
Freelance Translator EN/JA>CA/ES

(+34) 652 492 008
------------------------------------------------------------------------------
Check out the vibrant tech community on one of the world's most
engaging tech sites, Slashdot.org! http://sdm.link/slashdot
_______________________________________________
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala

Reply via email to