> Date: Thu, 14 Sep 2017 12:30:00 +0300 > From: Hèctor Alòs i Font <hectora...@gmail.com> > To: "[apertium-stuff]" <apertium-stuff@lists.sourceforge.net> > Reply-To: apertium-stuff@lists.sourceforge.net > Subject: [Apertium-stuff] Anaphora resolution > Pièce(s) jointes(s) probable(s)> > This message is in Catalan. You can find a shorter explanation on the > problem in http://wiki.apertium.org/wiki/Anaphora_resolution Ideas are > welcomed. > > Mirant problemes amb el traductor de català a sard, veig que hi ha dues > coses relacionades que són absolutament generals en molts traductors a > partir del català i el castellà. Es tracta que cal tenir informació sobre > el referent dels pronoms. No sé si hi ha alguna cosa fet en Apertium (o amb > CG) que pugui utilitzar-se. En tot cas, podria ser un treball (o més) per a > un estudiant, no sé si com a tasca d'un GSoC, d'un treball de curs, etc. > > Les qüestions bàsiques són dues. > > La primera és el referent de "el seu" (spa "su"). Per traduir a moltes > llengües romàniques cal saber si el nombre del posseïdor ("el seu" o > "llur"). Per traduir a l'anglès o a l'esperanto, cal saber, a més, el > gènere i si és animat o inanimat (his, her, its, their). > > > El segon problema és més pelut, perquè fa referència a pronoms de subjecte > que normalment estan elidits en català i en castellà. > > La qüestió és que per traduir "ha arribat" a l'occità, francès, italià, > sard, etc. cal saber el gènere del subjecte perquè en canviar el verb > auxiliar a "ser" el pronom es coordina en gènere i nombre amb el subjecte > (amb excepcions, etc.): ha arribat > est arrivé/e. No només passa amb verbs > de moviment, sinó també amb els pronominals. Les incidències són moltes. > > La cosa és encara més freqüent quan es tradueix al francès, anglès, > esperanto, etc. en què cal inserir el pronom subjecte (i per a l'anglès i > l'esperanto no n'hi ha prou amb saber el gènere perquè entra "it"/"ĝi" a la > tria). > > > Sóc conscient que és un problema molt complicat, però cal pensar-hi si > volem fer un salt de qualitat en els traductors (especialment en l'últim > punt per al francès, anglès i esperanto). > > Com ho veieu? Hi ha alguna solució parcial que es pugui utilitzar? > > Cordialment, > Hèctor >
In English (even if Hèctor would understand French) Well it is not very different to this : La kato de la najbarino estas blanka. => Le chat de la voisine est blanc. La katino de la najbarino estas blanka. => La chatte de la voisine est blanche. With one stage transfer, as each part of the sentense can have structure variants (according to the list of pattern-items), that can quickly need a lot of very similar transfer rules. But with 3 stages transfer, the idea is to process something like : <subject> "de" <variable_part> <verb_group> For the Catalan example in the wiki a more basic sentense would be : Els grups del Parlament han mostrat el seu suport al batle d'Alaró <subject> "de" <variable_part1> <verb_group> "el" (....) In the chosen example : Els grups del Parlament han mostrat aquest dimarts el seu suport al batle d'Alaró <subject> "de" <variable_part1> <verb_group> <variable_part2> "el" (....) The problem is to define a list a possible structure for each variable part. Note (for Francis) : In French, there is "son" (masculine singular) and "sa" (feminine singular). So, it is more close to English. -------------------------------- Bernard Chardonneau (France) Phone : [33] 9 72 36 32 90 GSM phone : [33] 7 69 46 16 31 Multilingual websites for my free softwares : http://libremail.free.fr and http://libremail.tuxfamily.org http://cyloop.tuxfamily.org (mainly translated with Apertium) My general website (in french only) http://bech.free.fr ------------------------------------------------------------------------------ Check out the vibrant tech community on one of the world's most engaging tech sites, Slashdot.org! http://sdm.link/slashdot _______________________________________________ Apertium-stuff mailing list Apertium-stuff@lists.sourceforge.net https://lists.sourceforge.net/lists/listinfo/apertium-stuff