Even if it is in French, these exchanges could be on this list.
User-Agent: libremail : logiciel libre multilingue Date: Wed, 07 Oct 2015 21:34:01 +0200 From: "Bernard Chardonneau" <bechapert...@free.fr> To: Joan <auc...@gmail.com> Cc: "Bernard Chardonneau" <bechapert...@free.fr>, "Mikel L. Forcada" <m...@dlsi.ua.es>, Gema Ramirez Sanchez <grami...@prompsit.com> Subject: Re: French-catalan > Date: Wed, 7 Oct 2015 17:26:28 +0200 > From: Joan <auc...@gmail.com> > To: Bernard Chardonneau <bechapert...@free.fr> > Cc: "Mikel L. Forcada" <m...@dlsi.ua.es>, Gema Ramirez Sanchez <grami...@prompsit.com> > Subject: Re: French-catalan > > Merci, Bernard, j'ai pu voir le vidéo. Je pense que j'arrive à comprendre > (un peu) la logique du système. Interessant! > > Alors, je vais essayer d'ajouter les mots de mes mails (et d'autres), mais > je n'ai reçu pas les fichiers compactes > Je viens de remettre les dictionnaires sous une forme plus > compacte : > - 1 mot par ligne, > - classement par ordre alphabétique. Il suffit de récupérer la version actuelle de la paire : svn checkout https://svn.code.sf.net/p/apertium/svn/trunk/apertium-fr-ca La différence, c'est que toutes les balises XML d'un mot sont à présent sur la même ligne (dans la section main). > > J'espère que ça sera facile de trouver (ou non) un mot. Je vais commencer > par les noms et les adjectifs. Si tu parles des paradigmes, j'avais fait un shell qui classe les paradigmes utilisés dans un dictionnaire unilingue/morphologique par fréquence décroissante #!/bin/bash fgrep "<e lm=" $1 | sed "s/.*n=\"// s/\".*//" | sort | uniq -c | sort -rn à la place de $1, on met par exemple apertium-fr-ca.fr.metadix On peut ensuite faire un 2ème grep pour ne garder que les paradigmes - des noms communs : | grep _n$ - des adjectifs : | grep _adj - etc... Si tu rajoutes un mot, il y a une bonne probabilité qu'il corresponde à l'un des paradigmes les plus fréquents. > > Et je vais vous proposer mes changements. > > En rélation à "mon epoque", normalement je traduis du fr-->cat, alors il > fallait trouver "la meva època", pas "el meu època". J'arrive à comprendre > un peu la desambiguisation (on utilise aussi sur wikipedia) et le > post-proces...mais...ici ça n'a pas fonctionné. Du français vers le catalan, il faudrait que lorsqu'on a un déterminant possessif (balises <det><pos> dans l'analyse) suivi d'un nom commun, on génère en catalan le même genre de chose mais en mettant me genre du nom comme genre du déterminant. Celà se passe à l'étape de transfert. Voir les pages du wiki : http://wiki.apertium.org/wiki/Introduction_aux_r%C3%A8gles_de_transfert http://wiki.apertium.org/wiki/Exemples_de_r%C3%A8gles_de_transfert et notamment ce paragraphe http://wiki.apertium.org/wiki/Exemples_de_r%C3%A8gles_de_transfert#Transf.C3.A9rer_deux_mots_en_les_accordant ou encore, ce que j'a expliqué dans ma video pour traduire "la kato ludas" en français. Le fichier à compléter ou corriger s'appelle apertium-fr-ca.fr-ca.t1x Je voie aussi un fichier apertium-fr-ca.fr-ca.t1x-new mais je n'ai pas compris pourquoi 2 fichiers distincts. > > joan > > El dimarts, 6 d'octubre de 2015, Bernard Chardonneau <bechapert...@free.fr> > va escriure: > > > > Date: Mon, 5 Oct 2015 10:24:57 +0200 > > > From: Joan <auc...@gmail.com <javascript:;>> > > > To: Bernard Chardonneau <bechapert...@free.fr <javascript:;>> > > > Cc: "Mikel L. Forcada" <m...@dlsi.ua.es <javascript:;>>, Gema Ramirez > > Sanchez <grami...@prompsit.com <javascript:;>> > > > Subject: French-catalan > > > > > > oh là là! > > > Merci par vos apportations! > > > Avant de partir (maintenant je suis justement en France) je suis arrivé > > aux > > > dictionnaires catalan et français, mais je ne suis pas sure que ces > > > fichiers soient la dernière version. Pour ajouter un nom il faut trouver > > un > > > qui fait pareil le pluriel, féminin, etc... > > > > Pour les dictionnaires qui décrivent une seule langue, oui. > > Sinon, on peut aussi mettre une description pour la forme au singulier et > > une > > autre pour le même mot au pluriel (idem, pour le masculin et le féminin > > pour les adjectifs). > > Mais c'est moins long de ne mettre qu'une ligne par mot. > > > > > Mais pas possible d'arriver voir > > > le dictionaire bilingue. > > Dans les dictionnaires bilingues, on se limite à des lemmes, c'est à dire : > > - des noms au singulier, > > - des adjectifs au masculin singulier, > > - des verbes à l'infinitif. > > > > Pour plus d'explication (en français) il y a cette vidéo > > >> > http://video.rmll.info/videos/developper-des-paires-de-langues-pour-la-traduction-automatique-avec-apertium/ >> > et comme il y a eu des problèmes pour projeter avec mon ordinateur, voici > > le > > fichier de la présentation (disponible aussi en pdf). > > http://imagesn.free.fr/apertium/pres-atelier-2014.odp > > > > > > > Maintenant, avec l'Ipad, je ne peux pas y travailler...la prochaine > > semaine. > > > > Je viens de remettre les dictionnaires sous une forme plus compacte : > > - 1 mot par ligne, > > - classement par ordre alphabétique. > > > > Malgré tout, un dictionnaire fait quelques dizaines de milliers de lignes. > > > > > > > > Je profite pour vous poser encore des questions. > > > > > > Noms/adjectifs absents: > > > - soeur (c'est bizarre son absence, non?, mais c'est vrai qu'Apertium > > (sur > > > wikipedia) ne le traduit pas) > > Comme pour le nom, au masculin, c'est frère : > > https://fr.wiktionary.org/wiki/s%C5%93ur#Adjectif > > https://fr.wiktionary.org/wiki/fr%C3%A8re#Adjectif > > > > > > > - ainé, cadette (utilisé par exemple, à "fille ainé/cadette") > > ainé et cadet au masculin > > ainée et cadette au féminin > > (très classique) > > > > > - familial > > familial (masculin singulier) > > familiale (féminin singulier) > > familiaux (masculin pluriel) > > familiales (féminin pluriel) > > Le paradigme utilisé est celui du mot "amical" > > Tu peux te baser sur d'autres dictionnaire, par exemple dans les paires : > > - français - espagnol > > - français - esperanto > > - espagnol - catalan > > > > > - adolescence > > > - panne > > 2 noms féminins > > > > > - échec > > nom masculin. > > > > > > > > Encore: comme Apertium donne réponse pour un mot qui a des sens > > > differents? Par exemple: "Rafelson est issu d'une famille aisée"... aisée > > > on peut traduire par ''acomodada'' ou ''fàcil''. Ici: acomodada. Il y a > > des > > > traducteurs, que dans ce cas, ajoutent un *, alors, on propose > > > "*acomodada/fàcil" > > > > Lorsque un mot dans une langue donne plusieurs traductions possibles dans > > une autre, avec apertium, on fait un choix. > > Toutefois on peut prévoir : > > - de traduire différemment des groupes de mots (comme "pomme de terre"), > > - des traductions alternatives se rapportant à un domaine particulier > > > > > > > > Encore: > > > La traduction de "lui" est parfois "luïdes". C'est vraiment bizarre. > > > > > > I finalement, > > > Il y a de mots feminins, dont la première lettre est une voyelle, qui > > > changent l'adjectif, pour la musicalité du français :) ...par exemple: > > > mon époque...il faut traduire: "la meva època", pas "el meu època" > > > > C'est fait élégamment à l'étape de post-génération : > > > > Traduction de "la meva època" > > > > analyse + désambiguisation > > ^el meu<det><pos><f><sg>$ ^època<n><f><sg>$ > > > > transfert = traduction > > ^mon<det><pos><f><sg>$ ^époque<n><f><sg>$ > > > > génération > > ~ma époque > > > > post génération > > mon époque > > > > > > Traduction de "el meu època" > > > > analyse + désambiguisation > > ^el meu<det><pos><m><sg>$ ^època<n><f><sg>$ > > > > transfert = traduction > > ^mon<det><pos><m><sg>$ ^époque<n><f><sg>$ > > > > génération > > ~ma époque (j'aurai plutôt généré ~mon époque) > > > > post génération > > mon époque > > > > De même, si l'étape de transfert donne ceci : > > > > ^le<det><def><m><sg>$ ^chat<n><m><sg>$ ^grimper<vblex><pri><p3><sg>$ > > ^dans<pr>$ ^le<det><def><m><sg>$ ^arbre<n><m><sg>$ ^de<pr>$ > > ^le<det><def><m><sg>$ ^voisin<n><m><sg>$ ^et<cnjcoo>$ ^de<pr>$ > > ^le<det><def><f><sg>$ ^voisin<n><f><sg>$ > > > > On obtient à l'étape de génération > > ~le chat grimpe dans ~le arbre ~de ~le voisin et ~de ~la voisine > > > > et après la post génération > > le chat grimpe dans l'arbre du voisin et de la voisine > > > > > > > > À bientôt > > > > > > Joan > > > > > Pas de problème. > > > > -------------------------------- > > Bernard Chardonneau (France) > > Phone : [33] 9 72 36 32 90 > > GSM phone : [33] 6 49 95 13 95 > > > > Multilingual websites for my free softwares : > > http://libremail.free.fr and http://libremail.tuxfamily.org > > http://cyloop.tuxfamily.org (mainly translated with Apertium) > > > > My general website (in french only) > > http://bech.free.fr > > > -------------------------------- Bernard Chardonneau (France) Phone : [33] 9 72 36 32 90 GSM phone : [33] 6 49 95 13 95 Multilingual websites for my free softwares : http://libremail.free.fr and http://libremail.tuxfamily.org http://cyloop.tuxfamily.org (mainly translated with Apertium) My general website (in french only) http://bech.free.fr ------------------------------------------------------------------------------ Full-scale, agent-less Infrastructure Monitoring from a single dashboard Integrate with 40+ ManageEngine ITSM Solutions for complete visibility Physical-Virtual-Cloud Infrastructure monitoring from one console Real user monitoring with APM Insights and performance trend reports Learn More http://pubads.g.doubleclick.net/gampad/clk?id=247754911&iu=/4140 _______________________________________________ Apertium-stuff mailing list Apertium-stuff@lists.sourceforge.net https://lists.sourceforge.net/lists/listinfo/apertium-stuff