Even if it is in French, these exchanges could be on this list.

User-Agent: libremail : logiciel libre multilingue
Date: Wed, 07 Oct 2015 21:34:01 +0200
From: "Bernard Chardonneau" <bechapert...@free.fr>
To: Joan <auc...@gmail.com>
Cc: "Bernard Chardonneau" <bechapert...@free.fr>, "Mikel L. Forcada" 
<m...@dlsi.ua.es>,
     Gema Ramirez Sanchez <grami...@prompsit.com>
Subject: Re: French-catalan

> Date: Wed, 7 Oct 2015 17:26:28 +0200
> From: Joan <auc...@gmail.com>
> To: Bernard Chardonneau <bechapert...@free.fr>
> Cc: "Mikel L. Forcada" <m...@dlsi.ua.es>, Gema Ramirez Sanchez
<grami...@prompsit.com>
> Subject: Re: French-catalan
>
> Merci, Bernard, j'ai pu voir le vidéo. Je pense que j'arrive à comprendre
> (un peu) la logique du système. Interessant!
>
> Alors, je vais essayer d'ajouter les mots de mes mails (et d'autres), mais
> je n'ai reçu pas les fichiers compactes
>                Je viens de remettre les dictionnaires sous une forme plus
> compacte :
>                - 1 mot par ligne,
>                - classement par ordre alphabétique.

Il suffit de récupérer la version actuelle de la paire :

svn checkout https://svn.code.sf.net/p/apertium/svn/trunk/apertium-fr-ca

La différence, c'est que toutes les balises XML d'un mot sont à présent
sur la même ligne (dans la section main).

>
> J'espère que ça sera facile de trouver (ou non) un mot. Je vais commencer
> par les noms et les adjectifs.

Si tu parles des paradigmes, j'avais fait un shell qui classe les paradigmes
utilisés dans un dictionnaire unilingue/morphologique par fréquence
décroissante


#!/bin/bash

fgrep "<e lm=" $1 |
sed "s/.*n=\"//
     s/\".*//" | sort | uniq -c | sort -rn

à la place de $1, on met par exemple apertium-fr-ca.fr.metadix

On peut ensuite faire un 2ème grep pour ne garder que les paradigmes
- des noms communs : | grep _n$
- des adjectifs : | grep _adj
- etc...

Si tu rajoutes un mot, il y a une bonne probabilité qu'il corresponde à
l'un des paradigmes les plus fréquents.

>
> Et  je vais vous proposer mes changements.
>
> En rélation à "mon epoque", normalement je traduis du fr-->cat, alors il
> fallait trouver "la meva època", pas "el meu època". J'arrive à comprendre
> un peu la desambiguisation (on utilise aussi sur wikipedia) et le
> post-proces...mais...ici ça n'a pas fonctionné.

Du français vers le catalan, il faudrait que lorsqu'on a un déterminant
possessif (balises <det><pos> dans l'analyse) suivi d'un nom commun, on
génère en catalan le même genre de chose mais en mettant me genre du nom
comme genre du déterminant.

Celà se passe à l'étape de transfert.
Voir les pages du wiki :
http://wiki.apertium.org/wiki/Introduction_aux_r%C3%A8gles_de_transfert
http://wiki.apertium.org/wiki/Exemples_de_r%C3%A8gles_de_transfert
et notamment ce paragraphe
http://wiki.apertium.org/wiki/Exemples_de_r%C3%A8gles_de_transfert#Transf.C3.A9rer_deux_mots_en_les_accordant

ou encore, ce que j'a expliqué dans ma video pour traduire "la kato ludas"
en français.

Le fichier à compléter ou corriger s'appelle apertium-fr-ca.fr-ca.t1x

Je voie aussi un fichier apertium-fr-ca.fr-ca.t1x-new 
mais je n'ai pas compris pourquoi 2 fichiers distincts.


>
> joan
>
> El dimarts, 6 d'octubre de 2015, Bernard Chardonneau <bechapert...@free.fr>
> va escriure:
>
> > > Date: Mon, 5 Oct 2015 10:24:57 +0200
> > > From: Joan <auc...@gmail.com <javascript:;>>
> > > To: Bernard Chardonneau <bechapert...@free.fr <javascript:;>>
> > > Cc: "Mikel L. Forcada" <m...@dlsi.ua.es <javascript:;>>, Gema Ramirez
> > Sanchez <grami...@prompsit.com <javascript:;>>
> > > Subject: French-catalan
> > >
> > > oh là là!
> > > Merci par vos apportations!
> > > Avant de partir (maintenant je suis justement en France) je suis arrivé
> > aux
> > > dictionnaires catalan et français, mais je ne suis pas sure que ces
> > > fichiers soient la dernière version. Pour ajouter un nom il faut trouver
> > un
> > > qui fait pareil le pluriel, féminin, etc...
> >
> > Pour les dictionnaires qui décrivent une seule langue, oui.
> > Sinon, on peut aussi mettre une description pour la forme au singulier et
> > une
> > autre pour le même mot au pluriel (idem, pour le masculin et le féminin
> > pour les adjectifs).
> > Mais c'est moins long de ne mettre qu'une ligne par mot.
> >
> > > Mais pas possible d'arriver voir
> > > le dictionaire bilingue.
> > Dans les dictionnaires bilingues, on se limite à des lemmes, c'est à dire :
> > - des noms au singulier,
> > - des adjectifs au masculin singulier,
> > - des verbes à l'infinitif.
> >
> > Pour plus d'explication (en français) il y a cette vidéo
> >
>>
>
http://video.rmll.info/videos/developper-des-paires-de-langues-pour-la-traduction-automatique-avec-apertium/
>> > et comme il y a eu des problèmes pour projeter avec mon ordinateur, voici
> > le
> > fichier de la présentation (disponible aussi en pdf).
> > http://imagesn.free.fr/apertium/pres-atelier-2014.odp
> >
> >
> > > Maintenant, avec l'Ipad, je ne peux pas y travailler...la prochaine
> > semaine.
> >
> > Je viens de remettre les dictionnaires sous une forme plus compacte :
> > - 1 mot par ligne,
> > - classement par ordre alphabétique.
> >
> > Malgré tout, un dictionnaire fait quelques dizaines de milliers de lignes.
> >
> > >
> > > Je profite pour vous poser encore des questions.
> > >
> > > Noms/adjectifs absents:
> > > - soeur (c'est bizarre son absence, non?, mais c'est vrai qu'Apertium
> > (sur
> > > wikipedia) ne le traduit pas)
> > Comme pour le nom, au masculin, c'est frère :
> > https://fr.wiktionary.org/wiki/s%C5%93ur#Adjectif
> > https://fr.wiktionary.org/wiki/fr%C3%A8re#Adjectif
> >
> >
> > > - ainé, cadette (utilisé par exemple, à "fille ainé/cadette")
> > ainé et cadet au masculin
> > ainée et cadette au féminin
> > (très classique)
> >
> > > - familial
> > familial (masculin singulier)
> > familiale (féminin singulier)
> > familiaux (masculin pluriel)
> > familiales (féminin pluriel)
> > Le paradigme utilisé est celui du mot "amical"
> > Tu peux te baser sur d'autres dictionnaire, par exemple dans les paires :
> > - français - espagnol
> > - français - esperanto
> > - espagnol - catalan
> >
> > >  - adolescence
> > > - panne
> > 2 noms féminins
> >
> > > - échec
> > nom masculin.
> >
> > >
> > > Encore: comme Apertium donne réponse pour un mot qui a des sens
> > > differents? Par exemple: "Rafelson est issu d'une famille aisée"... aisée
> > > on peut traduire par ''acomodada'' ou ''fàcil''. Ici: acomodada. Il y a
> > des
> > > traducteurs, que dans ce cas, ajoutent un *, alors, on propose
> > > "*acomodada/fàcil"
> >
> > Lorsque un mot dans une langue donne plusieurs traductions possibles dans
> > une autre, avec apertium, on fait un choix.
> > Toutefois on peut prévoir :
> > - de traduire différemment des groupes de mots (comme "pomme de terre"),
> > - des traductions alternatives se rapportant à un domaine particulier
> >
> > >
> > > Encore:
> > > La traduction de "lui" est parfois "luïdes". C'est vraiment bizarre.
> > >
> > > I finalement,
> > > Il y a de mots feminins, dont la première lettre est une voyelle, qui
> > > changent l'adjectif, pour la musicalité du français :) ...par exemple:
> > > mon époque...il faut traduire: "la meva època", pas "el meu època"
> >
> > C'est fait élégamment à l'étape de post-génération :
> >
> > Traduction de "la meva època"
> >
> > analyse + désambiguisation
> > ^el meu<det><pos><f><sg>$ ^època<n><f><sg>$
> >
> > transfert = traduction
> > ^mon<det><pos><f><sg>$ ^époque<n><f><sg>$
> >
> > génération
> > ~ma époque
> >
> > post génération
> > mon époque
> >
> >
> > Traduction de "el meu època"
> >
> > analyse + désambiguisation
> > ^el meu<det><pos><m><sg>$ ^època<n><f><sg>$
> >
> > transfert = traduction
> > ^mon<det><pos><m><sg>$ ^époque<n><f><sg>$
> >
> > génération
> > ~ma époque   (j'aurai plutôt généré ~mon époque)
> >
> > post génération
> > mon époque
> >
> > De même, si l'étape de transfert donne ceci :
> >
> > ^le<det><def><m><sg>$ ^chat<n><m><sg>$ ^grimper<vblex><pri><p3><sg>$
> > ^dans<pr>$ ^le<det><def><m><sg>$ ^arbre<n><m><sg>$ ^de<pr>$
> > ^le<det><def><m><sg>$ ^voisin<n><m><sg>$ ^et<cnjcoo>$ ^de<pr>$
> > ^le<det><def><f><sg>$ ^voisin<n><f><sg>$
> >
> > On obtient à l'étape de génération
> > ~le chat grimpe dans ~le arbre ~de ~le voisin et ~de ~la voisine
> >
> > et après la post génération
> > le chat grimpe dans l'arbre du voisin et de la voisine
> >
> > >
> > > À bientôt
> > >
> > > Joan
> > >
> > Pas de problème.
> >
> > --------------------------------
> > Bernard Chardonneau (France)
> > Phone : [33] 9 72 36 32 90
> > GSM phone : [33] 6 49 95 13 95
> >
> > Multilingual websites for my free softwares :
> > http://libremail.free.fr and http://libremail.tuxfamily.org
> > http://cyloop.tuxfamily.org (mainly translated with Apertium)
> >
> > My general website (in french only)
> > http://bech.free.fr
> >
>
--------------------------------
Bernard Chardonneau (France)
Phone : [33] 9 72 36 32 90
GSM phone : [33] 6 49 95 13 95

Multilingual websites for my free softwares :
http://libremail.free.fr and http://libremail.tuxfamily.org
http://cyloop.tuxfamily.org (mainly translated with Apertium)

My general website (in french only)
http://bech.free.fr

------------------------------------------------------------------------------
Full-scale, agent-less Infrastructure Monitoring from a single dashboard
Integrate with 40+ ManageEngine ITSM Solutions for complete visibility
Physical-Virtual-Cloud Infrastructure monitoring from one console
Real user monitoring with APM Insights and performance trend reports 
Learn More http://pubads.g.doubleclick.net/gampad/clk?id=247754911&iu=/4140
_______________________________________________
Apertium-stuff mailing list
Apertium-stuff@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-stuff

Reply via email to