Il semblerait dans portal_transforms qu'il n'y ait pas de chaîne xls_to_text, mais seulement xls_to_html. Ensuite, je pense que la chaine html_to_text est utilisée. Pensez-vous qu'il me faille utiliser une chaîne de transformation directe xls_to_text et si oui, de quel soft ai-je besoin ?
Merci d'avance Cédric Marfil Ingénieur conseils en Technologies de l'information Unilog IT Services NRD a logicaCMG company Marcq en Baroeul Tél: 03.59.56.60.68 (actuellement joignable à la CRMA au 03.20.14.26.36) Mail: [EMAIL PROTECTED] -----Message d'origine----- Date: Sat, 01 Jul 2006 16:11:00 +0200 From: Olivier Grisel <[EMAIL PROTECTED]> Subject: [CPS-users-fr] Re: Indexation de documents excel To: [email protected] Message-ID: <[EMAIL PROTECTED]> Content-Type: text/plain; charset=windows-1252; format=flowed MARFIL CEDRIC a écrit : > Bonjour, > > Est-ce que quelquun sait comment faire pour indexer fiablement un > document excel uploadé dans un document de type fichier ? > > Je rencontre à priori des problèmes dindexation inhérents à > lindexation dun fichier, converti correctement en html par xlHtml, > mais dont les balises TABLE, TD, TR sont simplement supprimées avant de > lancer lindexation, ce qui cause la concaténation des mots de début et > de fin de cellule lors de lindexation. > > Exemple : > > | Contenu1 | Contenu 2 | Contenu3 | va être indexé de la sorte : > > (uContenu1Contenu 1), (u2Contenu3 1) > > Et ainsi de suite. > > Avez-vous une idée de lendroit où il faille regarder ? Il faut regarder dans PortalTransforms la chaine qui est utilisée pour passer du xls au texte. Il est possible que ca passe par une etape intermediaire de html qui est possible d'améliorer si nécessaire. -- Olivier _______________________________________________ cps-users-fr Adresse de la liste : [email protected] Gestion de l'abonnement : <http://lists.nuxeo.com/mailman/listinfo/cps-users-fr>
