Il semblerait dans portal_transforms qu'il n'y ait pas de chaîne
xls_to_text, mais seulement xls_to_html. Ensuite, je pense que la chaine
html_to_text est utilisée. Pensez-vous qu'il me faille utiliser une chaîne
de transformation directe xls_to_text et si oui, de quel soft ai-je besoin ?

Merci d'avance


Cédric Marfil
Ingénieur conseils en Technologies de l'information
Unilog IT Services NRD
a logicaCMG company
Marcq en Baroeul
Tél: 03.59.56.60.68 (actuellement joignable à la CRMA au 03.20.14.26.36)
Mail: [EMAIL PROTECTED]
 
-----Message d'origine-----
Date: Sat, 01 Jul 2006 16:11:00 +0200
From: Olivier Grisel <[EMAIL PROTECTED]>
Subject: [CPS-users-fr] Re: Indexation de documents excel
To: [email protected]
Message-ID: <[EMAIL PROTECTED]>
Content-Type: text/plain; charset=windows-1252; format=flowed

MARFIL CEDRIC a écrit :
> Bonjour,
> 
> Est-ce que quelqu’un sait comment faire pour indexer fiablement un 
> document excel uploadé dans un document de type fichier ?
> 
> Je rencontre à priori des problèmes d’indexation inhérents à 
> l’indexation d’un fichier, converti correctement en html par xlHtml, 
> mais dont les balises TABLE, TD, TR… sont simplement supprimées avant de 
> lancer l’indexation, ce qui cause la concaténation des mots de début et 
> de fin de cellule lors de l’indexation.
> 
> Exemple :
> 
> | Contenu1 | Contenu 2 | Contenu3 | va être indexé de la sorte :
> 
> (u’Contenu1Contenu’ 1), (u’2Contenu3’ 1) …
> 
> Et ainsi de suite.
> 
> Avez-vous une idée de l’endroit où il faille regarder ?

Il faut regarder dans PortalTransforms la chaine qui est utilisée pour
passer du 
xls au texte. Il est possible que ca passe par une etape intermediaire de
html 
qui est possible d'améliorer si nécessaire.

-- 
Olivier



_______________________________________________
cps-users-fr
Adresse de la liste : [email protected]
Gestion de l'abonnement : <http://lists.nuxeo.com/mailman/listinfo/cps-users-fr>

Répondre à