Merci beaucoup pour l'info. Khue, je vais analyser.
 
--
Fabrice

________________________________

De: Khue Nguyen [mailto:[EMAIL PROTECTED]
Date: lun. 7/08/2006 14:03
À: [email protected]
Objet : RE: indexation documents dans Jahia 4.1



Bonjour,

 

Il y a indexation du fichier qui est attaché à un conteneur lorsque l'état du 
conteneur a changé. Soit après les opérations d'édition, de validation ou 
restaure de version du conteneur.

 

Les changements apportés à ce même fichier directement à travers Webdav ne 
déclenche pas de changement sur le conteneur lié à ce fichier et il n'y a pas 
de ré-indexation du fichier, ni du conteneur.

Dans la version 5 par contre, ce type de changement entraîne la ré-indexation 
du fichier et de tous les conteneurs lié à ce fichier.

 

 

Pour l'indexation des catégories :

 

1)       Les catégories Jahia assignées au niveau du conteneur sont indexées 
avec le fichier sous l'attribut "container.category_key" : 

 

Category jahiaCategory = ... ;

String searchQuery = "test " + " AND  container.category_key:" + 
jahiaCategory.getKey();

 

( Voir syntax Lucene : 
http://lucene.apache.org/java/docs/queryparsersyntax.html )

 

2)       Les propriétés internes aux fichiers sont indexées sous des attributs 
dont le nom est formée par le préfix : "file_property_" suivi du nom de la 
propriété.

 

example : "file_property_author", "file_property_category" ( voir le fichier de 
mapping slide etc/slide/conf.xml )

 

Il est possible d'étendre et d'utiliser vos propres implémentations 
d'extracteurs de fichier ( fichier de configuration etc/config/config.xml 
section fileExtractors. Les implémentations par défaut sont dans le package 
org.jahia.services.filextraction ).

 

 

Cordialement,

 

Khue Nguyen

 

 

 

________________________________

From: Fabrice Douchy [mailto:[EMAIL PROTECTED] 
Sent: lundi, 7. août 2006 12:30
To: [email protected]
Subject: RE : indexation documents dans Jahia 4.1

 

 

Merci Stéphane,

 

Pour clarifier,  peux-tu confirmer ou modifier la phrase suivante ?

 

Le contenu des fichiers pdf, doc, ppt, xls, ... est indexé dans Jahia 4.1 si 
ces fichiers sont inclus dans un conteneur jahia, lui-même inclu dans un des 
pages du site virtuel.

 

Sinon, qu'en est-il pour les catégories associées aux fichiers ?

 

Merci d'avance.

 

--

Fabrice

 

________________________________

De: Stéphane Croisier [mailto:[EMAIL PROTECTED]
Date: lun. 7/08/2006 12:09
À: [email protected]
Objet : Re: indexation documents dans Jahia 4.1


Comme déjà mentionné dans ma réponse préalable: "Par défaut seul les fichiers 
utilisés dans une page sont indexés (insérer par exemple une boxe de type 
Fichier et mappé vos fichiers dans un container (une entrée))."

Les fichiers disponibles dans WebDAV ne sont donc indexés, dans Jahia 4.x, que 
lorsqu'ils sont lié à un "file field" et affiché dans une page Jahia. Les 
fichiers non linkés (uniquement disponible dans WebDAV mais pas disponible au 
sein d'une page Jahia à travers un container + file field) ne sont pas indexés.

Stéphane


At 11:52 07.08.2006, you wrote:






Bonjour, 

En cherchant des infos sur Jahia 4.1, j'ai trouvé la page 
http://www.jahia.net/download/jahia4/4_0/stable/new_features.html qui indique : 
PDF indexing: Jahia's search engine can now also index PDF documents through 
the use of the PDFBox library.
D'autre part, le fichier PDFBox-0.6.7a-patched.jar est disponible dans la 
librairie Jahia.
 
Serait-il possible d'avoir un peu plus d'information sur la manière 
d'implémenter l'indexation pdf, doc, ppt, xls, ... dans Jahia 4.1 ? Faut-il 
simplement que cette indexation soit effective dans Apache Lucene ?
 
Autre question : les catégories indiquées dans Jahia 4.1 (et versions 
ultérieures) sont-elles indexées dans le moteur de recherche ?
 
Merci d'avance.
 
--
SOGETI BELGIUM
M. Fabrice DOUCHY
160 av. Jules Bordet
B-1140 Brussels
[EMAIL PROTECTED]
--

- -- --- -----=[ scroisier at jahia dot com ]=---- --- -- -
Head of Products - Jahia Ltd, Route des Jeunes 9, 1227 Carouge (Switzerland)
Jahia : The Java Unified Web Platform 
www.jahia.org <http://www.jahia.org/>  - The Product Web Site
www.jahia.net <http://www.jahia.net/>  - The Community Web Site
www.jahia.com <http://www.jahia.com/>  - The Commercial Services Company

<<winmail.dat>>

Répondre à