Bonjour,

 

Il y a indexation du fichier qui est attaché à un conteneur lorsque l'état
du conteneur a changé. Soit après les opérations d'édition, de validation ou
restaure de version du conteneur.

 

Les changements apportés à ce même fichier directement à travers Webdav ne
déclenche pas de changement sur le conteneur lié à ce fichier et il n'y a
pas de ré-indexation du fichier, ni du conteneur.

Dans la version 5 par contre, ce type de changement entraîne la
ré-indexation du fichier et de tous les conteneurs lié à ce fichier.

 

 

Pour l'indexation des catégories :

 

1)       Les catégories Jahia assignées au niveau du conteneur sont indexées
avec le fichier sous l'attribut "container.category_key" : 

 

Category jahiaCategory = ... ;

String searchQuery = "test " + " AND  container.category_key:" +
jahiaCategory.getKey();

 

( Voir syntax Lucene :
http://lucene.apache.org/java/docs/queryparsersyntax.html )

 

2)       Les propriétés internes aux fichiers sont indexées sous des
attributs dont le nom est formée par le préfix : "file_property_" suivi du
nom de la propriété.

 

example : "file_property_author", "file_property_category" ( voir le fichier
de mapping slide etc/slide/conf.xml )

 

Il est possible d'étendre et d'utiliser vos propres implémentations
d'extracteurs de fichier ( fichier de configuration etc/config/config.xml
section fileExtractors. Les implémentations par défaut sont dans le package
org.jahia.services.filextraction ).

 

 

Cordialement,

 

Khue Nguyen

 

 

 

  _____  

From: Fabrice Douchy [mailto:[EMAIL PROTECTED] 
Sent: lundi, 7. août 2006 12:30
To: [email protected]
Subject: RE : indexation documents dans Jahia 4.1

 

 

Merci Stéphane,

 

Pour clarifier,  peux-tu confirmer ou modifier la phrase suivante ?

 

Le contenu des fichiers pdf, doc, ppt, xls, ... est indexé dans Jahia 4.1 si
ces fichiers sont inclus dans un conteneur jahia, lui-même inclu dans un des
pages du site virtuel.

 

Sinon, qu'en est-il pour les catégories associées aux fichiers ?

 

Merci d'avance.

 

--

Fabrice

 

  _____  

De: Stéphane Croisier [mailto:[EMAIL PROTECTED]
Date: lun. 7/08/2006 12:09
À: [email protected]
Objet : Re: indexation documents dans Jahia 4.1


Comme déjà mentionné dans ma réponse préalable: "Par défaut seul les
fichiers utilisés dans une page sont indexés (insérer par exemple une boxe
de type Fichier et mappé vos fichiers dans un container (une entrée))."

Les fichiers disponibles dans WebDAV ne sont donc indexés, dans Jahia 4.x,
que lorsqu'ils sont lié à un "file field" et affiché dans une page Jahia.
Les fichiers non linkés (uniquement disponible dans WebDAV mais pas
disponible au sein d'une page Jahia à travers un container + file field) ne
sont pas indexés.

Stéphane


At 11:52 07.08.2006, you wrote:






Bonjour, 

En cherchant des infos sur Jahia 4.1, j'ai trouvé la page
http://www.jahia.net/download/jahia4/4_0/stable/new_features.html qui
indique : PDF indexing: Jahia's search engine can now also index PDF
documents through the use of the PDFBox library.
D'autre part, le fichier PDFBox-0.6.7a-patched.jar est disponible dans la
librairie Jahia.
 
Serait-il possible d'avoir un peu plus d'information sur la manière
d'implémenter l'indexation pdf, doc, ppt, xls, ... dans Jahia 4.1 ? Faut-il
simplement que cette indexation soit effective dans Apache Lucene ?
 
Autre question : les catégories indiquées dans Jahia 4.1 (et versions
ultérieures) sont-elles indexées dans le moteur de recherche ?
 
Merci d'avance.
 
--
SOGETI BELGIUM
M. Fabrice DOUCHY
160 av. Jules Bordet
B-1140 Brussels
[EMAIL PROTECTED]
--

- -- --- -----=[ scroisier at jahia dot com ]=---- --- -- -
Head of Products - Jahia Ltd, Route des Jeunes 9, 1227 Carouge (Switzerland)
Jahia : The Java Unified Web Platform 
www.jahia.org <http://www.jahia.org/>  - The Product Web Site
www.jahia.net <http://www.jahia.net/>  - The Community Web Site
www.jahia.com <http://www.jahia.com/>  - The Commercial Services Company

<<attachment: winmail.dat>>

Répondre à