Bonjour,

Quelques questions suite à des expérimentations plus ou moins poussées
visant à mettre en place un entrepôt OAI-PMH avec SDX 2.3.

1) Le module sdv_v2 (http://cvs.savannah.gnu.org/viewvc/sdx_v2/?root=sdx)
est-il à considérer comme finalisé ?

2) Si oui, est-il possible de mettre à dispo une version finale de SDX 2.3
(prenant en compte la révision 1.69 qui semble être la dernière en date) ?
Attention : build.xml est probablement à mettre à jour en fonction des JDKs
actuellement disponibles.

Ayant travaillé avec une version 1.69 (étiquetée b1), voici les problèmes
que je rencontre :

3) cosmétique :

WARN    (2008-08-19) 10:39.55:062   [sdx.framework] (Unknown-URI)
Unknown-thread/LoggingUtils: SDX CONFIGURATION FAILURE: Unable to find an
<sdx:pipeline> element at,
file:/C:/Tomcat5.5/webapps/sdx/sdxtest/conf/application.xconf:349:57, the
element should have an <sdx:index> subelement containing an <sdx:pipeline>
element defining some transformations.
fr.gouv.culture.sdx.exception.SDXException: SDX CONFIGURATION FAILURE:
Unable to find an <sdx:pipeline> element at,
file:/C:/Tomcat5.5/webapps/sdx/sdxtest/conf/application.xconf:349:57, the
element should have an <sdx:index> subelement containing an <sdx:pipeline>
element defining some transformations.
 at
 
fr.gouv.culture.sdx.documentbase.AbstractDocumentBase.configurePipeline(AbstractDocumentBase.java:284)


4) Je cherche à mettre en place un <sdx:pipeline> dans mon
<sdx:oai-format>. Ce pipeline reprend, en gros, mon indexeur qui est bien
testé ;-) En tentant de cracher des élements <dc:foo>bar</dc:foo>,
j'obtiens cette exception qui m'empêche d'aller plus loin :

ERROR   (2008-08-19) 10:46.47:781   [sdx.framework.MERIMEEIA29001872]
(/sdx/sdx/oai/sribzh/db) http-8080-Processor25/LoggingUtils: SDX - Document
- XML : erreur dans le document à missing exception detail :
org.xml.sax.SAXException: Invalid processing instruction name
(saxon:warning)
javax.xml.transform.TransformerException: org.xml.sax.SAXException: Invalid
processing instruction name (saxon:warning)
 at fr.gouv.culture.sdx.exception.SDXException.log(SDXException.java:125)
 at
 fr.gouv.culture.sdx.exception.SDXException.<init>(SDXException.java:105)
 at fr.gouv.culture.sdx.document.XMLDocument.parse(XMLDocument.java:197)
 at
 fr.gouv.culture.sdx.repository.URLRepository.toSAX(URLRepository.java:403)
 at
 
fr.gouv.culture.sdx.documentbase.SDXDocumentBase.getDocument(SDXDocumentBase.java:501)

 at
 
fr.gouv.culture.sdx.documentbase.SDXDocumentBase.getDocument(SDXDocumentBase.java:544)

 at
 
fr.gouv.culture.sdx.oai.LuceneDocumentBaseOAIRepository.sendRecord(LuceneDocumentBaseOAIRepository.java:967)
...

L'exception étant avalée, il m'est impossible d'en savoir plus. J'ai bien
pensé à un énième problème de DTD non trouvée mais, la suite le montrera,
le processus peut continuer.

Bref, en sortie, je n'ai qu'un seul élement, le premier (pas encore
vraiment finalisé ;-) :

<dc:coverage code="lat"
xsi:schemaLocation="http://purl.org/dc/elements/1.1/
http://www.openarchives.org/OAI/2.0/oai_dc.xsd";>48.3881257</dc:coverage>

... mais pas les suivants que mon pipeline est censé générer.

5) d'où viennent ces attributs pourtant déjà présents dans l'élément racine
:
<OAI-PMH xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/
http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd";>. Erreur dans le SAX ? A
noter que le préfixe "dc" n'est pas défini.

6) en introduisant un élement conteneur (que j'ai nommé <a/> dans le
namespace vide), j'obtiens cela :

<a xsi:schemaLocation="http://purl.org/dc/elements/1.1/
  http://www.openarchives.org/OAI/2.0/oai_dc.xsd";>
  <dc:coverage code="lat">48.3881257</dc:coverage>
  <dc:coverage code="lon">-4.4999217</dc:coverage>
  <dc:field code="ref">IA29001872</dc:field>
  <dc:date>2005</dc:date>
  <dc:date>2005</dc:date>
  <dc:author>xxxxxxxxx</dc:author>
  <dc:publisher>(c) Inventaire général</dc:publisher>
  <dc:publisher>2005</dc:publisher>
  <dc:publisher>(c) Association Pour l'Inventaire de
  Bretagne</dc:publisher>
  <dc:publisher>APIB</dc:publisher>
  <dc:publisher>2005</dc:publisher>
</a>

... et pas d'exception dans mes logs :-)

7) même question pour les attributs et le préfixe.

8) cosmétique. J'obtiens :
header>
<identifier>sdx:localhost:8080:sribzh/db/MERIMEEIA29001872</identifier>
<datestamp>2008-08-18T14:26:41Z</datestamp>
</header>

J'imagine qu'on n'a pas de contrôle sur le format d'identifier ? Pas trop
grave mais je me demande si l'hôte n'en dit pas trop...

9) Bref, puis-je espérer faire fonctionner un entrepôt OAI avec un pipeline
avec SDX 2.3 ?

10) si non, comment migrer vers SDX 2.4 ?

Désolé pour ces nombreuses questions. Une réponse à la dixième me suffira
pour l'instant :-)

A bientôt,

p.b.



_______________________________________________
sdx-users mailing list
[email protected]
http://lists.nongnu.org/mailman/listinfo/sdx-users

Répondre à