Télécharger
    Installer
    Présentation
    Configuration
    Indexation
       Pipeline
       Original et usage
       Paramètres
       Format de sortie
      +Champs SDX <-
       Documents attachés
       Fragmentation
       Thésaurus
    Recherche
    OAI
    Javadoc
    Référence API-XSP
    Migration
    Schemas
    Performances


SDX

Champs SDX

Peu importe la liste des champs déclarés pour une base de documents, et peu importe les champs effectivement remplis lors de l'indexation d'un document, SDX va toujours ajouter des champs aux bases de documents et des valeurs à ces champs lors de l'indexation de tous les documents. Ces champs sont les champs internes à SDX ; un certain nombre sont actuellement définis, d'autres pourraient s'ajouter. Le nom de ces champs commence toujours par sdx et cette règles sera conservée dans le futur, il est donc préférable que les champs spécifiques à une application ne débutent pas par ces trois lettres.

La liste des champs internes à SDX est :

sdxall

Ce champ est ajouté systématiquement à tous les documents et il a toujours la même valeur : le chiffre 1. Il est utilsé pour retourner tous les documents d'une base et il est nécessaire (en interne) pour effectuer des recherches par intervalle de dates.

On peut donc trouver tous les documents d'une base en effectuant la recherche simple sdxall:1.

sdxappid

Ce champ contient l'identifiant de l'application à qui appartient la base de documents où le document a été indexé.

sdxdbid

Ce champ contient l'identifiant de la base de documents dans laquelle le document a été indexé.

sdxdoctype

Ce champ contient le type de document dont il s'agit, selon la mécanique interne à SDX. Ce type de document est obtenu par la méthode getDocType() de l'objet qui implémente l'interface fr.gouv.culture.sdx.document.Document et qui est indexé. Pour l'instant, SDX peut indexer des documents XML et des documents HTML et les classes respectives retournent xml et html. Pour les utilisateurs et les groupes (qui sont aussi des documents indexés par SDX) les valeurs utilisées sont respectivement user et group.

Si un développeur veut avoir sa propre classe de documents, il n'a qu'à retourner de cette méthode une valeur appropriée et elle sera utilisée pour ce champ interne à SDX.

sdxmoddate

La date de modification, c'est-à-dire la date à laquelle le document a été indexé pour la dernière fois. Cette date est en format ISO 8601 (par exemple 2003-05-02T08:14:00CEST) et est strictement la même qui a été passée en paramètre au pipeline d'indexation.

Ce champ est utile pour obtenir des documents indexés depuis ou avant une certaine date, par exemple pour connaître les mises à jour depuis un certain moment.

sdxcontentlength

Le nombre d'octets de ce document, lorsqu'il est possible de le déterminer. Par exemple, lorsque le document a été fourni sous la forme d'un objet DOM, sa taille n'est pas connue parce qu'elle n'est pas pertinente. Ce champ n'est donc pas systématiquement renseigné.

A noter que ces champs internes à SDX sont toujours retournés dans les résultats de recherche, un peu comme s'ils avaient un attribut brief="true" dans leur déclaration.



Auteur : Martin Sévigny ( AJLSM ) - 2003-05-14