+Fonctionnalités <-
    Architecture
    Compatibilité
    Calendrier


SDX

Fonctionnalités

La nouvelle version de SDX possède une nouvelle architecture générale, une nouvelle architecture interne propre à SDX 2, et de nouvelles fonctionnalités. Nous allons présenter ici d'abord la nouvelle architecture générale et les fonctionnalités pour lesquelles des développements sont déjà prévus, et ensuite certaines fonctionnalités qui seraient intéressantes mais dont le développement n'est pas encore planifié.

Architecture et développéments prévus

Pour en savoir plus sur la nouvelle architecture SDX 2, vous pouvez consulter la section de la documentation consécrée à ce sujet.

SDX dans une architecture Cocoon 2

SDX 1 a été conçu au moment où le projet Cocoon en était encore à la version 1. Les travaux de la version 2 de Cocoon étaient déjà entrepris, mais pas suffisamment matures pour permettre le développement d'applications stables. Aujourd'hui, Cocoon 2 est une réalité, et une réalité intéressante, et SDX 2 s'appuie sur cette toute nouvelle architecture.

L'une des premières opérations consiste donc à créer une version de SDX dans cette nouvelle architecture Cocoon 2. Cette version doit reprendre la plupart des fonctionnalités de SDX 1, et peut-être inclure déjà un certain nombre de fonctionnalités de la version 2. Cette migration constitue également l'occasion de faire évoluer la plupart des librairies sous-jacentes à SDX (parseur XML, processeur XSLT, etc.).

Il en résulte un SDX 2 déjà utilisable, avec un jeu de fonctionnalités semblable à l'actuel, mais une organisation du code totalement remaniée. L'API XSP est relativement semblable (avec plus de souplesse toutefois), de même que l'API URL, mais toutes les applications SDX qui font appel à du code Java devront être revues avec attention, parce que l'API Java de SDX 2 est déjà fondamentalement différente de l'API Java de SDX 1.

Multilinguisme

SDX étant conçu dans une architecture Java/XML, tous les outils nécessaires pour rendre cette plate-forme multilingue sont présents. Toutefois, SDX étant un outil de recherche orienté texte, certaines opérations effectuées, en particulier l'indexation, la recherche et le tri, sont des opérations qui dépendent de la langue utilisée dans les documents.

Par ailleurs, la gestion des interfaces multilingues est actuellement possible dans SDX, mais en même temps ce dernier offre peu d'outils dynamiques et souples pour gérer la langue des utilisateurs ou des interfaces. C'est pourquoi il est prévu d'étendre SDX de manière à ce que les aspects mutilingues soient correctement gérés.

L'impact sur les applications existantes (utilisant SDX 1) sera mineur, sauf si ces applications utilisent l'une ou l'autre des fonctionnalités de langue actuellement fournies par SDX mais implantées de façon incomplète. Cette gestion du multilinguisme aura principalement pour effet d'augmenter le nombre de paramètres potentiels lors de la définition des champs et lors de l'indexation de ceux-ci, mais les paramètres actuels seront toujours valides.

Thésaurus

L'utilisation d'un thésaurus en recherche documentaire est une fonctionnalité fréquemment souhaitée, mais non gérée par SDX actuellement. L'utilisation la plus fréquente et la plus naturelle d'un thésaurus est lors de la recherche : un thésaurus peut être utilisé pour modifier la requête de recherche, par exemple pour ajouter des synonymes ou des termes génériques, utiliser des termes équivalents dans d'autres langues, etc. Cette utilisation peut être transparente pour l'utilisateur ou effectuée suite à son initiative.

SDX permettra d'effectuer ces opérations à partir d'une structure de thésaurus qui est à déterminer. Il n'est pas prévu d'outils de gestion des thésaurus, cette fonctionnalité n'étant pas nécessaire pour un outil de recherche.

Les applications SDX 1 ne seront pas affectées par ces changements, qui constituent un pur ajout de fonctionnalités. Par défaut, aucun thésaurus ne sera utilisé en recherche.

Multibases

SDX 2 permettra d'interroger simultanément plusieurs bases de documents, que ces bases soient sur la même installation ou qu'elles soient ailleurs sur le réseau. Les fonctionnalités précises sont encore à définir.

Par défaut, la recherche continuera à s'effectuer dans la base de documents associée à l'application, ce qui fait que cette nouvelle fonctionnalité ne devrait pas affecter les applications actuelles.

Autres fonctionnalités complémentaires

  • Partage des documents attachés : il arrive fréquemment que des documents attachés (par exemple des images) soient partagés entre plusieurs documents XML. Pour éviter de dupliquer inutilement ces documents attachés, il serait intéressant de pouvoir les partager. Actuellement, un document attaché est associé à un seul document XML.

    Une façon simple de gérer ces documents attachés partagés est de préciser si leur identifiant est unique dans le document (dans ce cas ils ne sont pas partagés) ou s'il est unique dans la base de documents (dans ce cas il pourrait être partagé).

  • Sous-documents : SDX peut difficilement gérer les documents volumineux ou encore les petites collections de documents importants. Il serait intéressant d'implanter un système de séparation des documents en parties plus facilement manipulables en recherche et en affichage.

  • Mise en évidence des mots recherchés : lorsqu'on affiche un document après une recherche ou des résultats de recherche, SDX pourrait offrir un mécanisme permettant de mettre en évidence les mots qui ont été recherchés. Deux problèmes sont reliés à cette fonctionnalité a priori simple : une bonne gestion du multilinguisme et le fait que les documents XML indexés peuvent être fortement transformés et il peut être difficile de retrouver les termes recherchés.

Ces deux dernières fonctionnalités seront ajoutés peu après la sortie officielle de SDX 2.



Auteur : Martin Sévigny (AJLSM) - 2002/09/29