Nous avions déjà parlé ici de la version 7 de Velocity et de la recherche conceptuelle il y a un an. Vivisimo, à nouveau consacré Leader de son marché en 2009 par le Gartner Group, propose aujourd’hui la version 7.5 de sa plateforme, Velocity, qui dispose de nombreuses améliorations. Ci-après quelques points remarquables :
Velocity 7.5 se connecte avec les outils de supervision et de management des équipements en utilisant le protocole SNMP, ce qui permet de suivre facilement l’évolution de son statut à partir des outils d’administration traditionnels.
Velocity 7.5 propose une amélioration du support des recherches floues (wildcard) et des expressions régulières.
Velocity 7.5 permet d’organiser l’accès à 1 milliard d’emails à partir d’un unique serveur en utilisant un système de mise en mémoire de l’index ‘à la demande’. Cette usage ressemble fortement à ce que Fast Search&Transfer avait imaginé il y a quelques années pour répondre au problème de l’indexation d’archives.
Traçabilité et pertinences : les applications dédiées aux contrôles de conformité des transactions et des données conservées demandent des niveaux de validations stricts et une exhaustivité certifiée pour générer des indicateurs valides sur les traitements réalisés par le moteur de recherche. Un éditeur aussi exigeant qu’ASG (www.asg.com) à d’ailleurs choisit d’intégrer Velocity dans sa solution ASG-ViewDirect E-mail Manager.
Amélioration des performances générales d’indexation de la plateforme avec l’introduction de la notion de ‘triple compression des données’. La taille de l’index baisse effectivement à un taux de 5 à 10 % de la taille d’origine pour certaines données. Cette notion est à mettre en perspective, effectivement la distribution des documents crawlés est majoritairement constituée de pages web vs autres documents de type office & pdf qui ne comptent que pour 3,3% de l’échantillon-étalon, la taille moyenne du document crawlé est en deçà de 40Kb et le nombre moyen de documents indexés par seconde est de +/-50. Ces chiffres, au demeurant excellents par rapport aux chiffres d’autres éditeurs dans le domaine, démontrent la très grande qualité des traitements réalisés au sein de la plateforme.
Les API SOAP et REST se présentent dorénavant comme un module séparé et permettent aux applications tierces de récupérer plus facilement l’ensemble des résultats des traitements réalisés au sein de Velocity. Il est à noter que de part le choix technologique de stockage des données en XML, l’utilisation d’XSL, d’XPath et d’XLS-FO permettent de modifier facilement la présentation des données et d’exécuter (runtime) les traitements sans avoir à recompiler le code et donc -aussi- sans avoir besoin d’utiliser les API … simplifiant drastiquement la personnalisation et l’intégration des résultats dans tous types de portails.
Quelques notions de vocabulaire à propos de Velocity :
Collection broker :
L’API intègre une fonction d’exportation des données pour créer une nouvelle collection facilement à partir de données existantes dans d’autres collections, ce à partir des résultats d’une requête.
Le collection broker permet d’optimiser la gestion d’un nombre important de collections et de connections sur une seule instance du logiciel.
OntoLection :
Dans le language de Velocity, une OntoLection (contraction d’Ontology et de Collection) fait référence à une collection qui va être utilisée pour identifier et suggérer des termes relatifs ou alternatifs à celui recherché. Le terme Ontologie est généralement utilisé en référence à la modélisation d’un domaine de connaissance grâce à l’identification d’un ensemble de termes et à la définition de leurs relations. La notion de collection est utilisée dans Velocity pour définir un ensemble de sources et la collection est elle-même considérée comme une source par le moteur, simplifiant son usage lors de l’exécution de requêtes.
Social Computing distribue des technologies d’accès à l’information & d’intelligence collective qui s’intègrent au sein de vos applications et systèmes d’information. Pour en savoir plus visionnez nos présentations sur slideshare :
Présentation de l’offre technologique
Introduction au social computing
Plus d’informations et contacts : www.social-computing.com
Articles connexes
To view this page ensure that Adobe Flash Player version 10.0.0 or greater is installed.






