Telanaute

Ce logiciel est un robot capable d'aspirer des pages web. Cependant, au lieu de rapatrier une partie du web puis de sélectionner les pages intéressantes, l'idée est d'effectuer un parcours en fonction de contraintes et de conserver uniquement les pages pertinentes. Cette solution présente plusieurs avantages en particulier celui de limiter l'utilisation du réseau, l'espace disque et le nombre de traitements effectués. Dans le but de constituer une collection, il est nécessaire de disposer d'un ensemble d'URL. Cet ensemble, une graine, sera le point de départ de la recherche des documents. Le concept de chaîne de traitements s'applique aux différents traitements que nous devons effectuer sur une page puisque ceux-ci doivent être généralement effectués dans un ordre prédéfini. Les greffons sont une technique particulièrement bien adaptée et permettent d'offrir la souplesse et la personnalisation nécessaire à notre plate-forme. L'utilisateur a ainsi la possibilité de définir des traitements spécifiques de manière simple. Par ailleurs ces greffons s'intègrent très facilement dans la chaîne de traitement que l'utilisateur applique à une collection.

Telanaute-0.2.tar.gz