Corpindex

Une bibliothèque pour la manipulation de gros corpus. Les outils que nous avons développés ont pour base commune le fait de traiter des corpus de taille importante sur lesquels sont projetés des ressources dictionnairiques. Il est possible de traiter des textes bruts, uniquement composés de caractères, ou déjà étiquetés et propose un langage de requête de haut niveau. Cette bibliothèque a été ensuite utilisée pour développer un étiqueteur pour le français, un concordancier, un concordancier parallèle.

Corpindex-0.9.2.zip