Dans le cadre du volet Étude du projet VisaTM, nous avons réalisé un recensement d’outils de fouille de textes. Le premier objectif de ce travail est de faire le point sur les moyens logiciels issus de l’Intelligence artificielle, du Traitement automatique du langage naturel et des Statistiques disponibles pour la découverte de connaissances à partir du traitement informatique de corpus textuels. Le second objectif est de disposer d’un référentiel d’outils pour l’enrichissement de la plateforme de fouille de textes dont le projet VisaTM évalue la faisabilité.

Dans le document joint (au format PDF ou CSV), les outils sont présentés de la manière suivante :

  • Nom de l’outil ;
  • Description : description générale de l’outil extraite, sauf exception, de son site web ;
  • Licence de l’outil ;
  • Tâche(s) : tâches principales réalisées par l’outil ;
  • Source : lien vers le site web de l’outil ;
  • OMTD : présence ou non de l’outil dans la plateforme OpenMinted ;
  • Pays : pays d’origine du développement de l’outil.

Actuellement, la liste contient 280 outils. Elle est mise à jour régulièrement. Si vous le souhaitez, n’hésitez donc pas à nous suggérer des outils supplémentaires, à nous faire part de vos commentaires sur cette liste, à proposer des corrections ou des précisions. Contact : frank.arnould[a]inist.fr

Ce travail de recensement a été complété par une réflexion sur les critères d’évaluation des outils et par l’élaboration d’une procédure de sélection de ceux-ci pour la plateforme. Ces deux aspects feront prochainement l’objet de billets sur le blog de VisaTM.

Accès à la liste des outils de fouille de textes au format PDF

Accès à la liste des outils de fouille de textes au format CSV