Warning: parse_ini_file() [function.parse-ini-file]: Cannot open 'fr.ini' for reading in /home/digimind/www/wp-content/themes/digimind_by_hd/header.php on line 6
Digimind Main Text Extractor

Digimind Main Text Extractor

Objectif

Sur Internet, le contenu d’une information est rarement isolé. Il est souvent intégré au sein d’une page disposant de menus de navigation, en-têtes, pieds de page, etc. Le problème est que le texte intéressant est souvent mélangé dans le code html, et donc difficilement identifiable. Digimind Main Text Extractor est capable d’extraire automatiquement le contenu d’une information, sans aucun apprentissage.

Fonctionnement

Digimind Main Text Extractor analyse le code html de la page qui lui est transmise, corrige les éventuels défauts identifiés, puis applique un certain nombre d’algorithmes faisant appel à la théorie des topologies et aux espaces vectoriels normés.