... parce que l'erreur est humaine
Classificateur thématique
Cette librairie permet d'extraire la thématique d'un texte, c'est-à-dire les concepts-clés autour desquels s'articule le texte, ainsi que le ou les domaines techniques auxquels appartient le vocabulaire du texte.
Intégrations possibles du composant
- Logiciels d'aide à la rédaction, d'analyse de texte
- Logiciels de classification, de recherche documentaire
- Logiciels d'extraction de connaissances
- Logiciels de gestion de messagerie
- Applications verticales nécessitant de conserver pour chaque document sa thématique, ses concepts-clés
Points forts
- Résolution des ambiguïtés par une analyse syntaxique et sémantique complète, par une désambiguïsation sémantique des mots ou expressions ayant plusieurs sens
- Positionnement de chacun des termes (mots simples ou expressions) dans une ontologie de 3387 concepts
- Positionnements du texte par rapport à plus de 150 domaines et niveaux de langage
- Extrême rapidité d'exécution : analyse de 10 000 mots par seconde sur Pentium 1 GHz
- Fourniture d'une API et d'un programme de tests permettant de vérifier
rapidement la conformité à cette API
Caractéristiques techniques
- Extraction de concepts-clés
- Extraction de concepts délaissés (concepts non présents ou peu présents dans le texte)
- Extraction de domaines spécifiques
- Occupation mémoire d'environ 3,5 Mo pour le code et 6 Mo pour les
dictionnaires
Contact
- Téléphone : +33 (0)5 61 63 03 74
- Mail : Information
- Demande de documentation



