Avec l'amélioration des capacités des ordinateurs, un gain de temps et de stockage permet à présent d'envisager la gestion électronique de toutes sortes de documents textuels pour en optimiser l'organisation et la récupération. Après avoir rappelé les bases et les particularités des systèmes de classification, cet ouvrage définit différentes façons d'évaluer leur qualité et l'optimisation de certaines de ces mesures. S'appuyant sur les expériences de l'auteur, il offre ensuite conseils et mises en garde pour une bonne préparation des données (extraction des termes, calcul de leur force, choix des paramètres, etc.) et décrit en détails différentes méthodes de classification supervisée (méthodes Winnow, Rocchio, SVM), leurs propriétés et les résultats obtenus sur un jeu d'essai concret. Indispensable guide, cet ouvrage s'adresse aux étudiants et chercheurs qui souhaitent approfondir le problème de la classification de documents dans des classes prédéfinies, mais aussi aux ingénieurs et développeurs ayant à mettre en place un outil de classification.
Editeur : Hermes Science Publications
Publication : 1 juin 2008
Intérieur : Noir & blanc
Support(s) : Livre numérique eBook [PDF]
Contenu(s) : PDF
Protection(s) : Marquage social (PDF)
Taille(s) : 1,92 Mo (PDF)
Langue(s) : Français
Code(s) CLIL : 3290
EAN13 Livre numérique eBook [PDF] : 9782746243194
EAN13 (papier) : 9782746219830
Álvaro Santos, Miguel Branco Teixeira, Paulo Valença
18,75 €