Résumé

Avec l'amélioration des capacités des ordinateurs, un gain de temps et de stockage permet à présent d'envisager la gestion électronique de toutes sortes de documents textuels pour en optimiser l'organisation et la récupération. Après avoir rappelé les bases et les particularités des systèmes de classification, cet ouvrage définit différentes façons d'évaluer leur qualité et l'optimisation de certaines de ces mesures. S'appuyant sur les expériences de l'auteur, il offre ensuite conseils et mises en garde pour une bonne préparation des données (extraction des termes, calcul de leur force, choix des paramètres, etc.) et décrit en détails différentes méthodes de classification supervisée (méthodes Winnow, Rocchio, SVM), leurs propriétés et les résultats obtenus sur un jeu d'essai concret. Indispensable guide, cet ouvrage s'adresse aux étudiants et chercheurs qui souhaitent approfondir le problème de la classification de documents dans des classes prédéfinies, mais aussi aux ingénieurs et développeurs ayant à mettre en place un outil de classification.

Sommaire

Chapitre 1. Introduction. Chapitre 2. Généralités. Chapitre 3. Mesures de la qualité d'un classifieur. Chapitre 4. Préparation des données. Chapitre 5. La méthode Winnow. Chapitre 6. La méthode Rocchio. Chapitre 7. La méthode SVM. Annexe 1. Les jeux d'essai. Annexe 2. Analyse syntaxique de textes. Bibliographie. Index.

Caractéristiques

Editeur : Hermes Science

Auteur(s) : Jean BENEY

Collection : Traitement de l'information

Publication : 3 mars 2008

Edition : 1ère édition

Intérieur : Couleur, Noir & blanc

Support(s) : eBook [PDF], Contenu téléchargeable [PDF], Text (eye-readable) [PDF]

Contenu(s) : PDF

Protection(s) : Marquage social (PDF)

Taille(s) : 1,9 Mo (PDF)

Langue(s) : Français

Code(s) CLIL : 3193, 3290

EAN13 eBook [PDF] : 9782746243194

EAN13 (papier) : 9782746219830

Ouvrages dans la même collection

--:-- / --:--