|
| Titre : | Classification automatique de documents : de la classification classique à la classification utilisant une ressource externe | | Type de document : | theses et memoires | | Auteurs : | Dihia Bensalem ; Bounouar Celia ; Boudia Zohra ; SI Mohammed Malik, Directeur de thèse | | Editeur : | Tizi Ouzou : UMMTO.FGEI | | Année de publication : | 2014 | | Importance : | p. | | Présentation : | ill. | | Format : | 29 cm. | | Note générale : | Bibliogr. | | Langues : | Français | | Résumé : | Aujourd’hui, nous vivons dans un monde où l’information est disponible en grande
quantité tout en étant de nature très diverse. Internet s’enrichit continuellement de
nouveaux contenus. Par exemple, les entreprises emmagasinent de plus en plus de
données, le courriel devient un moyen de communication extrêmement populaire,
des documents autrefois manuscrits sont aujourd’hui disponibles sous format
numérique. Mais toute cette information complexe serait sans intérêt si notre
capacité à y accéder efficacement n’augmentait pas elle aussi. Pour cela, nous
avons besoin d’outils permettant de chercher, classer, conserver, mettre à jour et
analyser les données accessibles. Il est ainsi nécessaire de proposer des systèmes
afin d’accéder rapidement à l’information désirée, réduisant ainsi l’implication
humaine.
Un des domaines qui tente d’apporter des améliorations et de réduire la tâche de
l’humain est la classification automatique de documents. Celle-ci consiste à associer
une catégorie à un document. Généralement, une classification de documents
complexes est effectuée manuellement et sa réalisation est donc coûteuse en termes
de temps. En effet, chaque texte (ou une partie) doit être manuellement lu pour
attribuer une catégorie adaptée (classe). C’est la raison pour laquelle le domaine de
la classification automatique de documents est en perpétuel développement.
Pour cela on répartit notre travail en quatre chapitres, comme suit : On débutera par
une introduction générale puis
Premier chapitre nous définissons les ontologies et les différents composants la
constituant, puis nous exposons les divers formalismes de représentation des
ontologies, nous citerons ensuite leurs différentes classes.
Deuxième chapitre est entièrement dédié pour présenter les différents outils
d’annotation telle que GATE, TreeTagger ,Talismane et Terrier , ainsi que la manière
de les utiliser.
Troisième chapitre nous présenterons tout d’abord ce que c’est la classification, ses
méthodes, techniques, ses grandes approches, domaines d’applications…Etc. et on
détaillera une de ses grandes approches en étudiant et analysant un de ses
algorithmes.
Quatrième chapitre quand a lui présente les différents outils qui vont servir a
l’implémentation de notre projet, ainsi que l’implémentation de notre application.et les
discussions sur la réalisation.
Et nous terminons par une conclusion générale et les quelques perspectives,
remarques qu’on a pu constater durant la réalisation de ce modeste travail. | | En ligne : | D:\CD.INF. 2014\LICENCE 2014\BENSALEM D,BOUNOUAR C,BOUDIA Z.PDF | | Format de la ressource électronique : | PDF | | Permalink : | ./index.php?lvl=notice_display&id=31922 |
Classification automatique de documents : de la classification classique à la classification utilisant une ressource externe [theses et memoires] / Dihia Bensalem ; Bounouar Celia ; Boudia Zohra ; SI Mohammed Malik, Directeur de thèse . - Tizi Ouzou (Tizi Ouzou) : UMMTO.FGEI, 2014 . - p. : ill. ; 29 cm. Bibliogr. Langues : Français | Résumé : | Aujourd’hui, nous vivons dans un monde où l’information est disponible en grande
quantité tout en étant de nature très diverse. Internet s’enrichit continuellement de
nouveaux contenus. Par exemple, les entreprises emmagasinent de plus en plus de
données, le courriel devient un moyen de communication extrêmement populaire,
des documents autrefois manuscrits sont aujourd’hui disponibles sous format
numérique. Mais toute cette information complexe serait sans intérêt si notre
capacité à y accéder efficacement n’augmentait pas elle aussi. Pour cela, nous
avons besoin d’outils permettant de chercher, classer, conserver, mettre à jour et
analyser les données accessibles. Il est ainsi nécessaire de proposer des systèmes
afin d’accéder rapidement à l’information désirée, réduisant ainsi l’implication
humaine.
Un des domaines qui tente d’apporter des améliorations et de réduire la tâche de
l’humain est la classification automatique de documents. Celle-ci consiste à associer
une catégorie à un document. Généralement, une classification de documents
complexes est effectuée manuellement et sa réalisation est donc coûteuse en termes
de temps. En effet, chaque texte (ou une partie) doit être manuellement lu pour
attribuer une catégorie adaptée (classe). C’est la raison pour laquelle le domaine de
la classification automatique de documents est en perpétuel développement.
Pour cela on répartit notre travail en quatre chapitres, comme suit : On débutera par
une introduction générale puis
Premier chapitre nous définissons les ontologies et les différents composants la
constituant, puis nous exposons les divers formalismes de représentation des
ontologies, nous citerons ensuite leurs différentes classes.
Deuxième chapitre est entièrement dédié pour présenter les différents outils
d’annotation telle que GATE, TreeTagger ,Talismane et Terrier , ainsi que la manière
de les utiliser.
Troisième chapitre nous présenterons tout d’abord ce que c’est la classification, ses
méthodes, techniques, ses grandes approches, domaines d’applications…Etc. et on
détaillera une de ses grandes approches en étudiant et analysant un de ses
algorithmes.
Quatrième chapitre quand a lui présente les différents outils qui vont servir a
l’implémentation de notre projet, ainsi que l’implémentation de notre application.et les
discussions sur la réalisation.
Et nous terminons par une conclusion générale et les quelques perspectives,
remarques qu’on a pu constater durant la réalisation de ce modeste travail. | | En ligne : | D:\CD.INF. 2014\LICENCE 2014\BENSALEM D,BOUNOUAR C,BOUDIA Z.PDF | | Format de la ressource électronique : | PDF | | Permalink : | ./index.php?lvl=notice_display&id=31922 |
|