|
| Titre : | Réalisation d’une Plate forme de Recherche D’information supportant plusieurs formats de document. | | Type de document : | theses et memoires | | Auteurs : | Rafik Khelil ; Kherbache GHANIA ; Arezki Hammache, Directeur de thèse | | Editeur : | Tizi Ouzou : UMMTO.FGEI | | Année de publication : | 2012 | | Importance : | 78p. | | Présentation : | ill. | | Format : | 30 cm | | Note générale : | Bibliogr. | | Langues : | Français | | Mots-clés : | LSI Indexation SGML HTML XML | | Résumé : | la recherche d’information est un domaine de l’informatique qui s’intéresse à la représentation, le
stockage, l’organisation et la sélection d’information répondant aux besoin des utilisateurs, ce domaine
manipule différents concepts à savoir le document, le besoin d’information, la requête, la pertinence et les
modèles de recherche pour réaliser la tâche de la RI des Système de Recherche d’Information (SRI) sont
développés. Son objectif est de capitaliser un volume important d’information et d’offrir des moyens
permettant de localiser les informations pertinentes relatives au besoin d’un utilisateur exprimé à travers
une requête.
Le fonctionnement générale d’un SRI est donné au travers le processus de recherche (processus en U), ce
processus est composé de trois étapes différentes qui sont l’indexation du fond documentaire ainsi que la
requête de l’utilisateur, La recherche (entre document_requête) et enfin la reformulation de requête.
Dans le contexte de l’accès à l’information, la notion de document électronique a considérablement
évolué en quelque années, on assiste aujourd’hui à le document qui est devenu un objet plus complexe
pouvant comporter différents types d’information (structurelle, multimédia) cette évolution a été
accélérée par le développent du web.
De ce fait de nouveaux besoins qui visitent à exploiter la richesse présentée dans ces documents sont
apparus et des formats particuliers sont proposés où on s’intéresse aux formats de document textuels
(Word, RTF, PDF…) ainsi plusieurs langages ont vu le jour, après SGML on assiste à la naissance
d’HTML et tout récemment à l’apparition d’XML.
Notre travail consiste à réaliser une plate forme de RI supportant plusieurs formats de document, qui
permet de parser, d’indexer et de rechercher les différents types de document précisément les documents
XML, HTML et aussi le document PDF, pour cela on a utilisé le langage JAVA.
Pour mener à terme ce travail nous avons adopté la structure suivante :
Dans le premier chapitre où on a présenté les différents concepts de la RI, l’architecture d’un SRI qui est
composé par le processus de l’indexation, le processus de la RI, et la reformulation de la requête. Enfin
l’Evaluation de la performance d’un SRI (mesures de Rappel Précision).
Et dans le deuxième chapitre qui est décrit sur la notion des documents où on a présenté la structure de
document formé par différents langages comme SGML, XML, HTML, et une sémantique, comme nous
avons cité aussi les différents types et formats de document et autre média, ainsi le prétraitement de
document XML et les différentes utilisation d’un document .
Dans le troisième chapitre nous avons présenté l’analyse et la conception de notre application en utilisant
les diagrammes d’UML, et des algorithmes qui présentent les différents traitements offerts par notre
système.
Dans le quatrième chapitre nous avons présenté le langage de programmation et l’environnement de
développement, l’implémentation des classes et la présentation de la base de données, par la suite nous
avons présenté quelques interfaces de notre système. | | En ligne : | D:\CD.TH.2012\CD.LP.2012\KHELIL.RAFIK-KHERBACHE.GHANIA.PDF | | Format de la ressource électronique : | PDF | | Permalink : | ./index.php?lvl=notice_display&id=32071 |
Réalisation d’une Plate forme de Recherche D’information supportant plusieurs formats de document. [theses et memoires] / Rafik Khelil ; Kherbache GHANIA ; Arezki Hammache, Directeur de thèse . - Tizi Ouzou (Tizi Ouzou) : UMMTO.FGEI, 2012 . - 78p. : ill. ; 30 cm. Bibliogr. Langues : Français | Mots-clés : | LSI Indexation SGML HTML XML | | Résumé : | la recherche d’information est un domaine de l’informatique qui s’intéresse à la représentation, le
stockage, l’organisation et la sélection d’information répondant aux besoin des utilisateurs, ce domaine
manipule différents concepts à savoir le document, le besoin d’information, la requête, la pertinence et les
modèles de recherche pour réaliser la tâche de la RI des Système de Recherche d’Information (SRI) sont
développés. Son objectif est de capitaliser un volume important d’information et d’offrir des moyens
permettant de localiser les informations pertinentes relatives au besoin d’un utilisateur exprimé à travers
une requête.
Le fonctionnement générale d’un SRI est donné au travers le processus de recherche (processus en U), ce
processus est composé de trois étapes différentes qui sont l’indexation du fond documentaire ainsi que la
requête de l’utilisateur, La recherche (entre document_requête) et enfin la reformulation de requête.
Dans le contexte de l’accès à l’information, la notion de document électronique a considérablement
évolué en quelque années, on assiste aujourd’hui à le document qui est devenu un objet plus complexe
pouvant comporter différents types d’information (structurelle, multimédia) cette évolution a été
accélérée par le développent du web.
De ce fait de nouveaux besoins qui visitent à exploiter la richesse présentée dans ces documents sont
apparus et des formats particuliers sont proposés où on s’intéresse aux formats de document textuels
(Word, RTF, PDF…) ainsi plusieurs langages ont vu le jour, après SGML on assiste à la naissance
d’HTML et tout récemment à l’apparition d’XML.
Notre travail consiste à réaliser une plate forme de RI supportant plusieurs formats de document, qui
permet de parser, d’indexer et de rechercher les différents types de document précisément les documents
XML, HTML et aussi le document PDF, pour cela on a utilisé le langage JAVA.
Pour mener à terme ce travail nous avons adopté la structure suivante :
Dans le premier chapitre où on a présenté les différents concepts de la RI, l’architecture d’un SRI qui est
composé par le processus de l’indexation, le processus de la RI, et la reformulation de la requête. Enfin
l’Evaluation de la performance d’un SRI (mesures de Rappel Précision).
Et dans le deuxième chapitre qui est décrit sur la notion des documents où on a présenté la structure de
document formé par différents langages comme SGML, XML, HTML, et une sémantique, comme nous
avons cité aussi les différents types et formats de document et autre média, ainsi le prétraitement de
document XML et les différentes utilisation d’un document .
Dans le troisième chapitre nous avons présenté l’analyse et la conception de notre application en utilisant
les diagrammes d’UML, et des algorithmes qui présentent les différents traitements offerts par notre
système.
Dans le quatrième chapitre nous avons présenté le langage de programmation et l’environnement de
développement, l’implémentation des classes et la présentation de la base de données, par la suite nous
avons présenté quelques interfaces de notre système. | | En ligne : | D:\CD.TH.2012\CD.LP.2012\KHELIL.RAFIK-KHERBACHE.GHANIA.PDF | | Format de la ressource électronique : | PDF | | Permalink : | ./index.php?lvl=notice_display&id=32071 |
|