|
| Titre : | Implémentation et évaluation d’un modèle de langue pour la Recherche d’Information dans les documents XML | | Type de document : | theses et memoires | | Auteurs : | Samia Landri ; Alilouche Rahma ; Aitb chekdhidh Dahmane ; Samia Berchiche (ép. Fellag), Directeur de thèse | | Editeur : | Tizi Ouzou : UMMTO.FGEI | | Année de publication : | 2016 | | Importance : | 69 p.. | | Présentation : | ill. | | Format : | 30 cm. | | Note générale : | Bibliogr. | | Langues : | Français | | Mots-clés : | XML ARBRE Elément Modéle de langue . | | Résumé : | Notre travail consistait aux tests et à l’évaluation du modèle de langue présenté dans
[Belkacem, 2015] , ce modèle de langue adapté aux documents XML estime le score
de pertinence des éléments d’un document en prenant en compte la taille d’éléments
en nombre termes, et le nombre de noeuds feuille ainsi que la taille moyenne d’un
élément dans ce document.
Afin de répondre à une requête utilisateur en lui fournissant un élément ou un
ensemble d’élément comme résultat, nous avons estimé la probabilité de similarité
(élément- requête) qui revient à calculer la probabilité d’avoir un élément comme
résultat qui peut être calculer soit par la formule de base [3.1] (qui a été déjà testé et
évalué par l’auteur avec la probabilité de vraisemblance [5.1], soit par la formule
variante [3.2] (que nous avons testé, avec la formule de vraisemblance [5.2]), et cela,
en commençant par le calcul de la probabilité d’importance d’un terme de la requête
dans un élément, ensuite appliqué le produit de ces probabilités pour tous les termes de
la requête ( c’est la distribution aux termes de la requête), et enfin le produit entre la
valeur de similarité et le produit associée à l’élément, ce qui nous donne le score de
pertinence d’un élément pour une requête utilisateur.
Après avoir implémenté et testé l’approche proposée dans [Belkacem,2015],nous
avons effectué une comparaison entre les résultats des scores obtenus par les formulesde tests dans [Belkacem,2015] et les résultats de tests obtenus par les formules
considérés dans notre travail en utilisant la mesure du gain que nous avons calculée sur
les 5 rangs (5,10,25,50,max).
Nous avons remarqué que les résultats de nos tests ont abouti à un gain de +6% sur la
totalité des résultats et jusqu'à +17% sur les 50 premier résultats.
Enfin nous concluons qu’avec le modèle de langue implémenté nous avons obtenus
des résultats satisfaisants, grâce à la prise en compte des caractéristiques des
documents XML comme paramètres dans les formules de calcul des scores. | | En ligne : | D:\CD.TH .2016\MASTER INF\LANDRI S; ALILOUCHE R; AIT CHEKDHIDH D..PDF | | Format de la ressource électronique : | PDF | | Permalink : | ./index.php?lvl=notice_display&id=30935 |
Implémentation et évaluation d’un modèle de langue pour la Recherche d’Information dans les documents XML [theses et memoires] / Samia Landri ; Alilouche Rahma ; Aitb chekdhidh Dahmane ; Samia Berchiche (ép. Fellag), Directeur de thèse . - Tizi Ouzou (Tizi Ouzou) : UMMTO.FGEI, 2016 . - 69 p.. : ill. ; 30 cm. Bibliogr. Langues : Français | Mots-clés : | XML ARBRE Elément Modéle de langue . | | Résumé : | Notre travail consistait aux tests et à l’évaluation du modèle de langue présenté dans
[Belkacem, 2015] , ce modèle de langue adapté aux documents XML estime le score
de pertinence des éléments d’un document en prenant en compte la taille d’éléments
en nombre termes, et le nombre de noeuds feuille ainsi que la taille moyenne d’un
élément dans ce document.
Afin de répondre à une requête utilisateur en lui fournissant un élément ou un
ensemble d’élément comme résultat, nous avons estimé la probabilité de similarité
(élément- requête) qui revient à calculer la probabilité d’avoir un élément comme
résultat qui peut être calculer soit par la formule de base [3.1] (qui a été déjà testé et
évalué par l’auteur avec la probabilité de vraisemblance [5.1], soit par la formule
variante [3.2] (que nous avons testé, avec la formule de vraisemblance [5.2]), et cela,
en commençant par le calcul de la probabilité d’importance d’un terme de la requête
dans un élément, ensuite appliqué le produit de ces probabilités pour tous les termes de
la requête ( c’est la distribution aux termes de la requête), et enfin le produit entre la
valeur de similarité et le produit associée à l’élément, ce qui nous donne le score de
pertinence d’un élément pour une requête utilisateur.
Après avoir implémenté et testé l’approche proposée dans [Belkacem,2015],nous
avons effectué une comparaison entre les résultats des scores obtenus par les formulesde tests dans [Belkacem,2015] et les résultats de tests obtenus par les formules
considérés dans notre travail en utilisant la mesure du gain que nous avons calculée sur
les 5 rangs (5,10,25,50,max).
Nous avons remarqué que les résultats de nos tests ont abouti à un gain de +6% sur la
totalité des résultats et jusqu'à +17% sur les 50 premier résultats.
Enfin nous concluons qu’avec le modèle de langue implémenté nous avons obtenus
des résultats satisfaisants, grâce à la prise en compte des caractéristiques des
documents XML comme paramètres dans les formules de calcul des scores. | | En ligne : | D:\CD.TH .2016\MASTER INF\LANDRI S; ALILOUCHE R; AIT CHEKDHIDH D..PDF | | Format de la ressource électronique : | PDF | | Permalink : | ./index.php?lvl=notice_display&id=30935 |
|