|
| Titre : | Etudes comparative de différentes approches de pondération en RI | | Type de document : | theses et memoires | | Auteurs : | Amine Lemdani ; Salim Nahi ; Amirouche, Directeur de thèse | | Editeur : | Tizi Ouzou : UMMTO.FGEI | | Année de publication : | 2011 | | Importance : | 46 p. | | Présentation : | ill. | | Format : | 30cm. | | Note générale : | Bibliogr. | | Langues : | Français | | Mots-clés : | Recherche d'information Indexation Terrier Moteur de recherche. | | Résumé : | Dans cette étude nous avons fait une comparaison entre les approches
de pondération: Tf_Idf, Lemur Tf_Idf, BM25, DFR, et la Normalisation
Pivotée. Nous avons constaté que les fonctions normalisées sont plus
efficaces que les fonctions standards. On a aussi fait nos évaluations sur
deux collection de taille différentes (Muchmore pour les documents
courts, et Time pour les documents long), on a déduit que les fonction
de pondération réagissent mieux sur les petites collection (Muchmore)
avec des précisions supérieures aux grandes collections (Time).
Notre objectif était de voir la différence de précision entre ces fonctions
de pondération ainsi que l’influence de la taille des collections sur les
scores retournés par celles-ci.
On avait aussi à cœur d’implémenter au moins deux ou trois fonctions
de pondération dans terrier, mais faute de temps on en a implémenté
qu’une seule (Pivoted Normalisation). | | En ligne : | D:\CD.THESE.INF\LP.INF.11\LEMDANI A. NAHI F..PDF | | Format de la ressource électronique : | PDF | | Permalink : | ./index.php?lvl=notice_display&id=31551 |
Etudes comparative de différentes approches de pondération en RI [theses et memoires] / Amine Lemdani ; Salim Nahi ; Amirouche, Directeur de thèse . - Tizi Ouzou (Tizi Ouzou) : UMMTO.FGEI, 2011 . - 46 p. : ill. ; 30cm. Bibliogr. Langues : Français | Mots-clés : | Recherche d'information Indexation Terrier Moteur de recherche. | | Résumé : | Dans cette étude nous avons fait une comparaison entre les approches
de pondération: Tf_Idf, Lemur Tf_Idf, BM25, DFR, et la Normalisation
Pivotée. Nous avons constaté que les fonctions normalisées sont plus
efficaces que les fonctions standards. On a aussi fait nos évaluations sur
deux collection de taille différentes (Muchmore pour les documents
courts, et Time pour les documents long), on a déduit que les fonction
de pondération réagissent mieux sur les petites collection (Muchmore)
avec des précisions supérieures aux grandes collections (Time).
Notre objectif était de voir la différence de précision entre ces fonctions
de pondération ainsi que l’influence de la taille des collections sur les
scores retournés par celles-ci.
On avait aussi à cœur d’implémenter au moins deux ou trois fonctions
de pondération dans terrier, mais faute de temps on en a implémenté
qu’une seule (Pivoted Normalisation). | | En ligne : | D:\CD.THESE.INF\LP.INF.11\LEMDANI A. NAHI F..PDF | | Format de la ressource électronique : | PDF | | Permalink : | ./index.php?lvl=notice_display&id=31551 |
|