|
| Titre : | les requêtes Skyline pour l’analyse d’opinions | | Type de document : | theses et memoires | | Auteurs : | Yasmine Berrichi ; Bouaziz Melissa ; Saidani, Directeur de thèse | | Editeur : | Tizi Ouzou : U.M.M.T.O. - F.G.E.I. | | Année de publication : | 2022 | | Importance : | 61 p. | | Présentation : | ill. | | Format : | 30 cm. | | Note générale : | Bibliogr . | | Langues : | Français | | Mots-clés : | Requêtes Skyline , sélection de caractéristiques, Analyse d’opinions , Pondérations des termes, word embedding, BNL, dominance , termes skylines . | | Résumé : | Notre travail s’inscrit dans le domaine de la science de données , Au cours de ce mémoire, nous avons conclu l’étude et la présentation du domaine de l’opinion Mining et du sentiment analysis et ses problématiques, c’est un domaine émergeant et un nouvel axe de recherche permettant de faciliter et améliorer la vie quotidienne, nous avons présenté les différentes approches, méthodes et leurs résultats .
En général, on distingue deux types d’approches en analyse d’opinion. La première se base sur des lexiques d’opinion. La seconde se base sur l’apprentissage automatique. Ces dernières s’opèrent à des niveaux de granularité différents.
Notre travail se situe dans la catégorie des approches basées sur l’apprentissage automatique. La problématique traitée concerne principalement la sélection de caractéristiques à travers les techniques de pondération des termes (caractéristiques). Le travail que nous avons réalisé ne s’apparente pas à une méthode de sélection totalement aboutie, étant donné que la démarche suivie n’a pas pour vocation, la réduction de la dimensionnalité des données d’apprentissage. Notre travail essaye plutôt de favoriser les poids des caractéristiques (jugées pertinentes), afin de les mettre en valeur lors de la génération de la matrice (termes x documents) nécessaire pour les phases d’apprentissage.
Pour extraire les caractéristiques jugées pertinentes, nous exploitons le concept de dominance au sens de Pareto, fourni par le biais des requêtes Skyline, afin de pondérer les termes de nos données d’apprentissage.
L’objectif principal de notre travail est de s’initier aux techniques de l’apprentissage automatique, à travers une approche supervisée de classification de polarité d’opinions. D’abord, nous décrivons le problème de la fouille d’opinions dans son ensemble, nous avons introduit quelques notions appartenant au domaine de la fouille d’opinions et ses composants puis nous avons présenté les principales notions et différents concepts propres à la fouille d’opinion. Nous avons dressé un état de l’art de différentes approches d’apprentissage automatique (supervisée et non supervisée). Ensuite nous avons détaillé les principales étapes de catégorisation de texte ainsi que les approches, les méthodes de la sélection de caractéristiques et les métriques d’évaluation commune à l’analyse d’opinions. Par la suite, nous avons enchaîné avec une synthèse des quelques travaux autours de l’analyse d’opinions. Enfin, nous avons décrit la chaîne de traitement qui nous a permis de construire notre modèle de classification en détaillant chaque phase du processus. En commençant par la phase de prétraitement puis la sélection de caractéristique en utilisant la m´méthode Skyline enfin nous avons présenté les résultats de la classification en utilisant les algorithmes d’apprentissage automatique | | En ligne : | D:\CD.THESE.2022\MASTER.INF\BERRICHI Y.; BOUAZIZ M..PDF | | Format de la ressource électronique : | PDF | | Permalink : | ./index.php?lvl=notice_display&id=36781 |
les requêtes Skyline pour l’analyse d’opinions [theses et memoires] / Yasmine Berrichi ; Bouaziz Melissa ; Saidani, Directeur de thèse . - Tizi Ouzou (Tizi Ouzou) : U.M.M.T.O. - F.G.E.I., 2022 . - 61 p. : ill. ; 30 cm. Bibliogr . Langues : Français | Mots-clés : | Requêtes Skyline , sélection de caractéristiques, Analyse d’opinions , Pondérations des termes, word embedding, BNL, dominance , termes skylines . | | Résumé : | Notre travail s’inscrit dans le domaine de la science de données , Au cours de ce mémoire, nous avons conclu l’étude et la présentation du domaine de l’opinion Mining et du sentiment analysis et ses problématiques, c’est un domaine émergeant et un nouvel axe de recherche permettant de faciliter et améliorer la vie quotidienne, nous avons présenté les différentes approches, méthodes et leurs résultats .
En général, on distingue deux types d’approches en analyse d’opinion. La première se base sur des lexiques d’opinion. La seconde se base sur l’apprentissage automatique. Ces dernières s’opèrent à des niveaux de granularité différents.
Notre travail se situe dans la catégorie des approches basées sur l’apprentissage automatique. La problématique traitée concerne principalement la sélection de caractéristiques à travers les techniques de pondération des termes (caractéristiques). Le travail que nous avons réalisé ne s’apparente pas à une méthode de sélection totalement aboutie, étant donné que la démarche suivie n’a pas pour vocation, la réduction de la dimensionnalité des données d’apprentissage. Notre travail essaye plutôt de favoriser les poids des caractéristiques (jugées pertinentes), afin de les mettre en valeur lors de la génération de la matrice (termes x documents) nécessaire pour les phases d’apprentissage.
Pour extraire les caractéristiques jugées pertinentes, nous exploitons le concept de dominance au sens de Pareto, fourni par le biais des requêtes Skyline, afin de pondérer les termes de nos données d’apprentissage.
L’objectif principal de notre travail est de s’initier aux techniques de l’apprentissage automatique, à travers une approche supervisée de classification de polarité d’opinions. D’abord, nous décrivons le problème de la fouille d’opinions dans son ensemble, nous avons introduit quelques notions appartenant au domaine de la fouille d’opinions et ses composants puis nous avons présenté les principales notions et différents concepts propres à la fouille d’opinion. Nous avons dressé un état de l’art de différentes approches d’apprentissage automatique (supervisée et non supervisée). Ensuite nous avons détaillé les principales étapes de catégorisation de texte ainsi que les approches, les méthodes de la sélection de caractéristiques et les métriques d’évaluation commune à l’analyse d’opinions. Par la suite, nous avons enchaîné avec une synthèse des quelques travaux autours de l’analyse d’opinions. Enfin, nous avons décrit la chaîne de traitement qui nous a permis de construire notre modèle de classification en détaillant chaque phase du processus. En commençant par la phase de prétraitement puis la sélection de caractéristique en utilisant la m´méthode Skyline enfin nous avons présenté les résultats de la classification en utilisant les algorithmes d’apprentissage automatique | | En ligne : | D:\CD.THESE.2022\MASTER.INF\BERRICHI Y.; BOUAZIZ M..PDF | | Format de la ressource électronique : | PDF | | Permalink : | ./index.php?lvl=notice_display&id=36781 |
|