Système de récupération d’avis de consommateur sur le web pour le résumé d’opinions

L’émergence du Web 2 et des réseaux sociaux augmentent considérablement la quantité de données disponibles sur le Web tel qu’il est aujourd’hui difficile pour les utilisateurs de donner un sens à toutes les informations collectées. L’objectif de ce projet est de travailler sur une nouvelle méthode pour extraire la connaissance globale résultant de la collecte de toutes les données individuelles pour fournir une vue synthétique qui répond aux besoins des utilisateurs.

La plupart des données de réseaux sociaux (par exemple, forum, twits, commentaires, blogs, etc) consistent en des milliers de textes libresécrits par des individus sur plusieurs années avec très peu de méta-données. Ces textes sont très bruités (orthographe non standardisée, mélange dedifférentes langues, abréviations, signes de ponctuation, smiley, etc) et contiennent souvent des émotions ou des avis qui doivent être extraites. En outre, les avis sur les produits spécifiques peuvent varier au cours du temps et ne plus être valides.

Travail Concret

Pour avancer dans la domaine du résumé automatique d’opinion, le candidat devra réaliser un système capable de récupérer des informations sur le web concernant un produit. Dans notre cadre, nous nous limiterons au domaine des hôtels. Le candidat devra proposer une représentation des données pertinentes pour accueillir toute les informations concernant un avis (note, date, langue, hôtel concerné, langue maternel de l’auteur). Puis, appliquer des algorithme de segmentation permettant d’extraite les périodes les plus intéressantes et afficher un résumé synthétique de celles ci

Le travail de développement nécessitera un bon niveau en Java, html et xml. Selon l’avancement des travaux, le candidat sera amener à travailler également au niveau de la représentation interne des connaissances à travers des ontologies.

Contact

Cyril Labbé (Cyril.Labbe@imag.fr) et François Portet (Francois.Portet@imag.fr)

Ce contenu a été publié dans Projet M1 WIC 2012-2013. Vous pouvez le mettre en favoris avec ce permalien.