Modélisation de mini-mondes liée à l’actualité web

Le projet ANR QCompere est un des trois consortium qui participe au défi REPERE. Ce défi s’intéresse à la reconnaissance de personnes dans des documents audio-visuels à l’aide de toutes les ressources d’information possible. Nous utilisons l’image et le son pour extraire des scores de prédiction de présence de personnalités. Ces scores pourraient être pondérés par l’actualité des journaux web correspondant à la période de diffusion de l’émission. Nous aimerions donc modéliser les interactions des personnalités/lieux/dates apparues dans l’actualité web (journaux web : type 20minutes.fr, …).

Le sujet propose de construire une interface web client/serveur qui permettra à un utilisateur d’afficher les mini-mondes de l’actualité web en fonction des sources web et de la période sélectionnée.

Principe de fonctionnement :

  • Interface client (Html, Css, Jquery):
    • Sélection des journaux web et de la période de recouvrement de l’actualité à utiliser
    • Affichage des minis-mondes générés automatiquement (sous forme de graphe avec GraphViz par exemple)
  • Connexion client/serveur (Php, Javascript, Python) (déjà utilisé sur un autre projet)
  • Coté serveur :
    • Extraction d’informations des journaux web à l’aide de requêtes automatiques (en python) (prototype réalisé):
      • Extraction d’une liste d’articles à partir d’une requête sur le site Google.
      • Extraction des articles d’une vingtaine de sources différentes.
    • Recherche des entités nommées (noms de personnes, lieux, dates) (outil du LIA).
    • Conception de modèles (au format XML) de mini-mondes liés à l’actualité .

L’analyse bibliographique nous permettra d’avoir une connaissance des réalisations approchantes ainsi qu’une meilleure vision des méthodes de construction de modèles de mini-mondes et principalement sur les méthodes de calcul des poids de connectivités entre entités nommées à partir d’un texte.

Nous attendons pour la seconde étape, des étudiants qu’ils proposent des évolutions, adaptations, changements et qu’ils complètent le principe de fonctionnement que nous proposons.

Enfin la partie réalisation, en dehors de l’interface web, nous permettra d’extraire les modèles de mini-mondes d’une période et de les utiliser pour améliorer nos systèmes de reconnaissance des personnes dans les vidéos.

Effectif max : 2 étudiants
Lieux de travail : Laboratoire d’informatique de Grenoble, équipe MRIM (campus Saint Martin d’Hères)

Contact : Johann<DOT>Poignant-@-imag.fr

Ce contenu a été publié dans Master Web, Informatique et Connaissance. Vous pouvez le mettre en favoris avec ce permalien.