Partager cette page :

Des enjeux de la gestion de l'information sur le Web

le 8 avril 2014

15h30

ENS Rennes, Salle du conseil
Plan d'accès

Intervention de Pierre Bourhis (CNRS - LIFL - INRIA Lille)
Séminaire du département Informatique et télécommunications.

Séminaire Informatique et télécommunications

Séminaire Informatique et télécommunications

La recherche d'information a été depuis la création de l'informatique un domaine primordial. Elle a été pendant très longtemps séparée en trois domaines très différents :
  • La réponse précise à une question posée sur un ensemble de faits (Base de données)
  • La dérivation de nouvelles connaissances à partir d'un ensemble initial de connaissances et de règles de dérivations (Intelligence Artificielle)
  • L'apprentissage de relations entre informations non structurées (Data mining, Extraction d'information)
Si dans les années 70-90, le domaine ayant le plus succès a été les bases de données avec des entreprises multimillardaires (Oracle, IBM...), avec l'explosion des données non structurées apparues sur le Web, les problèmes de Data Mining ont commencé à prendre une place très importante aujourd'hui. Dans cet exposé, nous présenterons deux points importants: tout d'abord, les frontières entre les différents domaines ne sont plus hermétiques; ensuite le domaine des bases de données est toujours aussi vivant et les challenges apportés par le Web sont nouveaux et très importants. Après avoir présenté brièvement les notions initiales des bases de données: homomorphisme, complexité combinée, complexité dans les données, notion d'optimisation de requêtes; nous présenterons les différents enjeux pour gérer de l'information sur le Web: hétérogénéité des données, distribution des données, explosion de la quantité des données. Pour illustrer ces problèmes, nous présenterons RDF qui est le standard W3C pour la représentation et la diffusion de données sur Web. Ce langage est l'exemple classique du mariage des problèmes classiques de bases de données et de dérivation de nouvelles connaissances. Nous présenterons quelques résultats dans ce domaine et nous conclurons par comment intégrer dans ce contexte l'incertitude dans les données résultant de l'apprentissage de relations entre elles.
Thématique(s)
Formation, Recherche - Valorisation
Contact
François Schwarzentruber

Mise à jour le 9 septembre 2019