NoRDF Project : modéliser et extraire des informations complexes à partir du texte en langage naturel

La chaire « NoRDF Project: Modeling and Extracting Complex Information from Natural Language Text » est un projet scientifique à qui vise à modéliser et extraire des informations complexes à partir de textes en langage naturel. Plus précisément, il cherche à enrichir les bases de connaissances avec des événements, des causes, des conditions, des préséances, des histoires, des négations et des croyances. Le projet NoRDF étudiera en particulier l’expression des sentiments.

Ce type d’informations sera extraite à l’échelle à partir de sources structurées et non structurées et devra permettre à la machine de raisonner sur ces informations, c’est-à-dire d’appliquer des arguments logiques pour arriver à une conclusion argumentée. À cette fin seront regroupée les recherches sur la représentation des connaissances, sur le raisonnement et sur l’extraction d’informations.

 

Le projet NoRDF est financé par l’Agence nationale de la recherche (ANR) et l’Agence d’Innovation de défense (AID), en collaboration avec quatre partenaires industriels (EDF, Groupe BPCE, Schlumberger et Converteo). La chaire est établie pour une durée de quatre ans et son titulaire est Fabian Suchanek, Professeur à Télécom Paris, Institut Polytechnique de Paris. Chloé Clavel, Professeure à Télécom Paris et spécialiste du traitement du langage naturel, en est la co-responsable sur le volet de l’analyse des sentiments.