abstract.tex (1778B)
1 {\mdseries\garamond\textsc{\ifthesissummary Résumé\else Meta-résumé\fi}}\quad 2 Détecter les relations exprimées dans un texte est un problème fondamental de la compréhension du langage naturel. 3 Il constitue un pont entre deux approches historiquement distinctes de l'intelligence artificielle, celles à base de représentations symboliques et distribuées. 4 Cependant, aborder ce problème sans supervision humaine pose plusieurs problèmes et les modèles non supervisés ont des difficultés à faire écho aux avancées des modèles supervisés. 5 Cette thèse aborde deux lacunes des approches non supervisées~: le problème de la régularisation des modèles discriminatifs et le problème d'exploitation des informations relationnelles à partir des structures des jeux de données. 6 La première lacune découle de l'utilisation de réseaux neuronaux profonds. 7 Ces modèles ont tendance à s'effondrer sans supervision. 8 Pour éviter ce problème, nous introduisons deux fonctions de coût sur la distribution des relations pour contraindre le classifieur dans un état entraînable. 9 La deuxième lacune découle du développement des approches au niveau des jeux de données. 10 Nous montrons que les modèles non supervisés peuvent tirer parti d'informations issues de la structure des jeux de données, de manière encore plus décisive que les modèles supervisés. 11 Nous exploitons ces structures en adaptant les méthodes non supervisées existantes pour capturer les informations topologiques à l'aide de réseaux convolutifs pour graphes. 12 De plus, nous montrons que nous pouvons exploiter l'information mutuelle entre les données topologiques et linguistiques pour concevoir un nouveau paradigme d'entraînement pour l'extraction non supervisée de relations.