Active-learning pour la découverte de patrons syntaxiques de relations dans le modèle ERE (Systèmes d'information)
Stage Palaiseau (Essonne) Développement informatique
Description de l'offre
Domaine : Systèmes d'information
Contrat : Stage
Description du poste :
Contexte du stage:
Les modèles neuronaux supervisés pour l’extraction de relations sémantiques dans les document textuels ont remplacé les modèles traditionnels basés sur des traits catégoriels. Ces modèles ont permis une grande amélioration des performances sur plusieurs benchmarks traditionnels (ex. SemEval 2010 task 8 [1] et SemEval 2018 task 7 [2]). Cependant, ces modèles supervisés nécessitent un grand volume de données annotées qui n’est pas toujours disponible pour le domaine considéré. Par ailleurs, certains contextes industriels requièrent une précision accrue au détriment du rappel. Dans ce contexte, les approches traditionnelles basées sur les traits catégoriels et les patrons syntaxiques permettent de répondre à ces attentes.
Objectifs:
L’objectif principal de ce stage est de développer une approche automatique pour l’extraction et l’utilisation de patrons sémantico-syntaxiques pour l’extraction de relations dans des documents textuels.
Vous aurez la charge d’étudier la littérature existante dans le domaine. Vous proposerez une approche et mènerez l’implémentation et l’évaluation de cette dernière.
Les travaux pourront se poursuivre par le développement d’une méthode hybride pour l’extraction de relations sémantiques mêlant l’utilisation de réseaux de neurones et de patrons syntaxiques.
Références:
[1] Hendrickx, I.; Kim, S. N.; Kozareva, Z.; Nakov, P.; Ó Séaghdha, D.; Padó, S.; Pennacchiotti, M.; Romano, L. & Szpakowicz, 2010 . S. SemEval-2010 Task 8: Multi-Way Classification of Semantic Relations Between Pairs of Nominals.
[2] Gábor, K.; Buscaldi, D.; Schumann, A.-K.; QasemiZadeh, B.; Zargayouna, H. & Charnois, T. 2018. SemEval-2018 Task 7: Semantic Relation Extraction and Classification in Scientific Papers.
Apostolova, E.; Tomuro, N. & Demner-Fushman, D. — 2011
Automatic Extraction of Lexico-Syntactic Patterns for Detection of Negation and Speculation Scopes
Patel, R.; Yang, Y.; Marshall, I.; Nenkova, A. & Wallace, B. C. — 2018
Syntactic Patterns Improve Information Extraction for Medical Search
Hassan, M.; Makkaoui, O.; Coulet, A. & Toussaint, Y. — 2015
Extracting Disease-Symptom Relationships by Learning Syntactic Patterns from Dependency Graphs
Tesfaye, D.; Zock, M. & Teferra, S. — 2016
Combining syntactic patterns and Wikipedia's hierarchy of hyperlinks to extract meronym relations
Kirschnick, J.; Akbik, A. & Hemsen, H. — 2014
Freepal: A Large Collection of Deep Lexico-Syntactic Patterns for Relation Extraction
Eichler, K.; Xu, F.; Uszkoreit, H. & Krause, S. — 2017
Generating Pattern-Based Entailment Graphs for Relation Extraction
Delli Bovi, C.; Telesca, L. & Navigli, R. — 2015
Large-Scale Information Extraction from Textual Definitions through Deep Syntactic and Semantic Analysis
Profil: Master 2/ école d'ingénieurs
Compétences:
Apprentissage automatique
Traitement Automatique des Langues
La maîtrise de la librairie scikit-learn est un plus
Python
Ville : Palaiseau
Langue / Niveau :
Anglais : Courant
Langue / Niveau :
Français : Courant