Les offres de “CEA”

Expire bientôt CEA

Active-learning pour la découverte de patrons syntaxiques de relations dans le modèle ERE (Systèmes d'information)

  • Stage
  • Palaiseau (Essonne)
  • Développement informatique

Description de l'offre

Domaine : Systèmes d'information

Contrat : Stage

Description du poste :

Contexte du stage:
Les modèles neuronaux supervisés pour l’extraction de relations sémantiques dans les document textuels ont remplacé les modèles traditionnels basés sur des traits catégoriels. Ces modèles ont permis une grande amélioration des performances sur plusieurs benchmarks traditionnels (ex. SemEval 2010 task 8 [1] et SemEval 2018 task 7 [2]). Cependant, ces modèles supervisés nécessitent un grand volume de données annotées qui n’est pas toujours disponible pour le domaine considéré. Par ailleurs, certains contextes industriels requièrent une précision accrue au détriment du rappel. Dans ce contexte, les approches traditionnelles basées sur les traits catégoriels et les patrons syntaxiques permettent de répondre à ces attentes.

Objectifs:
L’objectif principal de ce stage est de développer une approche automatique pour l’extraction et l’utilisation de patrons sémantico-syntaxiques pour l’extraction de relations dans des documents textuels.
Vous aurez la charge d’étudier la littérature existante dans le domaine. Vous proposerez une approche et mènerez l’implémentation et l’évaluation de cette dernière.

Les travaux pourront se poursuivre par le développement d’une méthode hybride pour l’extraction de relations sémantiques mêlant l’utilisation de réseaux de neurones et de patrons syntaxiques.
 
Références:
[1] Hendrickx, I.; Kim, S. N.; Kozareva, Z.; Nakov, P.; Ó Séaghdha, D.; Padó, S.; Pennacchiotti, M.; Romano, L. & Szpakowicz, 2010 . S. SemEval-2010 Task 8: Multi-Way Classification of Semantic Relations Between Pairs of Nominals.

[2] Gábor, K.; Buscaldi, D.; Schumann, A.-K.; QasemiZadeh, B.; Zargayouna, H. & Charnois, T. 2018. SemEval-2018 Task 7: Semantic Relation Extraction and Classification in Scientific Papers.

Apostolova, E.; Tomuro, N. & Demner-Fushman, D. — 2011
Automatic Extraction of Lexico-Syntactic Patterns for Detection of Negation and Speculation Scopes

Patel, R.; Yang, Y.; Marshall, I.; Nenkova, A. & Wallace, B. C. — 2018
Syntactic Patterns Improve Information Extraction for Medical Search

Hassan, M.; Makkaoui, O.; Coulet, A. & Toussaint, Y. — 2015
Extracting Disease-Symptom Relationships by Learning Syntactic Patterns from Dependency Graphs

Tesfaye, D.; Zock, M. & Teferra, S. — 2016
Combining syntactic patterns and Wikipedia's hierarchy of hyperlinks to extract meronym relations

Kirschnick, J.; Akbik, A. & Hemsen, H.  — 2014
Freepal: A Large Collection of Deep Lexico-Syntactic Patterns for Relation Extraction

Eichler, K.; Xu, F.; Uszkoreit, H. & Krause, S. — 2017
Generating Pattern-Based Entailment Graphs for Relation Extraction

Delli Bovi, C.; Telesca, L. & Navigli, R. — 2015
Large-Scale Information Extraction from Textual Definitions through Deep Syntactic and Semantic Analysis




Profil: Master 2/ école d'ingénieurs

Compétences:
Apprentissage automatique
Traitement Automatique des Langues
La maîtrise de la librairie scikit-learn est un plus
Python

Ville : Palaiseau

Langue / Niveau :

Anglais : Courant

Langue / Niveau :

Français : Courant

Faire de chaque avenir une réussite.
  • Annuaire emplois
  • Annuaire entreprises
  • Événements