mardi 3 mars 2009

SYNTEX : Analyse syntaxique

Description

SYNTEX est un analyseur syntaxique de corpus (Bourigault et Fabre, 1999) qui permet d'extraire d'un corpus une liste de noms et syntagmes nominaux, structurée par des relations de dépendance syntaxique. La fonction de cet analyseur est d'identifier des relations de dépendances entre mots et d'extraire d'un corpus des syntagmes (verbaux, nominaux, adjectivaux).
Le résultat de l'analyse se présente sous la forme d'un réseau de dépendance, dans lequel chaque syntagme extrait est relié à sa tête et à son expansion syntaxique.

Ces relations de dépendance permettent d'effectuer automatiquement des regroupements distributionnels : par exemple la liste de tous les compléments de tel verbe ou la liste des adjectifs modifieurs de tel nom, qui constituent des amorces de classes sémantiques.

Par rapport aux analyseurs développés classiquement dans le domaine du traitement automatique des langues (Abeillé 1992), l’analyseur SYNTEX présente cette différence fondamentale d’être un analyseur de corpus, et non pas de phrases. C’est un analyseur de corpus parce que le résultat de l’analyse est un réseau de dépendance global construit pour l’ensemble du corpus, le réseau de dépendance construit constitue un mode d’accès au corpus pour l’analyste en charge de l’interprétation et le corpus est source d’information pour l’analyseur.

SYNTEX possède une version pour le Français et une autre pour l'Anglais.

Utilisation

SYNTEX prend en entrée un corpus étiqueté : il est découpé en mots (token) et à chaque mot est associé une catégorie grammaticale (nom, verbe, adjectif…). Cette tâche peut être réalisée par TreeTagger.

Cet analyseur produit en sortie:

1- Un corpus analysé syntaxiquement : Dans chaque phrase, Syntex pose des relations de dépendance syntaxique (sujet, complément d’objet, épithète, …) entre les mots
2- Un réseau de syntagmes
    * De chaque phrase, Syntex extrait des syntagmes (verbaux, nominaux, adjectivaux)
    * Pour l’ensemble du corpus, Syntex construit un réseau de syntagmes structuré par les relations Tête et Expansion
Voila le déroulement de la procédure d'analyse syntaxique par SYNTEX sur quelques phrases:

1- Analyse syntaxique en dépendance: la phrase traitée est: Le chat de Marie mange une petite souris.



























2- Construction d’un réseau de syntagmes: la phrase traitée est: L'érosion attaque un plan de faille.

























SYNTEX est utilisé essentiellement pour deux objectifs:

1- Construction de ressources termino-ontologiques: Le réseau de syntagmes est utilisé par un analyste (terminologue, expert, ingénieur, …) pour construire une ressource terminologique (thesaurus, terminologie, ontologie, …) sur un domaine spécialisé (métier, pratique) pour une application cible (traduction automatique, recherche d’information, …)

2- Etudes syntaxiques sur corpus

Licence

Logiciel non gratuit

Références

Bourigault D., Fabre C. (2000), Approche linguistique pour l'analyse syntaxique de corpus,. Cahiers de Grammaire, 25, Université Toulouse le Mirail, pp.131-151

Aucun commentaire:

Enregistrer un commentaire