pluriTAL – BLOG Master pluriTAL [ParisX, ParisIII, INALCO]

Navigation dans Les Fils du Monde (2008) 08/09

Projet dit Navigations dans « les Fils du Monde » l’an 2008

Master TAL recherche (1ère année) 2008/2009

1. Préambule

Cette page est le lieu d’une synthèse « au fil de l’eau » de l’évolution de projet.
On suivra aussi les travaux en cours sur cette page Travaux Navigations 08/09

Démarrage des travaux sur ce projet : le 29/04/2009

2. Participants

3. Présentation du projet

  • le document de présentation de ce projet et les données associées seront disponibles sur un CD fourni lors du démarrage du projet.

4. Travaux à réaliser :

  • cf document précédent
  • On regardera aussi les travaux des années passées : 2006-2007 et 2007-2008.

5. Travaux réalisés :

6. Liens / Lectures :

  • Dégrouper les sens à partir d’attestations, B. Habert (LIMSI – CNRS & université Paris X – Nanterre) http://www.cavi.univ-paris3.fr/ilpga/ilpga/tal/cours/PROJETSM1/COMMUNAUTE/Site/ProjetDegrouperSensWebLeMonde.pdf
  • Projet Fils de Presse : http://tal.univ-paris3.fr/filspresse/
  • Projet Corpus Chronologique Le Monde : http://www.cavi.univ-paris3.fr/ilpga/ilpga/sfleury/veille.htm
  • Les Voisins du Monde : http://www.irit.fr:8080/voisinsdelemonde/
    • Les Voisins De Le Monde est une base lexicale distributionnelle du français construite automatiquement, à partir d’un corpus comprenant l’ensemble des articles du quotidien Le Monde sur une période de 10 ans (1991-2000). Le corpus Le Monde a été obtenu auprès de l’agence ELRA . Il a été intégralement traité par l’analyseur syntaxique Syntex, développé dans le cadre d’une collaboration entre le laboratoire ERSS et la société Synomia.
  • Presse 2007 : http://www.up.univ-mrs.fr/veronis/Discours2007/
    • Base Discours 2007 réalisée par J. Véronis et Damon Mayaffre : présentation
  • LexiMédia2007 : http://erss.irit.fr/LexiMedia2007/
    • analyse en permanence les flux issus de Presse 2007 et extrait automatiquement les mots (« débat », « retraite », « délinquance ») et les expressions (« logement sociaux », « débat interne », « régimes spéciaux de retraite », « carte scolaire », « prévention de la délinquance ») utilisés dans les articles. LexiMédia2007 donne l’évolution au fil des semaines de la fréquence d’utilisation de ces expressions, globalement et par journal. Pour chaque semaine, il donne les expressions les plus utilisées, les expressions en forte hausse, les expressions en forte baisse et celles dont la variation (hausse et baisse confondues) est la plus importante. Pour chaque expression, LexiMédia2007 donne le détail de son évolution (courbe de fréquence sur l’ensemble des semaines) et les liens vers les articles dans lesquels il apparaît. Source : http://aixtal.blogspot.com/2007/01/outil-leximedia2007.html
  • Véronis, J. (2004). Hyperlex : lexical cartography for information retrieval. Computer, Speech and Language, 18 (3), 223-252. [Lire]
  • Véronis , J. (2004). L’étiquetage sémantique des corpus. Le Français Moderne. 2004/1, 27-38. [Lire]
  • Véronis, J. (2003). Hyperlex : cartographie lexicale pour la recherche d’informations. Actes de la Conférence Traitement Automatique des Langues (TALN’2003) (pp. 265-274). Batz-sur-mer (France): ATALA. [Lire]
  • Véronis, J. (2003). Hyperlex : cartographie lexicale pour la recherche d’informations. Rapport interne. Equipe DELIC, Université de Provence. [Lire]
  • Ferret, Olivier Découvrir des sens de mots à partir d’un réseau de cooccurrences lexicales, TALN 2004 XIe conférence sur le traitement automatique des langues naturelles, 2004, Bernard Bel and Isabelle Marlien, Fès (Maroc), 19-22 avril, ATALA (Association pour le Traitement Automatique des LAngues [Lire]
  • Cédric Lamalle, William Martinez, Serge Fleury, André Salem, Andrea Kuncova, Aude Maisondieu (2001). « Dix premiers pas avec Lexico3« , Manuel d’utilisation abrégé [Lire]
  • Le Trameur, manuel d’utilisation [Lire]

Laisser un commentaire