pluriTAL – BLOG Master pluriTAL [ParisX, ParisIII, INALCO]

Boîte à Outils Série 4 : des Textes Aux Graphes

Posted in Boîte à Outils, Projet 2005-2006 by tal-p3 on 24 février 2006

Comme annoncé dans Boîte à Outils Série 3, la séance BàO série 4 prend appui sur les sorties obtenues dans la série précédente qui sont réutilisées par un programme générant des graphes. Le programme de cette séance est visible ici : des Textes Aux Graphes.

Publicités

Commentaires fermés sur Boîte à Outils Série 4 : des Textes Aux Graphes

Travaux sur BOITE A Outils (Series 1, 2, 3, 4)

Posted in Boîte à Outils, Projet 2005-2006 by tal-p3 on 20 février 2006

Boîtes à Outils Séries 1, 2, 3, 4 (màj :06/05/2006)

Présentation : Boîte à outils Série 1 | Boîte à outils Série 2 | Boîte à outils Série 3 | Boîte à outils Série 4

Commentaires fermés sur Travaux sur BOITE A Outils (Series 1, 2, 3, 4)

Boîte à Outils Série 3

Posted in Boîte à Outils, Projet 2005-2006 by tal-p3 on 15 février 2006

Le travail amorcé ce matin (BàO série 3) devra se poursuivre en tenant compte des mises à jour suivantes :

Le programme d’extraction terminologique présenté ce matin par JMD est (et était dès ce matin) tout à fait opérationnel ; pour vous aider à comprendre ce programme nous avons enrichi la page de présentation de celui-ci sur la page suivante : Travail du 15.02.2006

Plusieurs petites modifications ont été apportées (elles sont documentées dans le programme) :

  • le fichier des patrons doit être donné dans la ligne de commandes au lancement du programme
  • le programme génère un fichier de trace contenant les “activités principales�? du programme
  • les commentaires

La page précédente donne accès au programme et aux fichiers de test utilisés pour la mise au point de ce programme :

Lien “[Lien vers script et ressources de test]�?

Cette archive contient :

  • le programme : trouve_term.pl
  • 2 fichiers de sortie du treetagger (SORTIE-TREETAGGER.txt et une-description-etiquetee-avec-treetagger.txt) : le premier est assez volumineux, le second correspond au contenu d’une balise DESCRIPTION extraite d’un fils RSS
  • 2 fichiers de sortie du programme trouve_term.pl (resultat-extraction-SORTIE-TREETAGGER.txt et resultat-extraction-sur-une-description.txt) : pour vous prouver que ça marche effectivement…
  • les 2 fichiers de patrons utilisés sur les 2 fichiers de test : patrons-1.txt pour SORTIE-TREETAGGER.txt et patrons-2.txt pour une-description-etiquetee-avec-treetagger.txt
  • les fichiers de TRACE n’ont pas été insérés dans cette archive (en faisant tourner le programme, ils apparaîtront…)

Votre travail consiste donc à :

  • Tester ce programme en modifiant le fichier des patrons suivant les besoins (si pb envoyer un mail à SF avec les explications nécessaires et un bout du fichier de TRACE)
  • Vous devrez ensuite adapter ce programme pour qu’il soit capable de prendre en entrée des sorties issues de CORDIAL (pour produire évidemment le même type de résultat)
  • Vous devrez enfin reprendre le programme de parcours d’arborescence vu dans les BàO série 1 et 2, modifier le programme de parcours afin de produire en sortie un fichier contenant le résultat du filtrage terminologique sur l’arborescence complète des fils RSS (l’étiquetage étant réalisé à la volée avec treetagger, cf BàO série 2). Pour cette partie, il s’agit en fait d’�?inclure�? (modulo quelques aménagements) le programme trouve_term.pl dans le programme de parcours, juste après la phase d’étiquetage à la volée réalisée par treetagger.

Dans la suite du cours (BàO série 4), le programme construit ici sera enrichi pour produire des sorties réutilisées par un programme générant des graphes.

Rappel :

  • les travaux BàO série 1 et 2 doivent être envoyés à SF avant mardi 21/02 22h (zippés sous la forme prenom-nom.zip). Ces travaux seront mis en ligne sur la page du cours (rubrique “Boîtes à outils : travaux réalisés�?)
  • RAFFINEMENT (optionnel provisoirement) : Vous pouvez intégrer aux travaux BàO série 1 et 2 à rendre la partie amorcée aujourd’hui concernant l’extraction terminologique. Le travail BàO série 3 sera à rendre plus tard avec celui fait dans la BàO série 4.

Bon travail.

Commentaires fermés sur Boîte à Outils Série 3

Calendrier de Reprise semestre 2

Posted in pluriTAL by tal-p3 on 6 février 2006

Le second semestre commence cette semaine pour certains cours. Vous trouverez ci-dessous le calendrier de cette reprise des cours. Je vous envoie un complément rapidement avec les dates manquantes (Paris X)

TRONC COMMUN MASTER TAL 1ère année Semestre 2

L8T53 LMSDL281 Statistique et analyse multidimensionnelle
Reprise des cours : le 10/02/2006 à 11h00 ILPGA LaboC

L8T01 LMSDL282 Corpus parallèles/comparables
Reprise des cours : le 24/02/06 de 14h00 à 17h00 (INALCO, salle 124, escalier B, 1er étage), puis le 3/03, 10/03, 17/03, 31/03

L8T02 LMSDL283 Recherche et extraction d’information
Reprise des cours : le ../../….

L8T05 LMSDL217 Sémantique formelle
Reprise des cours : le ../../….

L8T04 LMSDL218 Syntaxe formelle (Paris X)
Reprise des cours : le ../../….
Ou
LZM09 Syntaxes formelles (Paris III)
Reprise des cours : le 09/02/2006 à 15h30 ILPGA salle Durand

L8T06 LMSDL284 Document structuré
Reprise des cours : le 08/02/2006 à 09h00 ILPGA LaboC

L8T07 LMSDL280 Programmation et projet encadré
Reprise des cours : le 15/02/2006 à 11h30 ILPGA LaboC

Pour les cours optionnels ou libres se renseigner auprès des différents secrétariats
ou des enseignants concernés.

TRONC COMMUN MASTER TAL 2ème année Semestre 2

L0T03 LMSDL493 Exposé d’articles
Reprise des cours : le ../../….

Commentaires fermés sur Calendrier de Reprise semestre 2

Des usages de RSS

Posted in pr-Nuages (SF), Projet 2005-2006 by tal-p3 on 2 février 2006

Pour les étudiants « inscrits » au projet Nuages (et pour les autres aussi…) : lecture autour de RSS

Source : Affordance :

Le problème principal du RSS, ou plus exactement de la méconnaissance de sa richesse (et de sa simplicité) applicative est que l’on peine parfois à « imaginer » des scénarios d’usage. Pêché sur le blog « Teaching Hacks », ce petit guide (.pdf) vous économisera (pour partie) cet effort d’imagination.?

Liens :

Commentaires fermés sur Des usages de RSS

Fin de semestre = affichage des notes

Posted in pluriTAL by tal-p3 on 2 février 2006

Les notes de tous les enseignements du semestre 1 seront affichées progressivement sur le site pluriTAL (page du master). Lien direct vers l’état en cours (màj : 20/02/2006). En cas de pb envoyer un message à SF (via serge.fleury@univ-paris3.fr)

Commentaires fermés sur Fin de semestre = affichage des notes