Boîte à Outils Série 4 : des Textes Aux Graphes
Comme annoncé dans Boîte à Outils Série 3, la séance Bà O série 4 prend appui sur les sorties obtenues dans la série précédente qui sont réutilisées par un programme générant des graphes. Le programme de cette séance est visible ici : des Textes Aux Graphes.
Travaux sur BOITE A Outils (Series 1, 2, 3, 4)
Boîtes à Outils Séries 1, 2, 3, 4 (mà j :06/05/2006)
Présentation : Boîte à outils Série 1 | Boîte à outils Série 2 | Boîte à outils Série 3 | Boîte à outils Série 4
- Achouri Samia (Paris 3/pluriTAL)
- Bonasso Claire (Inalco/Traductique)
- Chachaty Edmond (Paris 3/pluriTAL)
- Delahaye Sébastien (Inalco/Ingénierie Multilingue)
- Fedorov Alexey (Inalco/Ingénierie Multilingue)
- Gagoun Parfaite (Paris 3/pluriTAL)
- Guiraud Claire (Inalco/Ingénierie Multilingue)
- Hamri Nacer (Paris 3/pluriTAL)
- Hiard Yann (Paris 3/pluriTAL)
- Kozhina Natalia (Inalco/Traductique)
- Krougovaïa Evguénia (Inalco/Traductique)
- Lam Yann (Inalco/Ingénierie Multilingue)
- Maafa Zahir (Inalco/Ingénierie Multilingue)
- Pantikina Névéna (Inalco/Traductique)
- Picard Virginie (Paris 3/pluriTAL)
- Raffart Bruno (Paris 3/pluriTAL)
- Ragot Thomas (Paris 3/pluriTAL)
- Ramdani Egle (Paris 3/pluriTAL)
- Ramdani Faïna (Inalco/Traductique)
- Ratsimba Hoby (Paris 3/pluriTAL)
- Ristic Aleksandra (Inalco/Traductique)
- Schaeffer Raphaël (Inalco/Ingénierie Multilingue)
- Semenova Olga (Inalco/Traductique)
- Tsarkova Svetlana (Inalco/Traductique)
- Trinquier Aurélia (Paris 3/pluriTAL)
- Wu Li-Chi (Paris 3/pluriTAL)
Commentaires fermés sur Travaux sur BOITE A Outils (Series 1, 2, 3, 4)
Boîte à Outils Série 3
Le travail amorcé ce matin (Bà O série 3) devra se poursuivre en tenant compte des mises à jour suivantes :
Le programme d’extraction terminologique présenté ce matin par JMD est (et était dès ce matin) tout à fait opérationnel ; pour vous aider à comprendre ce programme nous avons enrichi la page de présentation de celui-ci sur la page suivante : Travail du 15.02.2006
Plusieurs petites modifications ont été apportées (elles sont documentées dans le programme) :
- le fichier des patrons doit être donné dans la ligne de commandes au lancement du programme
- le programme génère un fichier de trace contenant les “activités principales�? du programme
- les commentaires
La page précédente donne accès au programme et aux fichiers de test utilisés pour la mise au point de ce programme :
Lien “[Lien vers script et ressources de test]�?
Cette archive contient :
- le programme : trouve_term.pl
- 2 fichiers de sortie du treetagger (SORTIE-TREETAGGER.txt et une-description-etiquetee-avec-treetagger.txt) : le premier est assez volumineux, le second correspond au contenu d’une balise DESCRIPTION extraite d’un fils RSS
- 2 fichiers de sortie du programme trouve_term.pl (resultat-extraction-SORTIE-TREETAGGER.txt et resultat-extraction-sur-une-description.txt) : pour vous prouver que ça marche effectivement…
- les 2 fichiers de patrons utilisés sur les 2 fichiers de test : patrons-1.txt pour SORTIE-TREETAGGER.txt et patrons-2.txt pour une-description-etiquetee-avec-treetagger.txt
- les fichiers de TRACE n’ont pas été insérés dans cette archive (en faisant tourner le programme, ils apparaîtront…)
Votre travail consiste donc à :
- Tester ce programme en modifiant le fichier des patrons suivant les besoins (si pb envoyer un mail à SF avec les explications nécessaires et un bout du fichier de TRACE)
- Vous devrez ensuite adapter ce programme pour qu’il soit capable de prendre en entrée des sorties issues de CORDIAL (pour produire évidemment le même type de résultat)
- Vous devrez enfin reprendre le programme de parcours d’arborescence vu dans les Bà O série 1 et 2, modifier le programme de parcours afin de produire en sortie un fichier contenant le résultat du filtrage terminologique sur l’arborescence complète des fils RSS (l’étiquetage étant réalisé à la volée avec treetagger, cf Bà O série 2). Pour cette partie, il s’agit en fait d’�?inclure�? (modulo quelques aménagements) le programme trouve_term.pl dans le programme de parcours, juste après la phase d’étiquetage à la volée réalisée par treetagger.
Dans la suite du cours (Bà O série 4), le programme construit ici sera enrichi pour produire des sorties réutilisées par un programme générant des graphes.
Rappel :
- les travaux Bà O série 1 et 2 doivent être envoyés à SF avant mardi 21/02 22h (zippés sous la forme prenom-nom.zip). Ces travaux seront mis en ligne sur la page du cours (rubrique “Boîtes à outils : travaux réalisés�?)
- RAFFINEMENT (optionnel provisoirement) : Vous pouvez intégrer aux travaux Bà O série 1 et 2 à rendre la partie amorcée aujourd’hui concernant l’extraction terminologique. Le travail Bà O série 3 sera à rendre plus tard avec celui fait dans la Bà O série 4.
Bon travail.
Commentaires fermés sur Boîte à Outils Série 3
Calendrier de Reprise semestre 2
Le second semestre commence cette semaine pour certains cours. Vous trouverez ci-dessous le calendrier de cette reprise des cours. Je vous envoie un complément rapidement avec les dates manquantes (Paris X)
TRONC COMMUN MASTER TAL 1ère année Semestre 2
L8T53 LMSDL281 Statistique et analyse multidimensionnelle
Reprise des cours : le 10/02/2006 Ã 11h00 ILPGA LaboC
L8T01 LMSDL282 Corpus parallèles/comparables
Reprise des cours : le 24/02/06 de 14h00 à 17h00 (INALCO, salle 124, escalier B, 1er étage), puis le 3/03, 10/03, 17/03, 31/03
L8T02 LMSDL283 Recherche et extraction d’information
Reprise des cours : le ../../….
L8T05 LMSDL217 Sémantique formelle
Reprise des cours : le ../../….
L8T04 LMSDL218 Syntaxe formelle (Paris X)
Reprise des cours : le ../../….
Ou
LZM09 Syntaxes formelles (Paris III)
Reprise des cours : le 09/02/2006 Ã 15h30 ILPGA salle Durand
L8T06 LMSDL284 Document structuré
Reprise des cours : le 08/02/2006 Ã 09h00 ILPGA LaboC
L8T07 LMSDL280 Programmation et projet encadré
Reprise des cours : le 15/02/2006 Ã 11h30 ILPGA LaboC
Pour les cours optionnels ou libres se renseigner auprès des différents secrétariats
ou des enseignants concernés.
TRONC COMMUN MASTER TAL 2ème année Semestre 2
L0T03 LMSDL493 Exposé d’articles
Reprise des cours : le ../../….
Commentaires fermés sur Calendrier de Reprise semestre 2
Des usages de RSS
Pour les étudiants « inscrits » au projet Nuages (et pour les autres aussi…) : lecture autour de RSS
Source : Affordance :
“Le problème principal du RSS, ou plus exactement de la méconnaissance de sa richesse (et de sa simplicité) applicative est que l’on peine parfois à « imaginer » des scénarios d’usage. Pêché sur le blog « Teaching Hacks », ce petit guide (.pdf) vous économisera (pour partie) cet effort d’imagination.â€?
Liens :
- Présentation du guide par son auteur sur le site Teaching Hacks
- Le guide au format PDF
Commentaires fermés sur Des usages de RSS
Fin de semestre = affichage des notes
Les notes de tous les enseignements du semestre 1 seront affichées progressivement sur le site pluriTAL (page du master). Lien direct vers l’état en cours (mà j : 20/02/2006). En cas de pb envoyer un message à SF (via serge.fleury@univ-paris3.fr)
Commentaires fermés sur Fin de semestre = affichage des notes
Commentaires fermés sur Boîte à Outils Série 4 : des Textes Aux Graphes