pluriTAL – BLOG Master pluriTAL [ParisX, ParisIII, INALCO]

Notre blog

Posted in pluriTAL by pluritaluser on 8 décembre 2008

http://loule.info/

Noriko & Teng

Publicités

problème d’encodage des dump-text – RESOLUTION

Posted in pluriTAL by pluritaluser on 6 décembre 2008

Si vos dump-text ne s’affichent pas correctement (pas de signes diacrités en polonais par exemple), le traitement de contextes ne va pas être possible.

Il y a la résolution sur notre blog. Simple comme … option de lynx. Après, à vous de jouer avec le egrep ou minigrep:)

http://laviedesmots.over-blog.com/

Agnieszka

Sondage – la philosophie du script

Posted in pluriTAL, Projet 2008-2009 by pluritaluser on 3 décembre 2008

Ce message est adressé à tout le groupe du Master 1 et veut être un sondage sur les choix structurels que vous avez effectués pour votre script.

Depuis ce matin, en effet, je crois que mon script est en plein milieu d’une crise d’identité. En parlant un peu de ça à certains d’entre vous, j’ai dégagé deux « philosophies » de base:

1) Ligne sur ligne, c’est-à-dire généralement une boucle for après l’autre;

2) Boucle dans la boucle, c’est-à-dire une boucle for principale qui en inclut d’autres;

Or, je me pose peut-être trop de questions, mais je crois que la première « école » est assez particulariste et ponctuelle, alors que la deuxième est généraliste. Mon souci est donc le suivant:

est-ce que nous devons réaliser un script utilisable par d’autres personnes?

Merci de bien vouloir répondre à cet article: il pourrait non seulement fournir des données statistiques, mais aussi dégager une question « éthique ».

Marco

Si lynx ne fonctionne pas

Posted in pluriTAL by pluritaluser on 2 décembre 2008

Si comme pour moi lynx ne fonctionne pas sur votre ordinateur, c’est peut être qu’il n’est pas installé.

Il ne voux reste plus qu’à l’installer : apt-get install lynx

Sophie

La nausée d’effacer les fichiers à la main

Posted in pluriTAL, Projet 2008-2009 by pluritaluser on 2 décembre 2008

Tout d’abord, merci à Agnieszka, Sophie et Marie pour la fabuleuse idée du petit script « destructeur » qui rend la vie plus serène et moins chaotique.

Totalement persuadé de la nécessité de cet outil, j’ai fouillé dans les options de la commande rm, afin de savoir s’il y avait une solution minimaliste au problème quotidien de l’élimination de nos fameux fichiers. Et bien, il y a l’option -i, qui demande à chaque fois de confirmer la suppression des fichiers, un par un:

rm: remove file ‘blablabla.bla’?

On tape y ou n un nombre énième de fois et c’est fini. Presque plus lourd que l’élimination manuelle, mais au moins on fait ça avec une commande Unix, sous un environnement Unix.

Ensuite, j’ai trouvé l’incroyable option -I (i majuscule), qui demande de confirmer la suppression des fichiers seulement 1 fois pour un ensemble de plus de 3 fichiers:

rm: remove all arguments?

On tape la confirmation et les jeux sont faits!

En dernier lieu, l’option -v affiche à l’écran les fichiers qui viennent d’être écrasés.

Voici donc ma version du script « destructeur »:

#!/bin/bash
echo "fais-gaffe à ce que tu vas faire...si tu tapes \"y\"
tu vas tout effacer, si tu tapes \"n\" tu vas rien faire";
rm -I -v ./CONTEXTES/*.*;
rm -I -v ./PAGES-ASPIREES/*.*;
rm -I -v ./DUMP-TEXT/*.*;
echo "maintenant je vais écraser le tableau";
rm -i -v ./TABLEAUX/*.*;
echo "congratulations, t'as plus rien!";

J’ai testé mon script sur les machines de l’ILPGA et avec grand malheur j’ai constaté que la version de rm installée ne contient pas l’option -I…Quelle déception!!!

Les machines, comme les être humains, sont toutes différentes!

Marco

P.S.: *.* – Peut-être l’expression régulière pour les fichiers la plus simple au monde (et la plus méchante)?