pluriTAL – BLOG Master pluriTAL [ParisX, ParisIII, INALCO]

Pour Françoise

Posted in pluriTAL by pluritaluser on 13 mars 2009

En faite, tous ce que vous avez écrit vous permet d’écrire dans votre fichier « Sortie.xml » mais si vous avez remarqué avant l’instruction qui vous permet d’écrire dans le fichier print FILEOUT « ….. »;  il y a un appel à la fonction parcoursarborescencefichiers(…) donc on peut conclure que le faite que votre fichiers est vide que vous avez un probléme dans votre fonction parcoursarborescencefichiers(…).

Et pour étre sur il vous suffit d’enlever l’appel à la fonction parcoursarboresencefichiers(…) et vous aurez en principe un fichier « sortie.xml » qui a le contenu suivant:

<?xml version=\”1.0\” encoding=\”iso-8859-1\” ?>

<PARCOURS>

<NOM>Votre nom</NOM>

<FILTRAGE></FILTRAGE>

</PARCOURS>

Bon courage

Mourad Aouini

——————————————————

Merci !!!

Le lien vers Lexico 3 qu’il faut télécharger pour le cours de statistiques textuelles est le suivant: lexico3.zip

Et sa page web est la suivante: http://www.cavi.univ-paris3.fr/Ilpga/ilpga/tal/lexicoWWW/manuels.htm

J’essayerais plus tard ta réponse et après je te dirais si ça marche.

Françoise Del Socorro

————————————————————————————–

Bonjour Nassim, voici le lien vers mon fichier complet si tu veux m’expliquer ce qui ne va pas dans la BaO1:  parcours-arborescence-francoise.zip

Je n’ai pas encore tout re-essayé sur mon ordinateur, mais j’étais dans la BaO2 je crois.

Et là je suis en train de regarder les pages sur le perl-package-manager: http://www.cavi.univ-paris3.fr/ilpga/ilpga/tal/cours/BAO-master/perl-xml-rss.pdf qu’il y a sur internet, mais tous les programmes que je trouve sont pour linux (.tar.bz) et donc peut-être qu’il faudra vraiment que j’installe ubuntu (linux) car je ne sais pas comment faire avec windows ni avec cygwin pour installer ce programme (et je ne sais pas encore me servir de linux non plus).

En tout cas savoir c’est quoi le problème avec Sortie.xml, c’est déjà important.

Merci d’avance,

Françoise Del Socorro

—————————————————————————————

Françoise

Le Perl Package Manager présenté dans le document que vous citez est celui disponible avec la version ActiveState de Perl (sous Windows dans le même doc). Pour info, Activetstate fournit des versions de Perl pour d’autres OS (cf ce lien). Si vous installez une de ces versions de Perl, vous aurez un PPM disponible (sous windows, visible dans menu Démarrez).

Plus d’infos sur PPM ici : http://docs.activestate.com/activeperl/5.6/faq/ActivePerl-faq2.html

Si vous n’utilisez pas le Perl ActiveState, l’installation de bibliothèques se fait autrement. En général, on récupère les biblis sur la CPAN puis on les installe. Sous Unix, le mode d’emploi est en général celui-ci :

  • on dézippe (le zip contient en général un README et/ou INSTALL qui indique le mode d’emploi pour l’installation),
  • puis : perl MakeFile.pl
  • puis : make
  • puis : make install

(infos aussi disponibles dans les slides Perl sous Agora)

Sous Windows, on peut faire à peu près la même chose en installant au préalable un « équivalent » du make sous unix, par exemple nmake : vous trouverez ici des infos sur nmake.

SF

—————————————————

Merci Mr Fleury, j’ai plein de choses à tester et je n’ai pas encore répondu à Mourad parce que les .zip que vous avez faits sur le Monde ont été zippés sous Mac OS X, or je ne sais pas pourquoi les .zip zippés sous Mac OS X ne dézippent pas sous Windows Vista Basic, d’abord je voulais intaller un émulateur de Mac sur Windows ou DOS et sous Virtual Box, ensuite je me suis rendue compte que 1) Les versions disponibles n’étaient pas compatibles avec Windows Vista Basic et 2) Que Macintosh n’est pas Mac OS X (Hugo m’avait déjà expliqué ça au premier semestre, il ne m’a pas encore donné signe de vie au second semestre depuis la grève), et que donc ce serait inutile. Ensuite j’ai eu l’idée de chercher un autre dézippeur que le programme d’extraction à défaut de Windows, et j’ai trouvé le freeware 7-zip sur source forge qui a tout dézippé ! Et là je vais devoir  tout essayer.

Françoise Del Socorro

—————————————————–

Bonjour Mourad et Nassim, j’ai bidouillé un peu le code, je ne sais pas expliquer ce que j’ai fait, c’était intuitif, je me suis dit que si parcoursarborescencefichiers avait un problème, c’était parce que la boucle ne le considérait pas comme son contenu, donc j’ai changé la boucle et au lieu d’un if not, j’ai mis un if … else, et ça a marché, il reste plein de balises, mais je vais essayer le programme de Jugurtha Aït Hamlat pour voir si c’est à ça que ça sert.  En tout cas voici mes changements pour cette partie, après comme j’ai les fils RSS de culture et de Livres, je vais essayer par tâtonnement de deviner quelles variables (déjà c’est lesquelles les variables en perl ?) je dois personnaliser pour ne pas écraser Sortie.xml:

CHANGEMENTS:

#———————————————————–
my $rep= »$ARGV[0] »;
# on s’assure que le nom du répertoire ne se termine pas par un « / »
$rep=~ s/[\/]$//;
# on initialise une variable contenant le flux de sortie
my $DUMPFULL1= » »;
#—————————————-
my $output1= »SORTIE.xml »;
open (FILEOUTPUT);
if (open (FILEOUTPUT, »>$output1″)) {
#—————————————-
&parcoursarborescencefichiers($rep);    #recurse!
#—————————————-
print FILEOUTPUT « <?xml version=\ »1.0\ » encoding=\ »iso-8859-1\ » ?>\n »;
print FILEOUTPUT « <PARCOURS>\n »;
print FILEOUTPUT « <NOM>Votre nom</NOM>\n »;
print FILEOUTPUT « <FILTRAGE> ».$DUMPFULL1. »</FILTRAGE>\n »;
print FILEOUTPUT « </PARCOURS>\n »;
}
else { die « Pb a l’ouverture du fichier $output1 »};
close(FILEOUTPUT);
exit;
#———————————————-

RESULTAT sur Sortie.xml:

<?xml version= »1.0″ encoding= »iso-8859-1″ ?>
<PARCOURS>
<NOM>Votre nom</NOM>
<FILTRAGE><extract num= »1″> </extract><extract num= »2″>Créateur de la célèbre machine à écrire « Valentine » pour Olivetti, il est décédé lundi matin 31 décembre à l’âge de 90 ans à Milan, dans le nord de l’Italie, a annoncé l’agence Ansa.</extract><extract num= »3″>La profession goûte les avantages du mixage digital.</extract><extract num= »4″>Une exposition sur l’image réciproque des Allemands et des Russes de 1800 à 2000 montre que les rapports entre les deux peuples ont toujours été un mélange de peur et d’attirance, de répulsion et de fascination, de haine et d’admiration.</extract><extract num= »5″>Première institution culturelle privée à but non lucratif dans ce pays, elle est aussi la première ouverte par un étranger.</extract><extract num= »1″> </extract><extract num= »2″>Une exposition gratuite et à succès à l’Hôtel de Ville.</extract><extract num= »3″>Omar Porras offre au …

Françoise Del Socorro

Publicités

Laisser un commentaire

Choisissez une méthode de connexion pour poster votre commentaire:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

%d blogueurs aiment cette page :