pluriTAL – BLOG Master pluriTAL [ParisX, ParisIII, INALCO]

ped02-CJ-barrage-wget-discussion

Posted in Projet 2006-2007 by pluritaluser on 5 novembre 2006

Bonjour à tous et à toutes,

voici un nouveau post pour faire part de l’expérience que j’ai eu ce dimanche : il concerne wget et ses options et comment les options d’un programme peuvent influencer la structure d’un programme.

J’avais conçu mon programme c’est à dire je l’avais imaginé, presque couché sur papier, j’avais donc une bonne idée de comment réaliser le programme pour le projet barrage.

Tout était prêt, je commence à programmer, jusqu’à ce que j’arrive à l’instruction wget.

En effet nous avons vu précédemment trois options de wget :

-i nom_de_fichier : permet de télécharger toutes les URLs présentent dans le fichier.

-O nom_de_fichier : Enregistre la page téléchargée avec le nom nom_de_fichier.

-P repertoire : Enregistre les pages téléchargées dans le repertoire.

Il semble que certaines combinaisons ne fonctionnent pas tel -O et -P, je pensais qu’en spécifiant ces deux options je pourrais enregistrer le fichier spécifié par l’option -O dans le répertoire spécifié par l’option -P mais a postériori cela ne fonctionne pas (wget 1.10 sous linux, ex wget -O fichier.html -P PAGES_ASPIREES url).

Il y a bien une solution qui est la concaténation (ce mot est entré dans mon lexique depuis peu :-)), d’un nom de répertoire et du nom de fichier.

Ex en shell :

nomFichierComplet= »$repertoire » »/ » »$nom_de_fichier »

Et ensuite utilisé wget -O $nomFichierComplet url
Ceci n’est qu’un accident de parcours, le vrai problème est la réponse à la question suivante :

Peut-on utiliser les options -O et -i simultanément, si oui que se passe-t-il ?

Oui ces options sont utilisables simultanément mais que font-elles ?

D’après man wget :

-O fichier
–output-document=fichier
Les documents ne seront pas crits dans les fichiers appropris,
mais tous concatns les uns aux autres et crits dans fichier. Si
fichier existe dj, il sera remplac. Si fichier vaut -, les docu-
ments seront crits sur la sortie standard. Cette option positionne
automatiquement le nombre de tentatives 1.

On a ici la réponse, qui ammène une aute question :

– Comment le choix de l’option -i ou -O pour wget va-t-il influer sur la structure du programme shell que l’on doit écrire ?

Christian JEAN.

Publicités

Une Réponse

Subscribe to comments with RSS.

  1. tal-p3 said, on 6 novembre 2006 at 6:50

    Bonjour Christian

    Une petite précision concernant votre post. Vous trouverez ici un très bon manuel en ligne de wget :

    http://www.delafond.org/traducmanfr/man/man1/wget.1.html

    L’utilisation de wget avec l’option -P :

    wget -P/cygdrive/c/PROJET-MASTER/PAGES-ASPIREES http://www.barrage.com/index.html

    provoquera effectivement la création de la page aspirée dans le dossier associé à l’option -P i.e. :

    /cygdrive/c/PROJET-MASTER/PAGES-ASPIREES

    Par contre l’utilisation conjointe des 2 options -P et -O est effectivement impossible. Pour produire le résultat escompté, vous pouvez dans un script, commencer par utiliser wget (avec l’option -P) puis renommer le fichier aspiré via la commande mv par exemple.

    SF


Laisser un commentaire

Choisissez une méthode de connexion pour poster votre commentaire:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

%d blogueurs aiment cette page :