pluriTAL – BLOG Master pluriTAL [ParisX, ParisIII, INALCO]

ped02-CJ-barrage-wget-discussion

Posted in Projet 2006-2007 by pluritaluser on 5 novembre 2006

Bonjour à tous et à toutes,

voici un nouveau post pour faire part de l’expérience que j’ai eu ce dimanche : il concerne wget et ses options et comment les options d’un programme peuvent influencer la structure d’un programme.

J’avais conçu mon programme c’est à dire je l’avais imaginé, presque couché sur papier, j’avais donc une bonne idée de comment réaliser le programme pour le projet barrage.

Tout était prêt, je commence à programmer, jusqu’à ce que j’arrive à l’instruction wget.

En effet nous avons vu précédemment trois options de wget :

-i nom_de_fichier : permet de télécharger toutes les URLs présentent dans le fichier.

-O nom_de_fichier : Enregistre la page téléchargée avec le nom nom_de_fichier.

-P repertoire : Enregistre les pages téléchargées dans le repertoire.

Il semble que certaines combinaisons ne fonctionnent pas tel -O et -P, je pensais qu’en spécifiant ces deux options je pourrais enregistrer le fichier spécifié par l’option -O dans le répertoire spécifié par l’option -P mais a postériori cela ne fonctionne pas (wget 1.10 sous linux, ex wget -O fichier.html -P PAGES_ASPIREES url).

Il y a bien une solution qui est la concaténation (ce mot est entré dans mon lexique depuis peu :-)), d’un nom de répertoire et du nom de fichier.

Ex en shell :

nomFichierComplet= »$repertoire » »/ » »$nom_de_fichier »

Et ensuite utilisé wget -O $nomFichierComplet url
Ceci n’est qu’un accident de parcours, le vrai problème est la réponse à la question suivante :

Peut-on utiliser les options -O et -i simultanément, si oui que se passe-t-il ?

Oui ces options sont utilisables simultanément mais que font-elles ?

D’après man wget :

-O fichier
–output-document=fichier
Les documents ne seront pas crits dans les fichiers appropris,
mais tous concatns les uns aux autres et crits dans fichier. Si
fichier existe dj, il sera remplac. Si fichier vaut -, les docu-
ments seront crits sur la sortie standard. Cette option positionne
automatiquement le nombre de tentatives 1.

On a ici la réponse, qui ammène une aute question :

– Comment le choix de l’option -i ou -O pour wget va-t-il influer sur la structure du programme shell que l’on doit écrire ?

Christian JEAN.