pluriTAL – BLOG Master pluriTAL [ParisX, ParisIII, INALCO]

AB : Pages aspirées avec wget

Posted in Projet 2006-2007 by pluritaluser on 8 novembre 2006

Dans le répertoire PAGES-ASPIREES j’ai créé un dossier pour chaque sens du mot « barrage ». Chaque dossier contient le fichier .txt avec la liste d’URL. J’utilise la commande wget pour aspirer mes pages. L’option –i signifie que la liste de URL à enregistrer se trouve dans le fichier indiqué.

wget -i action.txt

wget -i match.txt

etc.

Mes pages se trouvent maintenant sur mon disque dur. Pour pouvoir toutes les afficher je renomme les fichier .php en changeant simplement l’extension => .html. Par exemple :

spip.php@article816 => spip.html@article@816

 

Arianna Bisazza

Publicités

Laisser un commentaire

Choisissez une méthode de connexion pour poster votre commentaire:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

%d blogueurs aiment cette page :