pluriTAL – BLOG Master pluriTAL [ParisX, ParisIII, INALCO]

« Barrage » sur le Web

Posted in Projet 2006-2007 by pluritaluser on 9 novembre 2006

Marianne MICHIELS, email: marianne_younes@hotmail.com

Bonjour,

Commençons par le commencement…

Mon point de départ était la lecture du dossier de l’Entreprise intitulé « Recherches sur Internet, il n’y a pas que google dans la vie ». Voici quelques points essentiels que j’ai retenue:

  • Saisir les mots-clés primaires + les mots-clés secondaires – les mots à exclure
  • Interroger les bases de données des moteurs car ils ne recensent qu’une partie du web.
  • Se connetcter aux sites portails, exemple: Enfin.fr.
  • Ni Google, le plus connu parmi les moteurs de recherche, ni ses concurrents ne couvrent l’ensemble des données disponibles sur le web.

1. Recherche du mot « Barrage » sur le web et récupération des pages « pertinentes »:

Par manque d’expérience, la récupération sera faite à la main.

A. La recherche du mot « Barrage » via GOOGLE :

>> « Un barrage hydraulique » :

>> « Un barrage de police » :

>> « Faire barrage à quelqu’un » :

=> Le copier/coller des URLs une par une n’est pas du tout amusant. Vivement que j’utilise wget. Le contenu de mes pages est enregistré dans le fichier « PAGES ASPIREES » de mon arborescence tandis qu mes URLs se trouvent dans le fichier « LISTES URL »

Publicités

Laisser un commentaire

Choisissez une méthode de connexion pour poster votre commentaire:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

%d blogueurs aiment cette page :