pluriTAL – BLOG Master pluriTAL [ParisX, ParisIII, INALCO]

PED13-ML-‘barrage’

Posted in Projet 2006-2007 by pluritaluser on 12 octobre 2006

Marguerite LEENHARDT, contact: marguerite.leenhardt@laposte.net

1- Documentation de quelques commandes Unix

  • ls

    • liste les informations relatives aux fichiers contenus dans le répertoire courant, par défaut.

    • Ls a de nombreuses options qui peuvent par exemple permettre une présentation différente des résultats de la commande, comme le fait l’option -C (présente la liste des résultats en colonnes)

  • cd

    • acronyme de ‘Change Directory’, la commande cd permet de remonter d’un cran dans l’arborescence de dossiers. Le chemin du répertoire ciblé peut-être indiqué de façon relative ou absolue

    • Un cas particulier de l’utilisation de la commande cd: lorsqu’elle est utilisée seule (i.e. sans option), cd nous ramène dans notre répartoire de travail par défaut.

  • Wget

    • la versionde Cygwin utilisée ici pour documenter ces commandes n’a pas d’entrée de manuel pour Wget. Néanmoins, on peut en trouver un commentaire détaillé ici: http://www.delafond.org/traducmanfr/man/man1/wget.1.html

    • Wget est une sorte d’aspirateur de pages Web, éventuellement de hiérarchies de documents sur le Web

    • Voici les premières lignes de cette page de man :

  • Wget est un programme non interactif de téléchargement de fichiers depuis le Web. C’est un logiciel libre. Il supporte les protocoles HTTP, HTTPS et FTP ainsi que le téléchargement au travers des proxies HTTP
    Wget est non interactif c’est-à-dire qu’il peut travailler en arrière-plan, sans intervention de l’utilisateur. Ceci vous permet de lancer un téléchargement et de vous déconnecter du système, laissant Wget finir le travail. En revanche, la plupart des navigateurs Web requièrent la présence constante de l’utilisateur, ce qui est particulièrement pénible lorsqu’on transfère beaucoup de données.
    Wget peut suivre les liens des pages HTML et XHTML et créer une copie locale de sites web distants, en récréant complètement la structure du site original. Ceci est parfois désigné sous le nom de « téléchargement récursif ». En faisant cela, Wget respecte le standard d’exclusion de robots (/robots.txt). Wget peut aussi convertir les liens dans les fichiers HTML téléchargés pour la consultation locale
    Wget a été conçu pour être robuste en dépit des connexions réseaux lentes ou instables : si un téléchargement échoue suite à un problème réseau, il réessayera jusqu’à ce que l’intégralité du fichier soit téléchargée. Si le serveur supporte la reprise, il lui demandera de reprendre là où le téléchargement s’est interrompu. « 

  • lynx
    • la versionde Cygwin utilisée ici pour documenter ces commandes n’a pas d’entrée de manuel pour Lynx. Néanmoins, on peut en trouver un commentaire détaillé ici : http://www.europe.redhat.com/documentation/rhl6.2/gsg-fr/ch-email.php3
      • Lynx est une sorte de navigateur qui permet de s’interesser spécifiquement au contenu informationnel des pages consultées, sans égard à la mise en forme graphique de ce contenu

      • Voici les premières lignes de la description donnée par la page ci-dessus:

« Qu’est-ce que Lynx ? C’est un navigateur « généraliste » pour affichage en mode texte ; il affiche donc le contenu des pages Web, sans les images. Très rapide, il peut constituer une alternative valable si vous vous intéressez uniquement à la lecture d’information, sans devoir attendre le chargement de graphiques. « 

  • perl

    • acronyme de Practical Extraction and Report Language, le langage interprété perl permet d’opérer des traitements automatisés sur des fichiers textes, à l’aide de scripts perl par exemple

    • Voici une page très bien documentée pour en savoir davantage :

      http://www.cs.cmu.edu/cgi-bin/perl-man

  • sh

    • la commande sh est relative à l’interpréteur de commandes (le shell)

    • dans le cas de Cygwin, le shell est Bash, c’est pourquoi taper ‘man sh’ dans la fenêtre de commande nous indexe vers la page de man de ‘bash’

  • egrep

    • egrep est une commande de recherche de motif(s) dans un texte

    • la commande egrep fonctionne avec des expressions régulières en argument, qui servent à identifier des motifs, que sont les chaînes de caractères contenues dans les fichiers texte

 

> accéder à une partition, un périphérique Windows à partir de Cygwin :

cygdrive/ nom de la partition, du périphérique (ex: cygdrive/c)

 

________________________________________________________________________________

2- Récupération des pages Web à partir d’un moteur de recherche (Google)

Après avoir consulté le contenu des pages Web pour en vérifier la pertinence, on récupère d’un part l’URL à l’aide d’un copié/collé; d’autre part le contenu de la page à l’aide de la commande Fichier > Enregistrer sous. C’est dans le dossier PAGES-ASPIREES, contenu dans l’arborescence mise à disposition par les enseignants, que l’on enregistre les contenus récupérés.
liste des URL:

Ressources:

RELEVE du 23.10.06

>>> emploi du mot ‘barrage’ comme nom Commun

> ‘barrage’ au sens ‘barrage hydraulique’

> ‘barrage’ au sens ‘opposition à quelque chose’

> ‘barrage’ au sens ‘barrage routier’ (barrage routier filtrant…)

> ‘barrage’ au sens ‘barrage antipollution’

> ‘barrage’ au sens ‘barrage d’instrument (piano, guitare…)’

> ‘barrage’ au sens ‘match de barrage’ (usité dans le domaine sportif ou des jeux (échecs…))

>>> emploi du mot ‘barrage’ comme nom Propre

> ‘barrage’ comme titre (film, livre, jeu)

> ‘barrage’ comme nom d’entreprise

>>> Quelques remarques pour une amorce de classement lexicologique
Le mot ‘barrage’, bien qu’il soit davantage représenté dans ce relevé par l’acception ‘barrage hydraulique’, est également attesté pour des emplois spécifiques, tels le barrage ‘de guitare, de piano’, par exemple, ou encore dans le sens particulier de ‘match de barrage’ (qui constitue, semble-t-il, une locution figée).

Il faut remarquer que ‘barrage’ employé comme nom commun est le plus souvent modifié par un Adjectif Relationnel (par exemple ‘routier’, ‘hydraulique’, ‘antipollution’) lorsque le référent est concret, empiriquement existant.

Cependant, comme le montre l’hétérogénéité des sens regroupés dans la catégorie  » barrage comme ‘opposition à quelque chose’ « , une grande variété de sens compositionnels, sont issus de l’association du nom commun ‘barrage’ à un Syntagme Nominal introduit par la Préposition ‘contre’ (‘barrage contre le Front National’, ‘barrage contre le Gouvernement’, ‘barrage contre les insectes’, etc…). Par ailleurs, il est intéressant se remarquer que le sens ‘opposition à quelque chose’ pourrait, en quelque sorte, constituer le sémantème hyperonyme de toutes les autres acceptions de ‘barrage’, qui constitueraient donc des sens dérivés.
Le mot ‘barrage’ est également attesté dans son emploi comme nom propre, dans des titres d’oeuvres cinématographiques, littéraires; c’est également le nom d’au moins un jeu vidéo et d’au moins une entreprise.

A bientôt pour les prochaines étapes de travail!

Marguerite

Publicités

Commentaires fermés sur PED13-ML-‘barrage’

%d blogueurs aiment cette page :