Projet “Multilingue”
Les travaux réalisés dans le cadre du projet dit "MULTILINGUE" sont en ligne sur le site du CRIM rubrique "Travaux des étudiants".
1) Un petit lexique français-anglais économique, constitué à partir de documents numériques traduits du français vers l'anglais. Les termes choisis ont été extraits automatiquement à partir de patrons morpho-syntaxiques, puis triés à la main. La traduction anglaise des termes a ensuite été trouvée à partir d'un tableau dans lequel les documents français et anglais ont été alignés.
2) Un extrait de lexique français-estonien de l'environnement, (à ouvrir avec Mozilla de préférence), constitué à partir de documents traduits du français vers l'estonien. L'extraction des candidats-termes s'est faite à partir de patrons morpho-syntaxiques, puis le lexique a été constitué à partir d'un alignement fin du français et de l'estonien.
3) Un lexique français-anglais de la Formule 1, élaboré grâce à des documents bilingues glanés sur les sites "officiels", puis alignés.
(à suivre)
Répartition des projets 2005/2006
La répartition des projets est faite.
Elle est visible ici : Répartition.
On en reparle le 15/02/2006, date de notre prochain cours.
Commentaires Fermés
le projet multilingue uniquement
J’ai choisi le projet de Jean-Michel Daube parce que c’est le seul projet qui m’intéresse réellement.
Le travail avec des corpus multilingues s’inscrit parfaitement dans le cadre des projets que je voudrais réaliser à l’avenir, à savoir la constitutuion des terminologies multilingues.
Confrontée à des problèmes de traitement des corpus en cyrillique, je serai amenée à les résoudre en découvrant par ailleurs les logiciels de traitement de l’information existants pour la langue russe (équivalents de Lexter, Tree-Tagger, etc).
Qui plus est, n’ayant pas de bonnes connaissances en informatique, je me sens pas vraiment prête à travailler sur les projets demandant certains pre-requis en programmation.
Natalia Kozhina
projet multilingue?
Aussi, point non négligeable – il sera réalisé dans le cadre d’autonomie plus grand que le “mini-projet�, ce qui me réjouit particulièrement.Evguénia Krougovaïa.
mon choix du grand projet.
JOYEUX NOEL ET BONNE ANNEE

cordialement
SAMIA ACHOURI
Le projet de Névéna
A l’Inalco on travaille sur plusieurs langues. Alors, personnellement je trouve plus intéressant et profitable d’étudier les sens des mots dans plusieurs langues. Cela s’avérera utile pour le travail en terminologie, pour la traduction….
Donc, j’ai choisi le projet Multilingue.
Névéna Pantikina
Démarrage des projets MASTER TAL 1, 2005-2006
Début des Projets le 08.12.2005
Présentation (provisoire) des projets sur la page du cours “Projet Encadré”.
Nous ferons dès jeudi prochain (01.12.2005) une première présentation de ces projets vous permettant de choisir le projet qui pourrait a priori vous intéresser. Vous remplirez à cet effet un formulaire précisant votre choix (nous déterminerons ensuite les groupes d’étudiants associés à chacun des 3 projets).
IMPORTANT :
Le formulaire est construit à partir des noms des étudiants inscrits sur la liste PLURITAL (si vous avez reçu ce message vous y êtes inscrits), merci de rappeler à ceux qui ne recevraient pas ce message qu’ils doivent s’inscrire sur cette liste et qu’ils doivent en outre se signaler à SF et BH afin que leur nom soit intégré au formulaire mis en place pour jeudi prochain
Descriptif des projets
Les textes de présentation des projets seront disponibles sur la page du cours. A ce jour, 2 présentations sont déjà disponibles. La troisième le sera d’ici jeudi prochain. Ci-dessous les présentations provisoires déjà disponibles :
- Projet dit “projet Communautés“ animé par Benoît Habert : Dégrouper les sens (corpus sur le web ou corpus de presse). Présentation au format PDF.
- Projet dit “projet Nuages“, animé par Serge Fleury : Nuages de mots dans le Fils RSS
- présentation du projet (texte+slides) : PDF zippé
- site du projet : http://tal.univ-paris3.fr/filspresse/
Les projets seront présentés en détail le 8.12.2005.
Commentaires Fermés



Commentaires Fermés