Un corpus international pour l'étude du langage SMS

L’objectif du projet sms4science est de contribuer à l’étude de la communication par SMS ("SMS", "txt", "texto", etc.) et à l’étude du langage qu’elle véhicule. Pour y parvenir, des chercheurs de plusieurs pays s’associent afin d’entreprendre la constitution, pour un grand nombre de langues, de vastes corpus de SMS pour la recherche scientifique.

Ce projet est coordonné par le Centre de Traitement Automatique du Langage de l'Université catholique de Louvain, en Belgique. Cette coordination a été soutenue financièrement par Belgacom (désormais Proximus), mécène du projet.

Le projet international

Le réseau international de collaborateurs est coordonné par l’Université catholique de Louvain (Belgique). Une équipe de chercheurs assure la coordination des différents projets nationaux dans le but de rendre possible la création de corpus comparables dans les différentes langues et variantes régionales. Chaque projet national est placé sous la responsabilité d’une équipe universitaire. Un responsable national assure la liaison avec l’équipe belge de coordination.

Obtenez le corpus