- From at , 10h-12h
Event place Sorbonne Université, Ilot Champollion, Salle Grec 1, 16 rue de la Sorbonne , Paris 75005, Paris
Le prochain Séminaire doctoral CERES (Centre d’expérimentation en méthodes numériques pour les recherches en SHS) aura lieu le mercredi 8 juin prochain de 10h à 12h en salle Salle Grec 1, 16 rue de la Sorbonne. La salle est située au 1er étage de l’Ilot Champollion.
Pour cette seconde séance nous vous proposons de nous réunir autour de la thématique suivante : “La donnée au prisme du geste” : Quels enjeux pour la collecte et le statut des (méta)données dans la constitution d’un corpus de thèse ? Quel geste, quel outil et quelle méthode employer ? Quels contraintes disciplinaires et quels biais cela implique-t-il ?
A cette occasion, nous aurons le plaisir d’écouter deux présentations en Traitement automatique des langues et en Sciences de l’Information et de la Communication, par Caroline Parfait, doctorante ObTIC, STIH et SCAI, et Thaïs Barbosa de Almeida, doctorante EHIC Université de Limoges et ATER au GRIPIC Celsa Sorbonne-Université.
Pour rappel, ce séminaire interdisciplinaire ne nécessite pas de connaissances préalables ni même d’un programme de thèse impliquant le recours aux méthodes numériques. Il concerne tout·e·s les doctorant·e·s soucieux et soucieuses de partager leurs questions de recherche mobilisant les méthodes numériques ou leurs interrogations sur la pertinence à mobiliser ou pas ces méthodes.
Le nombre de participant·e·s est limité en raison de la capacité d’accueil de la salle alors ne tardez pas à vous inscrire.
—
Caroline Parfait, “Des formats de données pour mes sources : un casse-tête ?!” :
La formation des corpus de textes anciens et leur exploitation informatique, passe par l’élaboration d’une chaine de traitement adéquate et adaptée aux différents formats des documents, mais aussi aux différents formats des données que l’on souhaite traiter en entrée, puis récupérer en sortie. Je vous propose, par le prisme de mon travail de thèse, qui porte sur l’évaluation des systèmes de reconnaissance d’entités nommées sur des textes anciens, de plonger dans les abimes du choix des formats et des structures de données.
Thaïs Barbosa de Almeida, “La discussion politique sur Twitter : données et enjeux de la recherche en SIC”
La polarisation politique autour de la mise en prison de l’ancien président Lula au Brésil est au cœur de notre sujet de thèse. Les discussions sur Twitter à ce sujet constituent, en plus de matériaux de presse, notre corpus de travail. Des questions méthodologiques allant de la collecte à l’examen des données se sont imposées à travers l’analyse des tweets. Le but de cette communication est de présenter nos choix d’analyse tout en les questionnant à partir d’une approche en Sciences de l’Information et de la Communication.