Résumé
L’analyse des données textuelles (ADT) permet d’explorer et de visualiser les recueils de textes les plus divers : œuvres littéraires, transcriptions d’entretien, discours politiques, dossiers de presse, documents d’archives, enquêtes en ligne avec questions ouvertes, fichiers de réclamations, sondages de satisfaction. Le présent ouvrage procède à une présentation rigoureuse des méthodes de l’ADT, qui combinent statistique exploratoire, visualisations, procédures de validation quantitative et approche qualitative (retour au texte). Plaçant le texte au centre de l’analyse, l’ADT répond pleinement aux attentes des humanités numériques. Plusieurs niveaux de lecture sont possibles : les développements plus techniques paraissent dans des encadrés, tandis que des programmes illustratifs simples (en Python et R) sont donnés en annexe. Le propos est systématiquement illustré par des applications concrètes issues de corpus variés (données d’enquête, romans, discours politiques) et réalisées avec des logiciels en libre accès.Ludovic Lebart, ex-directeur de recherche au Centre national de la recherche scientifique (CNRS), est statisticien et enseignant- chercheur à Télécom ParisTech. Ses sujets de recherche sont la statistique multidimensionnelle, la qualité des enquêtes socio- économiques, l’inférence statistique en analyse des données et les logiciels d’analyse des données qualitatives et textuelles. Il est l’auteur de nombreux livres sur ces thèmes traduits en plusieurs langues.Bénédicte Pincemin est chargée de recherche en linguistique au CNRS, au sein de l’Institut d’histoire des représentations et des idées dans les modernités de l’École normale supérieure de Lyon. Elle est membre du projet Textométrie, qui développe le logiciel TXM. Ses travaux portent sur la modélisation de la textualité et de l’activité interprétative pour l’analyse sémantique de corpus.Céline Poudat est linguiste et maître de conférences en analyse du discours à l’Université Côte d’Azur à Nice. Elle étudie les typologies textuelles et les genres de la communication médiée par les réseaux, qu’elle explore avec les méthodes de l’analyse de données textuelles et de la linguistique de corpus. Elle codirige le consortium national français Corpus, Langues et Interactions.
Auteur
-
Ludovic Lebart, ex-directeur de recherche au Centre national de la recherche scientifique (CNRS), est statisticien et enseignant- chercheur à Télécom ParisTech. Ses sujets de recherche sont la statistique multidimensionnelle, la qualité des enquêtes socio- économiques, l’inférence statistique en analyse des données et les logiciels d’analyse des données qualitatives et textuelles. Il est l’auteur de nombreux livres sur ces thèmes traduits en plusieurs langues.
-
Bénédicte Pincemin est chargée de recherche en linguistique au CNRS, au sein de l’Institut d’histoire des représentations et des idées dans les modernités de l’École normale supérieure de Lyon. Elle est membre du projet Textométrie, qui développe le logiciel TXM. Ses travaux portent sur la modélisation de la textualité et de l’activité interprétative pour l’analyse sémantique de corpus.
-
Maître de conférences à l’Université de Nice Côte d’Azur, Céline Poudat travaille depuis une quinzaine d’années en analyse du discours, en mobilisant les méthodes quantitatives de l’analyse de données textuelles et de la linguistique de corpus. Des textes scientifiques aux narrations de soi, en passant par des formes de communication médiée par les réseaux, elle a ainsi parcouru différents genres et types de discours qui lui ont permis de développer des compétences méthodologiques solides en matière d’exploration de corpus. Elle a coordonné le groupe de travail « Exploration de corpus » du consortium « Corpus écrits » de la Très Grande Infrastructure de Recherche sur les Humanités Numériques.
Auteur(s) : Ludovic Lebart, Bénédicte Pincemin, Céline Poudat
Caractéristiques
Editeur : Presses de l'Université du Québec
Auteur(s) : Ludovic Lebart, Bénédicte Pincemin, Céline Poudat
Publication : 7 août 2019
Support(s) : Livre numérique eBook [ePub], Livre numérique eBook [PDF]
Protection(s) : Marquage social (ePub), Marquage social (PDF)
Taille(s) : 6,82 Mo (ePub), 11,4 Mo (PDF)
EAN13 Livre numérique eBook [ePub] : 9782760550544
EAN13 Livre numérique eBook [PDF] : 9782760550537
EAN13 (papier) : 9782760550520