Atelier 2010-2011

L’histoire et l’historien-ne face au quantitatif

Depuis quelques années, cet atelier est réellement un atelier, c’est-à-dire que les séances sont très peu thématiques et très fortement centrées sur la présentation et discussion collective des travaux en cours des participants. Aussi le programme se limite-t-il à indiquer les dates des séances. Si vous envisagez d’assister à tout ou partie du séminaire, merci de nous écrire pour nous l’indiquer, en particulier si vous voulez y présenter votre recherche.

Atelier ouvert à tous, organisé par Claire Lemercier et Claire Zalc, chargées de recherche au CNRS (CSO et IHMC).

Du 9 novembre 2010 au 8 février 2011 – durée totale : 24 heures, validation possible dans le cadre de différents masters (nous consulter). Les étudiants en master Histoire de l’EHESS sont prioritaires, mais tous les autres, en master, thèse ou pas du tout, là ou ailleurs, sont bienvenus.

Le séminaire a lieu le mardi de 9 h 00 à 12 h 00, à l’ENS, 45 rue d’Ulm, 75005 Paris, salle de l’IHMC.

Se rendre à la salle : entrer dans le bâtiment principal, prendre le couloir de gauche, monter au 3^e étage de l’escalier D, entrer dans l’IHMC, prendre à gauche au niveau de la machine à café : la salle est au fond du couloir.

Présentation

Cet atelier, ouvert à tous, se propose d’accompagner les étudiants – et chercheurs intéressés – dans l’utilisation des techniques quantitatives en histoire. Il s’agit, aussi parallèlement, d’évoquer les débats liés à ces usages. L’objectif de cet atelier d’initiation est de discuter ensemble des différents usages possibles de la quantification dans la pratique historique, des atouts et des limites de ces approches mais également de présenter les possibilités heuristiques offertes par l’analyse statistique dans l’écriture historienne. Nous aimerions y susciter une réflexion sur la place du quantitatif dans les différents champs de l’histoire.

À cette fin, l’atelier, organisé sous forme de demi-journées de travail, évoquera à la fois les problèmes généraux (choix de corpus, échantillonnage, saisie, codage, représentations graphiques...) et les techniques de quantification (analyses textuelles, factorielles, régressions, analyses de réseaux, event history analysis...), à partir d’exemples concrets tirés des travaux en cours des participants.

Programme

Les thèmes, qui seront annoncés à l’issue de la première séance, ne sont qu’indicatifs, les séances s’organisant avant tout autour des présentations de recherches en cours par les participants ou, occasionnellement, par des invités. Toutefois, les questions « techniques » sur chaque thème sont particulièrement bienvenues lors de la séance correspondante.

9 novembre 2010 : introduction, élaboration collective du programme du séminaire ; présentations d’Hélène Frouard et d’Anton Perdoncin. Thèmes indicatifs : analyse de dossiers de personnel ; utilisation d’enquêtes logement de l’INSEE

23 novembre 2010 : présentations de Yannick Beaulieu et de Joel Glasman. Thèmes indicatifs : prosopographie, analyse des correspondances (ACM) ; études de dossiers de personnel, catégories coloniales.

7 décembre 2010 : présentations de Diana Sanz Roig et de Mathilde Rossigneux-Méheust. Thèmes indicatifs : exploitation d’une base de données sur la réception littéraire, réseaux ; saisie de registres d’institution : échantillonnage notamment.

4 janvier 2011 : présentations d’Ariane de Saxcé, de Celia Keren et d’Annick Lacroix. Thèmes indicatifs : saisie à partir de sources archéologiques, constitution de corpus à partir de sources multiples.

11 janvier 2011 : présentations de Muriel Cohen et de Pierre Gilbert. Thèmes indicatifs : saisie et exploitations de dossiers de logements, trajectoires résidentielles.

18 janvier 2011 : présentations d’Anaïs Albert et de Thomas Grillot. Thèmes indicatifs : saisie, premiers traitements.

1er février 2011 : présentations de Delphine Diaz, de Camille Fabre et d’Anne-Sophie Lorin. Thèmes indicatifs : données longitudinales ; de la saisie au traitement quantitatif ; représentation de réseaux.

8 février 2011 : présentations de Sophie Cinquin et de Cédric David. Thèmes indicatifs : lexicométrie et traitement quantitatif de textes littéraires / logements et trajectoires résidentielles, régression logistique, event history analysis.

Compte rendu de l’atelier (réalisé à la demande de l’EHESS)

Depuis quelques années, ce séminaire fonctionne résolument comme un atelier : les séances sont très peu thématiques et très fortement centrées sur la présentation et la discussion collective des travaux en cours des participants. C’est au fil de ces présentations que se constituent collectivement un ensemble de recommandations pour l’usage du quantitatif dans des travaux qui portent sur des sources écrites, à partir desquelles le chercheur – qu’il soit historien ou archéologue, sociologue, politiste, etc. – constitue lui-même sa base de données. Cette année, ont ainsi été discutés les travaux en cours d’Anaïs Albert, Yannick Beaulieu, Sophie Cinquin, Muriel Cohen, Cédric David, Delphine Diaz, Camille Fabre, Hélène Frouard, Pierre Gilbert, Joel Glasman, Thomas Grillot, Celia Keren, Annick Lacroix, Anne-Sophie Lorin, Anton Perdoncin, Mathilde Rossigneux-Méheust, Diana Sanz Roig et Ariane de Saxcé.

Bien en amont de l’usage même de logiciels de statistiques, nombre des séances ont porté avant tout sur la sélection d’un corpus pertinent (questions d’échantillonnage et de mise en œuvre de comparaisons), la constitution de grilles de saisie adaptées soit à une source principale, soit à un ensemble de sources disparates, ou encore les avantages comparés de l’utilisation, pour la saisie, d’un tableur ou d’un gestionnaire de bases de données. Les données longitudinales, avec leurs chausse-trapes particulières, liées par exemple à l’admission répétée des mêmes patients dans des services hospitaliers ou aux déménagements de familles entre différents logements, ont particulièrement fait l’objet de ces discussions sur l’échantillonnage et la saisie. Nombre des travaux présentés adoptant une démarche prosopographique, les questions classiques qui lui sont associées ont également été abordées : comment échantillonner dans le cas où l’on travaille sur une fonction bien définie mais qui concerne un groupe trop vaste pour être étudié en détail ; comment opérationnaliser la définition d’un groupe plus incertain, associé à un engagement politique ; comment faire avec une information très inégale selon les individus.

L’étape du pré-traitement des données et notamment du codage a donné lieu à des débats passionnés, qu’il s’agisse par exemple de discuter de la pertinence d’un codage des noms de famille dans le cadre d’une étude sur la discrimination, de l’identification de fratries dans des données massives portant sur des enfants, ou encore des manières de rapprocher des sites archéologiques à partir des objets qui y avaient été retrouvés.

En termes de méthodes, nous avons particulièrement abordé cette année l’analyse des correspondances multiples, en particulier dans l’optique de dégager de grands profils à l’intérieur d’une masse de données ; l’analyse de réseaux, principalement pour les visualisations qu’elle pouvait suggérer tant à propos de transactions commerciales que de correspondances littéraires ; et les différentes méthodes d’analyse du discours, à propos d’un corpus d’épîtres dédicatoires.