Les commandements de la prosopographie

Ce texte représente une annexe à Claire Lemercier et Emmanuelle Picard, "Quelle approche prosopographique ?" à paraître in Philippe Nabonnand et Laurent Rollet, Biographie et prosopographie, Nancy, Presses universitaires de Nancy, 2011.

On trouvera une version intégrale au format pdf (texte principal + la présente annexe) sur


 

La bonne structuration de l’information, si l’on veut que la prosopographie soit intimement liée à des hypothèses de départ et permette notamment de les discuter par la production de typologies et de quantifications – et qu’elle ne se limite donc ni à une « métasource » en attente du travail d’un chercheur du futur, ni à une notice rédigée non systématique, reste en partie à inventer.

Nous ne prétendons pas proposer ici un manuel de prosopographie, principalement parce que nous affirmons justement qu’il n’existe pas de fiche-type applicable à tout sujet : les choix de corpus, de questionnaire, éventuellement d’échantillonnage doivent être adaptés tant aux problématiques de recherche qu’aux sources disponibles. Il est toutefois possible de dégager, à partir des pratiques, quelques recommandations très générales, et surtout des erreurs à éviter. Le portail prosopographique de l’Université d’Oxford fournit en la matière des éléments bien utiles1, même s’ils partent du cas de l’histoire médiévale et s’inscrivent donc dans un contexte de sources relativement limitées en nombre. Et bien sûr, rien ne remplace la lecture des travaux déjà réalisés pour la recherche de modèles et de contre-modèles... Risquons toutefois une liste de « commandements », à prendre avec la distance nécessaire. Les quatre premiers sont spécifiques de la prosopographie et se rapportent à la définition de son projet même. Les quatre suivants représentent plutôt l’adaptation au cas de la prosopographie de conseils plus généraux et d’ordre plus pratique sur la construction et le traitement de bases de données historiques2.

 

1. Prévoir un projet d’une ambition raisonnable (ou au moins à géométrie variable), visant à répondre à quelques questions précises, même si on espère aussi qu’il puisse servir à d’autres. La création de l’Agence nationale de la recherche, avec ses financements destinés à des projets qui doivent produire quelque chose de tangible, semble faire revivre la tentation, pourtant déjà expérimentée dans les années 1970 tant en France qu’en Angleterre, d’énormes entreprises collectives fondés sur une division minutieuse des tâches et visant à fournir des « outils pour la recherche » plus qu’à produire directement de la recherche. Le destin de la première génération de ces projets n’incite pas à reproduire ce modèle3. Dans le cas du dictionnaire de la faculté des sciences de Paris, nous avons prévu un travail collectif avec une équipe très large, mais avec, en contrepoids, des consignes très précises, afin de permettre la construction d’une base de données homogène fondée sur un nombre réduit de sources prioritaires et cherchant à être systématique sur certaines informations ; en contrepartie, les contributeurs ont la possibilité de s’exprimer plus à leur guise dans des notices rédigées de dictionnaire dont la forme est très libre, mais qui constituent un complément et non le cœur de la base de données.

 

2. Préciser autant que possible en amont les questions que l’on se pose – sans qu’elles soient, bien sûr, exclusives les unes des autres. Mesure de la taille du groupe et/ou de sous-groupes en son sein ? Description de traits généraux ou élaboration d’une typologie interne ? Homogénéité ou diversité du groupe ? Groupe « pour soi », cohésif, ou regroupement d’individus hétéroclites ou de factions opposées ? Modalités de recrutement, d’accès au groupe, origines des individus ? Liens entre membres, ou avec l’extérieur ? Destins, carrières, dans le groupe ou menant vers l’extérieur ? Mesure et explication de différences de « succès » au sein du groupe ? Mise au jour de ses règles de fonctionnement, de ses normes propres de succès ?... Penser particulièrement à des formulations de ces questions en termes de comparaisons, internes et externes au groupe à étudier. Pour la faculté des sciences, les questions portent notamment sur les différences internes entre statuts d’enseignants (suppléants, adjoints, maîtres de conférences, professeurs avec ou sans chaire...), les modalités du passage d’un statut d’enseignant à l’autre, les carrières hors de la faculté (avant, après ou en même temps, les cumuls d’activité étant nombreux) et notamment les différences entre types de carrières selon les générations (deviennent-elles plus standardisées ?) et les disciplines.

 

3. Définir le ou les groupes d’individus à étudier et le questionnaire à leur appliquer à la fois en fonction de ces questions et des sources disponibles. Ne pas hésiter à définir plusieurs groupes, emboîtés, sécants ou distincts, ni à procéder par échantillonnage. Essayer de ne pas céder à la réification du groupe obtenu, dont les frontières sont toujours peu ou prou définies par le chercheur. Ainsi, les analyses factorielles et les analyses de réseaux produisent souvent des résultats en termes de « centre » et de « périphérie » ; mais ceux-ci sont toujours en partie déterminés par les frontières assignées au préalable au groupe étudié. Ceux qui sont périphériques selon une définition du groupe peuvent se retrouver plus au centre dans une autre, plus large ou décalée. On a ainsi vu que le groupe « enseignants de la faculté des sciences » n’était pas simple à définir et s’étendait bien au-delà des professeurs titulaires.

Le plus simple et efficace est, dès lors, pour tout groupe saisi par l’opération prosopographique, de définir une caractéristique ou un ensemble réduit de caractéristiques qui constitueront un critère d’inclusion ou d’exclusion, un pivot, un axe qui sera le cœur commun à chacun de ses membres et autour duquel pourront s’ordonner toutes les configurations possibles des autres caractéristiques. Ainsi, c’est sur la base de leur seule participation aux revues scientifiques que sont retenus les scientifiques autrichiens, dans une étude comparée des trajectoires et des caractéristiques sociales des exilés politiques et de ceux qui restent en Autriche après l’Anschluß : il s’agit d’une définition du monde scientifique non pas parfaite, mais facile à objectiver et raisonnablement adaptée à l’objet de la recherche4. Ce plus petit dénominateur commun peut ne représenter qu’une partie très minime des activités des individus concernés – ainsi dans le cas d’Ampère, qui ne fait que passer à la faculté des sciences, alors qu’on en sait par ailleurs bien plus sur lui que sur beaucoup d’autres enseignants. C’était l’une des difficultés rencontrées par Luc Boltanski dans son étude du corps enseignant de l’IEP de Paris, fondatrice pour la prise au sérieux des positions de cumul en prosopographie ; il s’agit en effet presque exclusivement d’enseignants vacataires5. Pourtant, les considérer comme un groupe, pour les décrire, les classer et les compter, peut avoir un sens ; de toute façon, il peut parfois être difficile de déterminer quelle est l’activité principale d’un individu qui occupe une situation multipositionnelle. Le pivot choisi pour une prosopographie n’en est pas moins d’une importance extrême, puisqu’il contribue à conditionner la problématique, inévitablement liée à la construction de la base de données.

Définir un groupe comme terrain d’étude à partir de tel ou tel critère simple n’implique pas pour autant de postuler la cohérence de ce groupe, qui reste au contraire une question de recherche ouverte. Il ne s’agit pas non plus de négliger les informations sans relation directe avec la fonction pivot : au contraire, les prendre en compte permet de s’interroger sur le mode de fonctionnement, de construction, de structuration, sur les effets de concurrence… qui concernent cette activité pivot, à la lumière des autres positions occupées. Dans cette perspective, il est nécessaire de considérer sans a priori tous les individus qui, même très furtivement, ont occupé la fonction en question. Il sera alors possible de faire l’histoire de cette fonction-position (d’en comprendre le fonctionnement, les règles du jeu et leurs évolutions), notamment en étudiant les configurations « à succès » comme celles qui n’aboutissent pas. On a donc affaire à un arbitrage délicat entre se centrer, par exemple, sur une institution pour définir un groupe à étudier et ne pas s’en tenir à cette institution pour prendre en compte les autres aspects des parcours de ses membres. Ainsi, François Gasnault, étudiant les universitaires bolognais du xixe siècle, limite ses investigations à des catégories de sources directement liées à leur présence au sein de l’université, sans élargissement à d’autres dimensions biographiques. Il regrette en conclusion de ne pas pouvoir traiter des « innombrables connexions qui unissent [le groupe] à d’autres réseaux institutionnels »6, jetant l’éponge devant une tâche trop complexe. Elle l’est certainement si l’on se fixe pour objectif d’envisager toutes les connexions possibles ; mais rechercher systématiquement certains cumuls ou certaines circulations précises, par exemple, peut offrir un gain important au prix de dépouillements limités.

 

4. Distinguer, en fonction des questions et des sources, les informations que l’on va chercher à obtenir de façon la plus systématique possible (par exemple : cet individu est-il ou non docteur ? dans quelle discipline et quand a-t-il soutenu sa thèse ?) et celles que l’on accepte de n’obtenir qu’au cas par cas, pour enrichir telle ou telle biographie, mais qui ne permettront pas des comptages ou comparaisons systématiques.

Bien sûr, l’exhaustivité n’est pas toujours possible, mais il faut distinguer les informations pour lesquelles on va chercher à s’en approcher (et penser aux sources appropriées pour ce faire : listes de membres d’une institution, de nominations, de diplômes, catalogues de bibliothèques...) et celles pour lesquelles on y renoncera. La recherche d’informations raisonnablement exhaustives sur certains points conduit souvent à avoir recours à des sources susceptibles de nous renseigner sur un grand nombre des individus étudiés (telles que des listes) plutôt qu’à des sources « biographiques » propres à chaque individu, pour lesquelles l’exhaustivité est bien plus rare et le temps de recherche plus long. Penser à de telles sources de type « liste » permet aussi souvent d’obtenir une information minimale sur tous les individus qui ont rempli la fonction pivot, même les plus obscurs, et donc de les traiter avec les plus célèbres.

Même si l’on ne peut pas recourir à ce type de sources, se poser la question de l’exhaustivité recherchée ou non pour chaque type d’information est essentiel et conduit en particulier à préciser le statut des cases vides dans une base de données : représentent-elles un « non » (cet individu n’a pas de thèse, de façon raisonnablement certaine) ou une absence d’information ? L’ambiguïté sur le statut de ces cases vides est source d’erreurs graves dans les phases de traitement quantitatif. Dans le cas de la faculté des sciences, l’essentiel de l’effort de l’équipe qui anime l’enquête pour proposer des consignes aux autres collaborateurs a porté sur ce point. La priorité a notamment été placée du côté de la formation (diplôme) et de la carrière, au moins dans la fonction publique (succession précise des postes occupés), et donc des sources correspondantes (dossiers de carrière, mais aussi listes d’agrégés, de polytechniciens...).

 

5. Saisir au plus près de la source, pour éviter d’en perdre les nuances (on n’en est plus au temps où tout devait être résumé en 8 caractères pour des raisons de mémoire des ordinateurs !), et seulement dans un second temps regrouper les informations dans un même fichier, puis éventuellement les coder pour une exploitation statistique. Il serait ainsi réducteur de déterminer a priori les disciplines dont relève une chaire de faculté au xixe siècle, les frontières disciplinaires étant extrêmement mouvantes à l’époque. Ce parti-pris initial aurait même un effet contre-productif, interdisant aux chercheurs de comprendre les modalités des recompositions du champ scientifique. Il convient donc que l’intitulé exact de chaque chaire, voire sa formulation différente dans des sources simultanées, soit reproduit très exactement. Plus généralement, il faut bien distinguer les questions que l’on se pose, c’est-à-dire le questionnaire idéal que l’on voudrait remplir lorsqu’on commence une recherche, des masques de saisie employés concrètement pour structurer les informations issues de chaque source. Il sera toujours temps ensuite, au stade du codage, d’évaluer à quel point les informations des sources peuvent se plier au questionnaire idéal de départ et à quel point ce dernier doit évoluer.

Ne pas appauvrir, donc, le détail de l’information au moment de la saisie : en général, réfléchir à ce que l’on ne va pas saisir prend autant que temps que saisir un peu plus de précisions... « What we thought was unimportant, or what we did not consider at all, will always come back to haunt us. »7 En particulier, puisqu’il est question d’histoire, ne pas sacrifier les dates (par exemple, dater les moments où un individu habite à telle adresse, déclare telle profession... et préciser selon quelle source). Elles peuvent notamment être cruciales pour les interprétations en termes de causalité :

If, for instance, we find a correlation between men having successful careers in public administration and marriages with women from the upper classes, it does not necessarily imply a causal connection. It may be that they owed their career to their marriage, or it may be that the marriage was made possible by their career. Chronology is, of course, fundamental in solving such questions. The risk of losing sight of such chronologies is not imaginary, due to the thematic approach of many prosopographies8.

Dans le cas de la faculté des sciences, les dates de nomination au jour près sont ainsi saisies, lorsqu’elles sont connues, ainsi que l’intitulé exact des positions occupées à chaque étape de la carrière. De nombreux espaces sont prévus pour les « observations » qui n’entrent pas dans les cases définies au départ.

Toujours conserver la trace de l’origine de chaque information, afin de s’autoriser des repentirs et des arbitrages entre sources contradictoires – et, plus positivement, l’étude de ce que ces contradictions nous disent des représentations des acteurs.

Pour plus de précisions pratiques, voir la rubrique Saisie du présent site !

 

6. Pour résumer le message essentiel des spécialistes de bases de données, sans entrer dans des détails techniques : segmenter l’information au maximum. Informatiquement et intellectuellement, il est toujours plus facile, a posteriori, de la regrouper que de l’éclater. Plutôt que de créer une fiche, ou une ligne de saisie, par individu, penser, dans bien des cas, à une structuration autour d’événements, de liens, d’épisodes... (selon les sources). Ainsi, pour la faculté des sciences, une grande partie de la base de données est structurée en « épisodes » représentant en quelque sorte des atomes de carrière, et caractérisés par le numéro de l’individu concerné, des dates de début et de fin, une institution, un lieu, un statut et le cas échéant d’autres précisions, comme un intitulé de chaire. Tout changement de statut, d’affectation, d’intitulé, etc. ouvre un nouvel épisode. Ceux-ci peuvent bien sûr être simultanés ou successifs pour un même individu. Rien n’empêche ainsi de structurer des données avec une fiche (dans une base de données) ou une ligne (dans un tableur) par épisode plutôt que par individu.

Corollaire, et second message plus trivial, mais souvent important en pratique : il faut attribuer un numéro aux individus étudiés (plus facile à taper sans erreur qu’un nom propre) pour les repérer dans des fichiers qui peuvent être structurés par source, par événement, par lien ou par épisode plutôt que par individu, ou bien où des individus peuvent se retrouver dans des fiches de saisie provisoire issues de plusieurs sources différentes.

 

7. Quel que soit l’outil choisi pour la saisie, veiller à ce que les informations soient aisément transférables d’un logiciel à un autre, d’une part pour permettre d’éventuels projets collectifs ou cumulatifs, d’autre part parce que ce sont rarement les mêmes logiciels qui permettent efficacement de saisir, de décrire, de classer et de compter. Même si un tableur, en particulier, peut s’avérer très souple, il est presque certain qu’il ne sera pas suffisant pour tous les usages envisagés. Veiller également à ne pas dépendre totalement d’un.e informaticien.ne, même bien intentionné.e, et surtout à ne pas avoir un « masque de saisie » figé dès le départ. Des modifications seront forcément nécessaires en cours de travail, à mesure que l’on découvrira chaque source. Les outils les plus simples sont souvent préférables de ce point de vue aux plus chers et sophistiqués9. Pour la faculté des sciences, la saisie initiale se fait dans un tableur pour chaque participant à l’enquête, même si la base sera ensuite mise en ligne grâce à un outil de gestion de bases de données et exploitée dans des logiciels de statistiques.

 

8. Lire des travaux réalisant, à partir d’opérations prosopographiques, d’autres traitements que les classiques comptages ou typologies ad hoc, pour décider si ces traitements pourraient répondre aux questions que l’on se pose, et le cas échéant prendre le temps de s’y former ou de trouver un.e collaborateur.trice compétent.e pour les appliquer. Sans entrer ici dans les détails, - que vous trouverez dans les autres rubriques de ce site -, on peut citer :

  • les apports de l’analyse factorielle des correspondances, accompagnée ou non de la classification automatique, pour comprendre les logiques qui organisent la diversité d’un groupe et l’existence de plusieurs profils différents en son sein, et notamment repérer statistiquement les représentants les plus typiques de chacun de ces profils, ce qui permet un retour contrôlé de la prosopographie à la biographie10 ;

  • ceux de la régression multivariée et de l’event history analysis (expression parfois traduite en français par « analyse biographique »), pour évaluer le poids de différents facteurs dans la « réussite » individuelle (définie selon les critères propres au groupe étudié)11 ;

  • ceux de l’analyse de réseaux, pour comprendre comment différents types de liens (familiaux, économiques...) ou d’interactions (citation, collaboration...) structurent un groupe et peuvent contribuer à définir des positions plus favorables que d’autres en son sein, ou permettre de comprendre l’émergence de clivages12 ;

  • ceux de l’analyse de séquences, qui aide à la constitution de typologies fondées sur la succession de postes occupés, de lieux d’habitation, ou sur toute autre séquence temporelle, plutôt que sur des « profils » plus statiques13.

Tous ces traitements sont applicables, s’ils permettent de répondre à un questionnement historique, à n’importe quelle base de données qui aura été structurée en conservant un maximum d’informations (et notamment de dates) des sources et en divisant le plus possible cette information en unités de base.

1 Katherine S. B. KEATS-ROHAN, « Prosopography for beginners. A tutorial », en ligne sur http://prosopography.modhist.ox.ac.uk/tutorial/tutorial_0.htm et K. Keats-Rohan, op. cit., notamment Ralph W. MATHISEN, « Where are all the PDBs ? : The Creation of Prosopographical Databases for the Ancient and Medieval Worlds », K. VERBOVEN et al., art cit. ; l’ouvrage comprend aussi des études de cas très pédagogiques, certaines sur les périodes moderne et contemporaine, dont Christophe VERBRUGGEN, « Literary Strategy during Flanders’s Golden Decades (1880-1914) : Combining Social Network Analysis and Prosopography », et, touchant à l’histoire des techniques, Carolyn DOUGHERTY, « George Stephenson and Nineteenth-Century Engineering Networks ».

2 Ces quatre derniers conseils ont été adaptés et précisés à partir de ceux donnés par Claire LEMERCIER et Claire ZALC, Méthodes quantitatives pour l’historien, Paris : La Découverte, 2008.

3 Il est narré avec humour par R. MATHISON, art. cit. Pour la France, voir Paul-André ROSENTAL (dir.), « Pour une histoire de la recherche collective en sciences sociales », Cahiers du CRH, octobre 2005.

4 Christian FLEXJ and Dirk RAITH, « Emigré Social Scientists from Austria : A Prosopography », in Janusz MUCHA, Dirk KAESLER and Wlodzimierz WINCLAWSKI (éd.), Mirrors and Windows. Essays in the History of Sociology, Torun : Nicholas Copernicus University Press, 2001, pp. 208-218.

5 Luc BOLTANSKI, « L’espace positionnel : multiplicité des positions institutionnelles et habitus de classe », Revue française de sociologie, 1973, Vol. 14, n° 1, pp. 3-26. L’article montre la fécondité d’une approche positionnelle, qui prend en compte la multiplicité des positions occupées par un individu, afin de mesurer sa surface sociale ; mais il ne prend pas en compte la variable temporelle, c’est-à-dire les transformations de cette surface sociale ou la succession des surfaces sociales d’un même individu.

6 François GASNAULT, « Le milieu universitaire à Bologne au xixe siècle. Les aléas de l’enquête documentaire prosopographique », Mélanges de l’Ecole française de Rome. Moyen-Age, Temps modernes, n° 1, vol. 100, 1988, pp. 155-173.

7 R. MATHISEN, art. cit.

8 K. VERBOVEN et. al., art. cit.

9 Pour vous en convaincre, voir le schéma sous-titré « Don’t try this at home ! » de R. MATHISON, art. cit., qui revient aussi sur les contraintes du codage dans les années 1970 et les raisons, aujourd’hui, de ne pas coder trop tôt...

10 Voir par exemple Frédéric LEBARON, « La dénégation du pouvoir. Le champ des économistes français au milieu des années 1990 », Actes de la recherche en sciences sociales, n° 119, septembre 1997, pp. 3-26 et Björn-Olav DOZO, « Données biographiques et données relationnelles », ConTEXTES, 3, juin 2008, http://contextes.revues.org/index1933.html

11 Voir par exemple Anne-Sophie BRUNO, « L’attribution des cartes de commerçants étrangers. Le cas des indépendants tunisiens (1978-1982) », in Anne-Sophie BRUNO et Claire ZALC (dir.), Petites entreprises et petits entrepreneurs étrangers en France (xixe-xxe siècle), Paris : Publibook Université, 2006, pp. 63-82 et Jérôme KROP, Claire LEMERCIER et Pierre SCHERMUTZKI, « Relations sociales et désignation d’une génération de directeurs d’écoles dans le champ de l’enseignement primaire de la Seine, 1870-1914 », Revue d’histoire moderne et contemporaine, 57-2, 2010, pp. 79-114.

12 Voir par exemple Douglas R. WHITE and H. Gilman McCANN, « Cites and fights : material entailment analysis of the eigtheenth-century chemical revolution », in Barry WELLMAN and Steven BERKOWITZ, Social Structures : A Network Approach, Cambridge : Cambridge University Press, 1988, pp. 380-399 (disponible en ligne sur http://eclectic.ss.uci.edu/ drwhite/pub/Chemical.pdf) ; ou les travaux de Catherine Goldstein sur les réseaux intellectuels du mathématicien Charles Hermite, dans lesquels elle s’intéresse aux différents niveaux de citation nominale que contiennent ses écrits, ce qui lui permet de faire apparaître leur complexité et leur hiérarchisation. Catherine Goldstein, « Les noms de Charles Hermite : prosopographie et biographie scientifique », présentation au colloque « Définir, classer, compter. L’approche prosopographique en histoire des sciences », MSH de Nancy, novembre 2009.

13 Voir par exemple Fabien ACCOMINOTTI, « Creativity from Interaction : Artistic Movements and the Creativity Careers of Modern Painters », Poetics, 37, 2009, pp. 267-294.