Les tableaux croisés dynamiques sous Excel

Comptages, codages, croisement de variables, pourcentages...

Qu’est-ce qu’un tableau croisé dynamique ?

 

C’est la façon dont le logiciel Excel désigne une fonction qui, à l’arrivée, produit tout simplement le genre de tableau qu’on trouve habituellement dans un article d’histoire, ou même de journal, tel que celui-ci :

Activités et périodes d’entrée des membres à la chambre de commerce de Paris (1803-1870)

 

Banquiers

Négociants

Autres

Total

1803-1813

43 %

34 %

23 %

100 %

1814-1831

54 %

26 %

21 %

100 %

1832-1848

16 %

39 %

45 %

100 %

1849-1869

13 %

29 %

58 %

100 %

Total (N = 157)

31 %

31 %

38 %

100 %

Tableau croisé, donc, parce qu’on croise deux variables. « Dynamique », parce que l’intérêt de le faire ainsi, entre autres, c’est que si l’on change a posteriori des données (tiens, finalement, un « Autre » était banquier), le tableau s’actualise en deux clics (clic droit et « Actualiser »). Fonction sympathique dont il ne faut toutefois pas abuser : elle crée un tas de « liens » pérennes entre cellules de pages Excel, voire entre fichiers Excel (car il est possible de faire le tableau dans un autre classeur Excel que celui où se trouve la base). Avec trois inconvénients :

- la taille des fichiers grandit beaucoup. Si l’on se trouve devant un fichier Excel devenu gigantesque, cela peut être dû à une abondance de tableaux croisés en son sein. Mieux vaut alors abandonner leur aspect dynamique ;
- si l’on déplace le fichier contenant le tableau d’un ordinateur à l’autre, mais pas celui contenant la base, on n’a plus de tableau, puisqu’il doit se référer aux données de la base ;
- le tableau croisé n’est pas aisément modifiable : par exemple, si on veut y changer l’ordre des colonnes ou la présentation, cela déclenche des messages d’erreur.

En réponse à ces problèmes, si l’on veut retravailler le tableau pour le publier, par exemple, mieux vaut le copier-coller ailleurs, en effectuant un « Collage spécial » qui ne récupère que les résultats, mais détruit les formules et les liens correspondants (contrepartie : le tableau n’est plus dynamique, il ne s’actualise plus « tout seul »). Pour cela, copier comme d’habitude, mais au lieu de coller comme d’habitude, choisir « Collage spécial » dans le menu « Édition » et indiquer qu’on ne veut coller que les « valeurs », et non pas les « formules ».

Pour faire disparaître l’aspect dynamique du tableau tout en conservant les résultats, faire ce collage spécial à l’endroit même où se trouve le tableau d’origine.

Comment produire un tableau croisé dynamique ?

Malheureusement, la réponse diffère (et diffère de plus en plus...) entre versions précises d’Excel, supports (Mac ou PC) et entre Excel et Openoffice.org Calc (où le tableau croisé dynamique s’appelle "pilote de données"). Mais vous pouvez regarder différents tutoriels en ligne, qui couvrent à peu près tous les cas. Pour l’heure, nous renvoyons pour partie à des tutoriels faits pour une utilisation d’Excel en entreprise (comptabilité...) et pas dans la recherche, et certains de ces tutoriels incluent de la publicité : nos excuses, et n’hésitez pas à nous signaler de meilleures pistes.

Pour Openoffice.org Calc

Pour Excel, versions anciennes (celles qui ont une barre de petits boutons) : en priorité ce tutoriel-ci, fait par et pour des chercheurs (commencez à « 22h10 » et ignorez la question des pondérations si vous travaillez sur vos propres données ; si vous commencez par le début, vous pouvez travailler sur des données de l’INSEE) ; en complément éventuel, celui-ci.

Pour Excel, versions les plus récentes (celles qui ont un bandeau de très gros boutons). Ce tutoriel est très détaillé, peut-être trop pour une initiation ; pas besoin d’aller au-delà du III-D.

Ces tutoriels appellent quelques remarques complémentaires pour un usage en histoire : 

  • souvent, ils prennent pour exemple l’obtention d’une « Somme » dans les cases du tableau. C’est rarement ce qu’on veut : on va choisir plutôt l’option « Nombre » (et dans certains cas « Moyenne »). Vous verrez sans doute assez clairement à quel moment le faire en suivant le tutoriel ;

  • ils ne prennent pas en compte la fonction très intéressante qui permet d’obtenir automatiquement une extraction des individus de la base concernés par un croisement de variables (cf. ci-dessous). Mais un double-clic y suffit, pour tous les logiciels.

Par ailleurs, si vous utilisez un logiciel de statistiques généraliste (par exemple R assorti de RCommander, que nous recommandons), celui-ci vous fait aussi les tableaux croisés, plutôt plus vite et plus efficacement qu’Excel (par exemple en les assortissant systématiquement de leur khi-deux). Mais bien sûr, il n’est pas très raisonnable d’apprendre à utiliser un logiciel de statistique généraliste si on veut seulement faire des tableaux croisés… d’où l’intérêt d’Excel ou Openoffice.org pour cette étape importante de toute recherche quantitative.

Des utilisations variées et inattendues

Si la fonction « tableau croisé dynamique » est fondamentale pour croiser des variables et réaliser des calculs de pourcentage sur ce croisement, elle peut avoir d’autres utilités. En particulier :

  • si l’on croise une variable qualitative et une variable quantitative, et qu’on choisit « moyenne » plutôt que « nombre », on peut comparer facilement les moyennes entre groupes (par exemple le revenu moyen de différentes professions) sans avoir à calculer séparément chaque moyenne ;
  • utiliser la fonction « tableau croisé » sur une seule variable, ce qui peut paraître paradoxal, permet d’obtenir à peu de frais la liste des intitulés différents présents dans une colonne, avec l’effectif correspondant. Par exemple, si une colonne « profession » contient des intitulés très différents, ce premier comptage peut donner des idées de codage. On peut aussi appliquer ce genre de comptage sur une colonne où l’on a précisément commencé à coder quelque chose : cela permet de faire le bilan de ce premier travail (combien de codes a-t-on utilisés, à combien d’individus les a-t-on appliqués, a-t-on créé des doublons involontaires du fait de variantes d’orthographe... ?). Pour réaliser ces comptages, il suffit de faire glisser l’intitulé d’une même colonne dans les zones « Ligne » et « Données », sans rien mettre dans la zone « Colonne ».
  • si l’on double-clique sur la case donnant l’effectif de tel ou tel croisement de variables (par exemple celui des banquiers entrés en 1803-1813), on obtient une nouvelle feuille dans le classeur, qui reprend les données concernant ces personnes et elles seules. Cela permet des aller et retours rapides et souvent féconds entre comptages et richesse des données nominatives. Pour utiliser à plein cette fonction, il faut sélectionner toutes les colonnes de la feuille contenant les données avant de créer le tableau croisé dynamique. Cette fonction revient à créer un filtre automatique correspondant à chaque croisement possible de modalités des variables considérées.