Corps de l’article

Introduction

Quand on évoque l’évaluation des apprentissages des élèves français en mathématiques, un sentiment de désolation, d’incompréhension, voire de culpabilité advient souvent. En effet, depuis quelques années, les évaluations tant nationales (CEDRE[1]) qu’internationales (PISA, TIMSS) pointent les difficultés récurrentes de ces élèves en mathématiques, leur plus grande anxiété face à cette discipline et, surtout, une corrélation croissante entre inégalités sociales et inégalités scolaires.

Pour essayer de comprendre ce qui se joue en matière d’évaluation en France et pour envisager comment faire évoluer les constats peu réjouissants émanant des évaluations externes, il nous semble indispensable d’étudier les pratiques d’évaluation interne dans les établissements scolaires français en prenant en compte leur contexte (type d’établissement, prescriptions institutionnelles ou locales, etc.) et les spécificités liées à l’ordre d’enseignement (primaire, secondaire, supérieur).

Nous considérons que les recherches à dimension collaborative sont des modalités de recherche particulièrement adaptées à l’étude de ce type de pratique peu étudié (Mons, 2013), dans la mesure où elles permettent de l’appréhender en collaboration avec les enseignants, selon une perspective de développement professionnel et d’exploration scientifique.

Pour étudier et faire évoluer les pratiques d’évaluation en mathématiques au cycle 2 (CP, CE1 et CE2, soit les 1re à 3e années au Québec) de l’élémentaire, nous avons conçu le LéA EvalNumC2, un lieu d’éducation associé[2] pour l’évaluation des apprentissages numériques au cycle 2. Il s’inscrit dans ce type de recherche, que nous qualifierons par la suite de recherche-formation. Cette dénomination permet de revendiquer la double dimension scientifique et formative de ce dispositif, constitutive de la collaboration entre des chercheurs et des praticiens. Nous la distinguons toutefois des recherches collaboratives (Desgagné, 1997) du fait de leur structuration moins formalisée[3].

Dans ce cadre, nous avons travaillé avec deux collectifs[4] d’enseignants constitués au cours des deux premières années de ce projet de LéA, chacun avec ses spécificités et son fonctionnement. Dans cet article, nous souhaitons rendre compte de ces deux expériences de recherche-formation autour des pratiques d’évaluation en mathématiques en nous concentrant sur la composante personnelle[5] (Robert et Rogalski, 2002) des sujets engagés dans de tels dispositifs. En effet, nous avons constaté dans des recherches antérieures (Sayac, 2017a) combien cette composante était déterminante pour étudier leur développement professionnel. Nous avons donc cherché à la problématiser dans son rapport à l’activité collective à travers la théorie de l’activité revue par Engeström (2001).

Dans un premier temps, nous présenterons quelques constats sur l’évaluation scolaire en France, puis nous préciserons les éléments théoriques évoqués pour étudier le développement professionnel en évaluation d’enseignants engagés dans ces recherches-formations. Nous présenterons ensuite des résultats relatifs au développement professionnel des professeurs des écoles (PE) des deux collectifs du LéA en montrant comment la composante personnelle influe sur ce développement.

Contexte français des pratiques d’évaluation et de leur étude

Dans l’introduction d’un rapport du Conseil national d’évaluation du système scolaire (CNESCO, 2014) sur l’évaluation des élèves par les enseignants dans la classe, la présidente Nathalie Mons précise que les pratiques d’évaluation des enseignants français sont peu étudiées :

Les évaluations internes par les enseignants dans la classe, bien qu’au coeur historiquement de l’institution scolaire, et analysées, à travers différents champs scientifiques [...], par des chercheurs s’intéressant à la pédagogie (en particulier aux effets des évaluations sur les apprentissages des élèves), ont suscité peu d’état des lieux des pratiques des enseignants dans leurs classes

p. 7

Quelques résultats ont néanmoins été établis dans le cadre d’enquêtes institutionnelles. Le rapport produit par l’Inspection générale de l’éducation nationale (2013) concernant les pratiques d’évaluation en France a notamment conclu à :

  • Une absence d’objectivité quasi constante : on ne sait pas ce qu’on évalue, les niveaux de performance ne sont pas définis [...];

  • Une absence de différenciation entre évaluation formative et sommative récurrente. Le mélange des deux empêche les enseignants de connaître le niveau des acquis des élèves et donne aux élèves le sentiment d’être en contrôle permanent, ce qui engendre une forme de « stress » pour certains (p. 31).

L’enquête Teaching and Learning International Survey (TALIS; OCDE, 2013) a également pointé quelques caractéristiques françaises autour des pratiques d’évaluation. Elle a notamment témoigné du fait que plus de 90 % des enseignants français usaient d’une grande variété de dispositifs d’évaluation et que 86 % d’entre eux conçoivent leurs propres évaluations (alors que la moyenne des pays enquêtés se situe autour de 68 %).

Nous avons nous-même observé cette grande diversité de pratiques évaluatives lors d’une précédente recherche menée autour des pratiques évaluatives de 25 professeurs des écoles en mathématiques (Sayac, 2017a). Nous avons alors montré combien les tâches évaluatives proposées par ces enseignants étaient d’un faible niveau de complexité et de compétence, et qu’elles correspondaient presque exclusivement à des tâches que les élèves avaient effectuées lors des séances ayant précédé l’évaluation.

La liberté pédagogique accordée aux enseignants français et les pratiques très variées constatées en matière d’évaluation confèrent aux pratiques d’évaluation françaises une caractéristique qui relève de ce que nous avons appelé « l’intime professionnel » des enseignants (Sayac, 2017b). En effet, il semblerait que les enseignants craignent, pour de multiples raisons que nous ne développerons pas ici, de révéler des éléments de leur pratique évaluative à travers leur activité d’évaluation et de dévoiler leur « black box » (Black et Wiliam, 1998). Pour appréhender scientifiquement ces pratiques, il convient donc de convoquer des méthodologies spécifiques, susceptibles de lever les craintes des enseignants et d’installer une « zone interprétative partagée » (Bednarz, 2009) permettant de les étudier dans la réalité de leur réalisation.

Par ailleurs, l’évaluation est une activité professionnelle (Roditi, 2011) qui s’inscrit dans un environnement socialement et professionnellement complexe dont il faut tenir compte afin de mieux comprendre les enjeux pour les différents acteurs concernés (enseignants, parents, élèves, cadres de l’éducation, politiques, etc.). Le sujet-enseignant n’est pas seul à pratiquer cette activité : d’autres acteurs la partagent avec lui, chacun avec ses caractéristiques personnelles et professionnelles, qui dépendent à la fois de ses expériences scolaires en tant qu’élève, parent ou enseignant, et de ses croyances et représentations sur les apprentissages et l’évaluation. Ces caractéristiques relèvent de la composante personnelle des pratiques enseignantes (Robert et Rogalski, 2002) qui, de notre point de vue (Sayac, 2017b), doit davantage être prise en compte lorsqu’on étudie spécifiquement les pratiques évaluatives des enseignants.

En effet, nous estimons que les recherches impliquant chercheurs et praticiens dans une relation de confiance et de collaboration sont les plus à même de produire des résultats scientifiques permettant une connaissance plus fine et une compréhension plus éclairée des pratiques évaluatives des enseignants, telles qu’elles se réalisent dans les classes. De même que pour étudier le développement professionnel en évaluation d’enseignants, il nous semble nécessaire de prendre en compte sa double dimension : individuelle et collective.

Éléments théoriques

Ces constats de variété des pratiques évaluatives et de difficultés à les saisir nous ont amenée à concevoir des recherches-formations sur les pratiques évaluatives en mathématiques qui s’appuient sur des cadres théoriques permettant de les éclairer à la fois scientifiquement et professionnellement.

Pour étudier le développement professionnel des enseignants, nous nous appuyons sur la définition de Mukamurera (2014), laquelle coïncide avec les enjeux formatifs de nos recherches-formations. En effet, cette chercheuse le conçoit comme :

Un processus graduel d’acquisition et de transformation des compétences et des composantes identitaires conduisant progressivement les individus et les collectifs à améliorer, enrichir et actualiser leur pratique, à agir avec efficacité et efficience dans les différents rôles et responsabilités professionnelles qui leur incombent, à atteindre un nouveau degré de compréhension de leur travail et à s’y sentir à l’aise

p. 12

Pour étudier les pratiques évaluatives en mathématiques des enseignants engagés dans nos deux recherches-formations, nous nous appuyons sur le cadre didactique de l’évaluation que nous avons développé (Sayac, 2017b) et que nous présenterons de manière synthétique ci-après.

Nous présenterons également brièvement le modèle d’Engeström (2001), qui nous permet de rendre compte scientifiquement du développement professionnel des enseignants engagés dans nos deux collectifs dans sa double dimension individuelle et collective.

Le CDEPM : un cadre didactique

Nous avons conçu le Cadre didactique de l’évaluation et de ses pratiques en mathématiques (CDEPM), qui est caractérisé par une prise en compte plus effective[6] des contenus mathématiques dans les « faits évaluatifs » (Chevallard, 1986). Il s’inscrit dans la continuité des travaux de Robert et Rogalski (2002) et de Roditi (2011) sur les pratiques enseignantes, mais il intègre des éléments développés dans d’autres cadres et accorde une place importante à la composante personnelle des pratiques d’évaluation. Il prend en compte à la fois des contenus disciplinaires et des réalités professionnelles, ce qui permet de définir une approche plus didactique pour l’étude des évaluations en classe (classroom assessments).

Épisode évaluatif et logique évaluative

Les notions d’épisode évaluatif et de logique évaluative des enseignants sont au coeur de ce cadre spécifique. Elles permettent d’inscrire pleinement l’évaluation dans les processus d’enseignement et d’apprentissages, et d’accorder une place importante à la composante personnelle des enseignants.

Un épisode évaluatif correspond à «  un moment de l’enseignement durant lequel un enseignant se met/est en capacité, de manière formelle ou informelle, de porter des jugements sur l’état de connaissance de ses élèves par rapport à un savoir ou savoir-faire prescrit ou enseigné » (Sayac, 2019, p. 302). Quant à la logique évaluative d’un enseignant, c’est un concept qui permet d’appréhender la rationalité évaluative de cet enseignant, de mieux comprendre et d’étudier son activité d’évaluateur en lien avec les épisodes évaluatifs qu’il propose à ses élèves. Il va sans dire que ce concept, tel que nous le comprenons, intègre volontairement des éléments de la composante personnelle des pratiques d’un enseignant.

Dans ce cadre, c’est l’étude des différents épisodes évaluatifs proposés au cours d’une séquence d’enseignement qui permet de caractériser la pratique évaluative d’un enseignant en mathématiques, en fonction du moment où ils sont proposés, du contenu des tâches évaluatives en jeu, de leur gestion et du contrat didactique s’y rattachant (contrat didactique en évaluation). Cette pratique est pilotée par une logique évaluative appréhendée à partir d’indicateurs retenus pour la décrire, notamment la façon dont l’enseignant conçoit et élabore les différents épisodes évaluatifs qui ponctuent la séquence (ressources utilisées, supports d’évaluation/tests, méthodes), le jugement professionnel et didactique en évaluation ainsi que la notation qu’il adopte.

Jugement professionnel et didactique en évaluation

Le jugement professionnel et didactique en évaluation s’appuie sur les travaux développés en sciences de l’éducation sur le jugement professionnel en évaluation (Mottier Lopez et Allal, 2008), mais il est spécifié aux mathématiques et intègre des notions développées en didactique des mathématiques, telle que la vigilance didactique (Charles-Pézard, 2010). Il est lié à la composante personnelle des pratiques d’un enseignant et dépend :

  • des connaissances mathématiques et didactiques de chaque enseignant et de ses compétences professionnelles en évaluation (analyser les réponses des élèves, les intégrer au processus didactique et effectuer un retour constructif à l’élève, etc.);

  • de facteurs individuels (croyances et représentations sur les apprentissages, sur l’évaluation, expériences évaluatives).

Dans ce cadre, le développement professionnel d’un enseignant peut être appréhendé à travers l’évolution des éléments constitutifs de sa logique évaluative, notamment la façon dont il conçoit ses évaluations, note les productions de ses élèves et émet des jugements évaluatifs. La confrontation des croyances et représentations des enseignants sur l’évaluation ainsi que les échanges entre les différents acteurs au sein de collectifs d’enseignants contribuent, de notre point de vue, à leur développement professionnel. En effet, ces confrontations et échanges visent à améliorer, à enrichir et à actualiser la pratique évaluative des enseignants, mais aussi à mieux la comprendre. Ainsi, ils se sentent plus à l’aise pour évaluer les acquis en mathématiques de leurs élèves (Mukamurera, 2014).

Pour rendre compte du développement professionnel des enseignants engagés dans les recherches-formations étudiées dans cet article, mais aussi de celui de la chercheuse, qui a entre autres conçu et animé ces recherches-formations, le cadre d’Engeström (2001) paraît particulièrement adapté, dans la mesure où il se fonde sur l’expérience subjective des acteurs en situation.

La théorie de l’activité revue par Engeström, mais actualisée sur le développement professionnel

La théorie de l’activité (TA) appréhende l’activité humaine à partir d’objets visés par des acteurs qui agissent dans un environnement. Dans notre étude, l’objet de l’activité étudiée, soit ce qui est visé et ce qui l’oriente, est l’évaluation des acquis des élèves. Les actions subordonnées à cette activité sont orientées vers des buts conscients : faire un bilan des apprentissages des élèves en fin de séquence pour remplir le LSU[7], proposer un test pour évaluer ponctuellement où en sont les élèves par rapport à un apprentissage visé, etc.

Les opérations permettant de réaliser ces actions sont déterminées par les conditions de l’activité au moment où elles sont mises en oeuvre. Il s’agit de comportements souvent routiniers dont les buts ne relèvent pas du même niveau de conscience que les actions. Pour garantir l’objet de l’activité (évaluer les acquis des élèves), le sujet (l’enseignant) dispose de ressources/d’outils[8] qui assurent la médiation entre le sujet et l’objet.

Ce en quoi le cadre de la TA élargie par Engeström (2001) paraît pertinent pour étudier le développement professionnel des différents sujets engagés dans une recherche-formation, c’est que le sujet n’est pas seul à pratiquer cette activité. En effet, d’autres acteurs la partagent avec lui, chacun avec ses caractéristiques personnelles et professionnelles (composante personnelle), ce qui permet de saisir l’activité dans sa dimension structurelle et collective.

Règles et division du travail

Engeström (2001) a donc ajouté deux autres relations qui interviennent dans la médiation entre le(s) sujet(s) et l’objet de l’activité : les règles et la division du travail. Les actions et les opérations qui sont attachées à l’activité d’évaluation dépendent de normes, d’habitus, de doxas propres à la communauté éducative et de règles institutionnellement ou professionnellement posées (instructions officielles, programmes, prescriptions primaires et secondaires, etc.). Quant à la division du travail, elle est relative à l’organisation que la communauté se donne pour atteindre l’objet en distribuant les rôles et les responsabilités de chacun. Dans le schéma proposé par Engeström (1987), la communauté a également un rôle de médiation dans l’activité du sujet à travers les règles et la division du travail qu’elle impose à l’intérieur du système.

Figure 1

Modélisation du système d’activité (Engeström, 1987, p. 78)

Modélisation du système d’activité (Engeström, 1987, p. 78)

-> Voir la liste des figures

Engeström (2000) considère que « the systemic contradictions, manifested in disturbances and mundane innovations, offer possibilities for expansive developmental transformation » (p. 960). Ainsi, le triangle d’Engeström permet de prendre en compte différents éléments qu’on pourrait considérer comme constitutifs du milieu (Brousseau, 1990) d’une recherche-formation, ce qui permet d’appréhender les apprentissages contingents à ce milieu, c’est-à-dire le développement professionnel des différents sujets.

Pour étudier le développement professionnel des sujets à partir du cadre d’Engeström, il nous semble opportun d’étudier le milieu constituant la recherche-formation. Nous examinerons donc, pour cet article, en quoi les règles et la division du travail adoptées dans les deux collectifs du LéA, mais aussi les outils proposés par les chercheuses ont pu avoir un impact (positif ou négatif) sur le développement professionnel des sujets des deux communautés (praticiens et chercheuses).

Pour rendre compte du développement professionnel des enseignants engagés dans nos deux collectifs à partir des cadres adoptés, nous cherchons à repérer des traces d’évolution de leur logique évaluative à travers les échanges réalisés lors des rencontres et à partir de l’étude de leur activité évaluative en classe et lors des rencontres du LéA. Nous montrerons comment la composante personnelle des enseignants a pu jouer comme un frein ou comme un levier dans leur développement professionnel.

Choix méthodologiques

Dans cette section, nous décrivons les participants impliqués et les dispositifs adoptés dans chacun des deux collectifs de recherche du LéA EvalNumC2.

Présentation des deux collectifs

Collectif 1

Le collectif 1 était composé de huit PE enseignant en CE1 (2e année au Québec) ou CE2 (3e année au Québec) dans les deux écoles dans lesquelles le LéA est implanté. Ils avaient une expérience professionnelle variant de 2 à 23 ans. Leur engagement dans le projet du LéA a été en partie contraint[9], ce dont nous n’avions pas connaissance au début de la recherche. La collaboration avec les PE de ce collectif a duré une pleine année scolaire (septembre 2016 à juin 2017) lors de rencontres conjointement programmées durant le temps scolaire (6 x 3 heures).

Collectif 2

Pour ce nouveau collectif constitué lors de la deuxième année du LéA, nous avons choisi de travailler avec des PE ayant clairement manifesté un intérêt pour la modalité de recherche-formation que nous proposions, c’est-à-dire des moments d’échanges réguliers permettant à la fois aux enseignants de développer leurs compétences professionnelles autour de l’évaluation et d’approfondir le concept de logique évaluative développé par une des deux chercheuses impliquées dans le LéA. Six PE du cycle 2, tous volontaires et ayant une expérience professionnelle de 1 à 12 ans, ont constitué ce second collectif. Les rencontres ont toutes eu lieu en dehors du temps scolaire et ont été programmées en concertation entre les enseignants du collectif et les chercheuses, durant l’année scolaire (4 x 2 heures et 2 x 3 heures).

Organisation et modalités de recherche-formation

Dans les deux collectifs, la même modalité de travail collaboratif a été proposée aux PE, spécifiant notamment les attendus de la collaboration pour les deux types de participants (chercheuses et praticiens). Cette modalité ne s’est pleinement réalisée qu’avec les PE du collectif 2, car, avec ceux du collectif 1, la dimension recherche a été quelque peu remisée pour des raisons que nous évoquerons ultérieurement.

Les deux chercheuses engagées dans ce projet ont proposé le même type d’outil puisque l’objet de l’activité des sujets, c’est-à-dire l’évaluation des acquis des élèves en mathématiques, était le même (voir Annexe 1). Seules les modalités de médiation, la durée et l’organisation des séances ont varié selon les collectifs.

Les outils proposés ont visé plus particulièrement le développement de deux des indicateurs de la logique évaluative des enseignants : le jugement professionnel et didactique en évaluation et la conception des évaluations[10] en mathématiques des enseignants des deux collectifs. Les outils de médiation apportés par les PE (productions d’élèves, supports d’évaluation, documents de travail personnels) ont servi à la fois de supports de travail et d’échanges entre les différents sujets.

Concernant la conception des évaluations, les outils proposés par les chercheuses visaient, d’une part, à élargir l’« horizon évaluatif » (Sayac, 2017b) des enseignants engagés dans le LéA en leur proposant des tâches évaluatives issues de tests externes (conçus par une des chercheuses) ou d’évaluations standardisées (notamment, la TIMSS) et, d’autre part, à les outiller pour les concevoir de manière plus valide[11] (liste de tâches par domaine mathématique, facteurs de complexité).

Pour les deux collectifs, les deux premières séances des recherches-formations ont été identiques, mais pas les suivantes. La première séance a visé, d’une part, à établir les modalités de travail en commun et, d’autre part, à prélever des premiers indices relatifs à la logique évaluative des différents PE, à partir d’échanges informels sur leur vision de l’évaluation et sur leur pratique évaluative en mathématiques. La deuxième séance a fait l’objet d’une présentation et d’une mise en application d’un outil d’analyse de tâches mathématiques (Sayac et Grapin, 2015). L’objectif de cette séance était d’outiller les enseignants afin qu’ils puissent analyser plus finement les tâches évaluatives qu’ils proposent à leurs élèves dans leurs évaluations et faire des choix didactiquement fondés.

Pour le collectif 1, les séances suivantes ont porté sur l’élaboration d’un test commun en numération que les PE ont conçu ensemble et fait passer à leurs élèves, puis sur l’analyse des productions des élèves à ce test. La dernière séance a été l’occasion de faire un bilan à la fois de la recherche-formation et de l’évolution de la pratique évaluative des PE en mathématiques.

Pour le collectif 2, les séances suivantes ont exclusivement porté sur la conception collective d’une grille d’évaluation des progrès permettant aux enseignants d’analyser plus finement les acquis et difficultés des élèves en numération, à partir de la liste de tâches en numération proposée par les chercheuses (voir Annexe 2). Cette grille a été éprouvée par les PE dans leur classe tout au long de l’année, puis affinée/modifiée au cours des séances de la recherche-formation.

Méthodologie de collecte des données

Toutes les séances de ces deux recherches-formations ont été enregistrées et des entretiens ont été réalisés par la suite avec certains PE du collectif 1[12].

Les données que nous avons récoltées sont de deux sortes : celles qui ont servi d’outils de médiation lors des rencontres et celles qui ont été exploitées pour étudier le développement professionnel des PE. Dans la première catégorie se trouvent le test élaboré en commun (collectif 1), les productions des élèves des PE relatives à ce test et les grilles d’évaluation des progrès des élèves (collectif 2). Dans la seconde catégorie se trouvent des verbatim issus des enregistrements audio de chacune des séances ainsi que des entretiens tenus après l’expérience de recherche-formation qui ont servi à repérer l’évolution du jugement professionnel et didactique des PE en mathématiques au cours de l’année.

Nous avions initialement souhaité collecter d’autres données (supports d’évaluation en mathématiques conçus par les PE au cours de l’année, productions corrigées et notées des élèves, journal de formation) pour appréhender toutes les composantes de leur logique évaluative, notamment la conception des évaluations et la notation. Toutefois, les enseignants du collectif 1 ne nous les ont pas fournies et nous ne les avons finalement pas demandées aux PE du collectif 2.

Il n’a pas été aisé de traiter les enregistrements audio des séances, car le repérage des verbatim de chaque enseignant s’est avéré très complexe du fait de la difficulté à identifier les voix de chaque enseignant au vu de leur nombre (8 PE pour le collectif 1, 6 PE pour le collectif 2). Néanmoins, nous nous sommes efforcée d’identifier dans les enregistrements audio les PE qui nous ont accordé un entretien afin de repérer plus spécifiquement leur développement professionnel. Les ressources élaborées lors des deux recherches-formations (test commun et grille d’évaluation des progrès) ont également été difficiles à exploiter du fait de leur élaboration en commun.

Résultats

Nous avons choisi de présenter des résultats relatifs au fonctionnement et aux modalités de ces deux recherches-formations à l’aide du triangle d’Engeström (2001) en nous concentrant, d’une part, sur les règles, la division du travail et les outils qui ont médié les interactions entre les différents sujets des deux collectifs et, d’autre part, sur le développement professionnel de ces sujets. En effet, ces entrées nous ont semblé les plus pertinentes pour témoigner de l’influence, sur les résultats escomptés/produits, de la composante personnelle des sujets engagés dans un dispositif de recherche-formation, a fortiori quand l’évaluation y occupe une place centrale.

Le rôle prépondérant des règles tacites dans la médiation

Des règles tacites, dont nous n’avions ni idée ni connaissance, mais que nous avons découvertes au fur et à mesure des rencontres, étaient à l’oeuvre au sein des deux collectifs, en lien avec leurs spécificités.

Tous les PE du collectif 1 enseignaient dans le même établissement, en réseau d’éducation prioritaire (REP), où aucune pratique collective de travail pédagogique n’avait été développée. Ils y enseignaient pour la plupart (sauf deux) depuis un certain nombre d’années (au moins 10 ans). Les conditions difficiles d’enseignement dans cette école ont souvent été avancées pour justifier une certaine réserve vis-à-vis du dispositif de recherche-formation proposé, notamment dans le refus de fournir des documents (supports d’évaluation, progressions, etc.) ou de faire des activités supplémentaires (remplir un journal de formation).

Une règle tacite que nous avons découverte et qui a freiné la recherche est celle de la non-ingérence externe dans les pratiques des enseignants de l’école. Cette règle pourrait se traduire par « chacun se débrouille comme il le peut et on ne s’immisce pas dans les choix pédagogiques des collègues »[13]. Il va sans dire que, dans ces conditions et en ajoutant le fait que l’engagement des enseignants dans le LéA était en partie contraint, comme nous l’avons indiqué ultérieurement, les séances avec ce collectif ne nous ont pas réellement permis de produire les résultats escomptés en matière de développement professionnel et de recherche. Toutefois, l’adaptation de certains outils proposés nous a permis d’ouvrir certaines brèches, ce qui nous a donné accès à certains éléments de la logique évaluative des enseignants de ce collectif.

De leur côté, les PE du collectif 2 enseignaient dans des écoles différentes de la même circonscription que celles du collectif 1. Le fait qu’ils aient tous été volontaires pour s’engager dans le projet a considérablement changé la donne de ce qui s’est joué au cours des séances. La règle de non-ingérence dans les pratiques de collègues ne s’est pas appliquée. Au contraire, les PE étaient avides d’exposer leur pratique évaluative en mathématiques et les questionnements soulevés par cette pratique. Ainsi, les difficultés et contradictions mises à jour lors des séances étaient exploitées par les PE de ce collectif pour atteindre un nouveau degré de compréhension de leur pratique évaluative en mathématiques et, ainsi, l’améliorer et l’enrichir. Ces échanges ont donc été constructifs aussi bien d’un point de vue professionnel (pour les PE) que d’un point de vue scientifique (pour la recherche). La règle tacite qui a présidé à ce collectif était plutôt de profiter au mieux de ce moment de formation peu courant. Cette règle avait d’autant plus cours que les PE avaient volontairement accepté de participer à la recherche-formation en dehors du temps scolaire.

Le rôle déterminant de l’organisation de la participation

Les réunions avec les enseignants du collectif 1 ont été programmées sur des plages horaires dédiées à la formation durant le temps scolaire, par commodité et pour s’inscrire dans une des priorités de formation de la circonscription (l’évaluation en mathématiques). Ce choix, pragmatique, a eu pour conséquence de placer les PE dans une posture peu propice à un partage du travail, comme attendu dans une recherche-formation. En effet, puisque les séances étaient comptabilisées sur leur temps de formation, les PE de ce collectif étaient dans l’attente de ressources ou de méthodes liées à l’évaluation en mathématiques à utiliser directement dans leur classe.

Au contraire, les réunions du collectif 2 ont eu lieu en dehors du temps scolaire, après la classe. De ce fait, les PE ont pu considérer[14] ces moments de rencontres comme du temps moins contraint institutionnellement et propice à un travail où chacun pouvait apporter sa contribution. La division du travail s’est donc faite de manière équilibrée, d’autant plus que l’outil sur lequel le travail s’est le plus effectué (la grille d’évaluation des progrès) assignait à chacun des rôles bien déterminés[15].

Les enjeux liés au partage d’outils professionnels personnels

Pour le collectif 1, nous avions prévu des outils de médiation, qu’il a fallu adapter. En effet, partant du principe qu’il est préférable de partir des pratiques en cours des enseignants pour les faire évoluer plus efficacement (Robert, 2007), nous avions initialement projeté de travailler sur notre outil « facteurs de complexité » (Sayac et Grapin, 2015) en l’appliquant à des exercices proposés par les PE dans les évaluations qu’ils donnaient à leurs élèves. Devant le refus[16] des enseignants de fournir leurs évaluations, nous avons dû nous résoudre à en apporter d’autres, issus d’une recherche antérieure (Sayac, 2017a). Puisque ces évaluations extérieures ne présentaient aucun risque d’ingérence dans leur pratique évaluative, les PE ont joué le jeu proposé et utilisé l’outil « facteurs de complexité » pour échanger autour de tâches évaluatives en mathématiques.

Ils ont également accepté de produire un test en commun, par année d’études, qu’ils ont fait passer à leurs élèves. Cette conception collective de test ainsi que l’analyse des productions (mélangées et non identifiables) de leurs élèves ont été des outils qui ont permis des échanges fructueux au sein du collectif, au service de notre objet d’étude partagé, soit les pratiques d’évaluation en mathématiques.

Pour le collectif 2, nous avons souhaité, tout en gardant le même objet commun d’activité (l’évaluation des acquis des élèves en mathématiques), changer d’outils de médiation, sans néanmoins les abandonner tous. Nous avons proposé aux enseignants de ce collectif d’élaborer ensemble, à partir d’un outil développé par des enseignants canadiens (Suurtamm et Arden, 2017), une grille d’évaluation permettant de témoigner des progrès des élèves en numération destinée aussi bien à l’enseignant qu’aux élèves eux-mêmes. Le travail d’adaptation de la grille canadienne et l’enjeu de produire une ressource diffusable au sein de la circonscription ont conforté l’engagement des enseignants du collectif et stimulé les échanges.

Le développement professionnel des enseignants en contexte de recherche-formation

Pour rappel, nous avions prévu de rendre compte du développement professionnel à travers l’étude des traces d’évolution de la logique évaluative des PE engagés dans nos deux collectifs, traces repérées lors des propos échangés au cours des séances, dans les outils produits au cours des séances et lors des entretiens menés par la suite avec certains enseignants. Plus spécifiquement, nous avons étudié l’évolution de leurs croyances et représentations sur l’évaluation et sur les apprentissages, mais aussi la façon dont ils conçoivent leurs outils d’évaluation.

L’élaboration du test commun par les enseignants du collectif 1 et le retour sur la passation dans leur classe ont été l’occasion d’interpeller certains d’entre eux, aussi bien du point de vue du contenu mathématique de ce test, dont certains items leur étaient peu familiers, que du point de vue des réponses de leurs élèves. Pour illustrer l’impact de cet outil (test commun) sur les pratiques de ces enseignants, voici quelques propos échangés lors de la séance bilan de ce test :

PE6 : « Il va falloir travailler plus la résolution de problèmes avec mes élèves. J’étais très surpris du résultat, pas forcément déçu, mais je me rends compte que c’est ce qu’il faut travailler le plus. C’est vrai que je ne travaille pas beaucoup les problèmes. »

PE3 : « Pareil pour mes élèves. Je pense d’ailleurs installer un rituel de problèmes, tous les matins, pour travailler plus cette notion. »

PE4 : « Pour l’item 6, le dénombrement avec les triangles, je pensais qu’ils allaient faire des regroupements, des paquets, mais j’ai juste un élève qui l’a fait. Les autres ont compté de 1 en 1. Je pensais que c’était acquis et je ne leur donne plus ce genre d’exercice, mais finalement ce n’est pas le cas. »

Les points de vue échangés durant les séances ont également été l’occasion de mettre à jour des contradictions entre les PE qui, comme Engeström (2000) le suggère, ont offert aux PE des possibilités de transformation de leurs représentations et croyances sur les apprentissages et l’évaluation. Pour illustrer ce fait, nous rapportons un échange qui a eu lieu entre les enseignants du collectif 1 à la suite de la passation dans les classes de l’évaluation conçue collectivement lors des séances précédentes. Nous étions en train de partager nos analyses des procédures utilisées par les élèves pour résoudre un des problèmes donnés dans l’évaluation et nous avions souligné combien la procédure utilisée par une élève était ingénieuse et finalement plus efficace que la procédure standard attendue, lorsqu’une enseignante est intervenue : « Pourtant, cette élève est issue d’un milieu social défavorisé ».

Cette remarque a suscité de nombreuses réactions, notamment sur le lien fait par la PE entre l’origine sociale de l’élève et ses capacités cognitives. Les échanges qui ont suivi, parfois assez vifs, ont permis aux PE d’exprimer leurs points de vue, emprunts de croyances et de représentations sur les apprentissages et l’évaluation en REP, qui auraient été difficilement dévoilés dans un autre contexte.

Les entretiens réalisés après l’expérience de recherche-formation auprès de certains enseignants du collectif 1 ont également témoigné d’évolutions professionnelles du point de vue de leur pratique d’évaluation, même si ces enseignants ont exprimé un sentiment mitigé sur l’apport de la recherche-formation :

PE2 : « La formation ne m’a rien apporté du tout, mais maintenant je me pose des questions sur comment j’évalue. Je me questionne sur l’évaluation. »

PE4 : « En soi, non, je savais comment évaluer, mais c’est vrai que je prends plus de temps maintenant. Je prends plus en compte les évaluations. Je revois avec ceux qui ont plus de mal. »

Ces propos témoignent de la réticence personnelle des enseignants vis-à-vis du dispositif proposé (pas d’apport ni de besoin), mais ils témoignent également d’évolutions résultant de celui-ci. Ils confortent l’idée que nous défendons de rattacher l’évaluation à l’intime professionnel des enseignants et montrent la difficulté, d’une part, d’accéder à leurs pratiques d’évaluation et, d’autre part, de les faire évoluer. La composante personnelle est donc bien partie prenante du développement professionnel des enseignants, surtout lorsque ce développement concerne l’évaluation.

Concernant les enseignants du collectif 2, les traces de développement professionnel se trouvent principalement dans l’utilisation de grilles d’évaluation, dans la diversification des ressources pour concevoir les évaluations (notamment l’usage d’outils issus de la recherche), dans le changement de notation adopté, mais aussi dans le devenir professionnel de certains. Un PE a été recruté en fin d’année pour intégrer un département du ministère de l’Éducation nationale chargé de la conception et du pilotage de l’évaluation des élèves, tandis qu’une autre s’est engagée dans un parcours pour devenir formatrice.

Plus précisément, le travail d’élaboration de la grille d’évaluation des progrès des élèves en numération a permis de débattre de l’implication des élèves dans l’évaluation de leurs propres apprentissages, de la complexité des tâches évaluatives proposées, de l’articulation entre les moments d’enseignement et les moments d’évaluation, de la notation, etc. Tous ces échanges ont indéniablement contribué, pour les enseignants du collectif 2, à une meilleure compréhension de leur travail d’évaluateur et ainsi à améliorer, enrichir et actualiser leur pratique d’évaluation en mathématiques.

Pour illustrer l’évolution des pratiques des enseignants de ce collectif, nous citerons les propos de l’un d’eux tenus lors de la dernière séance :

PE3 : « Avant la formation, je prenais des évaluations sur des sites Internet dédiés aux enseignants, sans forcément changer les données ou les adapter à ma classe. Maintenant, je prends le temps de vérifier la cohérence de l’évaluation (le choix des nombres), tout en m’inspirant de ces sites ou de différents manuels. »

Concernant notre propre développement professionnel, ces deux expériences de recherche-formation, dans la diversité de leur contexte et de leur mise en oeuvre, nous ont permis de réaliser à quel point la composante personnelle devait être prise en compte pour étudier et faire évoluer les pratiques évaluatives des enseignants. Elles nous ont permis d’appréhender plus finement la complexité de ces pratiques, dans la réalité de leur mise en oeuvre dans les classes. Elles nous ont également confortée dans l’idée que les recherches engageant chercheurs et praticiens sont les plus adaptées pour étudier les pratiques d’évaluation des enseignants, qui relèvent, comme nous le défendons, de leur intime professionnel.

Discussion

Même si cela n’est qu’indirectement lié à la problématique traitée dans cet article, nous souhaitons mettre en discussion le rôle du chercheur dans ce type de recherche, notamment quand il est également formateur d’enseignants. Ce double rôle, qui, du point de vue de la composante personnelle du chercheur, convoque des éléments liés à sa double identité de chercheur et de formateur, n’est pas sans générer des difficultés et des tensions, que nous avons éprouvées avec les deux collectifs. Selon les moments, les activités proposées et les enseignants engagés dans ce type de recherche, les enjeux scientifiques peuvent s’effacer au profit des enjeux de formation, et inversement. Le chercheur engagé dans une recherche collaborative est souvent amené à faire des compromis, à composer avec le contexte et les sujets ainsi qu’à faire des choix qu’il n’est pas toujours aisé de faire.

Un autre point que nous souhaitons soulever est le traitement des multiples données récoltées dans le cadre d’une recherche collaborative. Certes, cette méthodologie de recherche est propice à collecter de nombreuses données utiles aux chercheurs. Or, se pose la question de pouvoir toutes les exploiter aussi bien sur le plan de la quantité (plus de 40 heures d’enregistrements audio des réunions, plus de 200 productions d’élèves, etc.) que des outils (comment et de quel point de vue scientifique exploiter les enregistrements audio?). Nous ressentons une certaine frustration à ne pas avoir davantage exploité les données que nous avons collectées et qui auraient pu nous permettre de produire des résultats complémentaires ou plus affinés.

Conclusion

L’étude des différents éléments de médiation entre les sujets et l’objet de leur activité (outils, règles, division du travail) permet de dégager des résultats sur le développement professionnel des différents sujets relativement à leur logique évaluative.

L’organisation et les modalités adoptées pour les deux recherches-formations n’ont pas été conçues pour explorer le développement professionnel des PE par le biais de l’évolution des épisodes évaluatifs qu’ils ont proposés à leurs élèves. Néanmoins, tel que le cadre a été conçu, les deux axes de la pratique évaluative d’un enseignant en mathématiques sont interdépendants et conjointement modifiables. Cela implique que la logique évaluative d’un enseignant ne peut évoluer sans que cela ait une incidence sur les épisodes évaluatifs qu’il propose à ses élèves, et réciproquement.

Pour prendre en compte plus explicitement cette interdépendance, il nous semble aujourd’hui indispensable[17] d’étudier simultanément, à travers d’autres modalités d’étude, la logique évaluative d’un enseignant et les épisodes évaluatifs qu’il propose à ses élèves durant une séquence d’enseignement.

Dans cet article, nous avons montré combien la composante personnelle des pratiques des enseignants engagés dans une recherche-formation ayant pour objet l’évaluation est un élément essentiel à prendre en compte pour viser leur développement professionnel. Dans la première recherche-formation, l’engagement en partie contraint des enseignants a obligé les chercheuses à adapter les outils qu’elles avaient prévus, puis à revoir la quantité et la nature des données à collecter pour produire les résultats scientifiques escomptés. Le fait de ne pas pouvoir travailler sur les artefacts produits par les enseignants du collectif 1 nous a empêchée de repérer leurs connaissances disciplinaires et leurs difficultés éventuelles, mais aussi d’avoir accès à ce qui était proposé à leurs élèves en matière d’évaluation en mathématiques.

Dans la seconde recherche-formation, l’engagement volontaire des PE et l’outil de médiation retenu ont favorisé le développement professionnel de chacun des sujets ainsi qu’une réelle collaboration entre chercheuses et enseignants. La grille d’évaluation conçue dans le cadre de cette recherche-formation est une ressource qui a été diffusée dans les écoles d’appartenance des enseignants du collectif 2.

Ces deux recherches-formations, au-delà du fait qu’elles ont contribué à mieux connaître et comprendre les pratiques d’évaluation en mathématiques de professeurs des écoles, nous ont également amenée à élargir notre questionnement sur ces pratiques spécifiques. Elles nous ont également fait ressentir la nécessité de croiser les approches scientifiques pour les étudier. Le poids de la composante personnelle dans les pratiques d’évaluation des enseignants, tel qu’il s’est révélé aussi bien sur le plan de leur engagement dans un dispositif de formation à l’évaluation que de leurs croyances et représentations, impose d’être davantage pris en compte et étudié.

Forte de ces constats et de ces expériences, nous espérons que de nouvelles recherches impliquant chercheurs et praticiens seront menées afin d’explorer les pratiques évaluatives des enseignants, si importantes pour soutenir les apprentissages des élèves en mathématiques, comme dans toutes autres disciplines, à l’école primaire comme au secondaire ou au supérieur.