Corps de l’article

1. Introduction

Bien que les systèmes éducatifs et les enseignants[1] disposent d’une variété d’outils pour évaluer les apprentissages, la question de l’efficacité des pratiques évaluatives soulève toujours des interrogations, et ce, à tous les niveaux d’enseignement dans les milieux scolaires. Sur le plan de la recherche en éducation, il y a une tendance croissante des études visant à comprendre les activités qui soutiennent l’apprentissage (Wiliam, 2011). Cette tendance est soutenue depuis une dizaine d’années par le recours aux données probantes. Cette perspective de recherche a émergé dans les débats entre les sciences, les pratiques et les politiques après le constat qu’il existe des lacunes entre les savoirs explorés en formation et les savoirs créés par la recherche et auxquels les enseignants font appel dans leurs pratiques de classe (Rey, 2014 ; Slavin, 2020).

Quant aux pratiques évaluatives qui contribuent à bonifier les apprentissages, une hypothèse adoptée presque à l’unanimité dans de nombreuses recherches veut que les activités associées à l’évaluation formative dans les classes fournissent des informations sur le processus d’apprentissage que les enseignants peuvent utiliser pour prendre des décisions pédagogiques afin de bonifier les compétences des élèves (Black et Wiliam, 1998). Cependant, l’évaluation formative au coeur de la régulation des processus d’apprentissage est ouverte à une variété d’interprétations et de pratiques qui ne présentent pas nécessairement toutes les caractéristiques identifiées comme facilitant les progrès des élèves vers un apprentissage ultérieur (Wiliam, 2011). Dans ce contexte, s’assurer quelles sont les pratiques de l’évaluation formative qui aident les élèves à mieux apprendre, demeure une énigme selon diverses études (Dunn et Mulvenon, 2009 ; Rust, O’Donovan et Price, 2005 ; Stiggins, 2002).

Si, de façon générale, les pratiques évaluatives, et plus encore celles formatives, constituent des dispositifs peu étudiés (Clanet et Talbot, 2012 ; Larose, Couturier, Bédard et Charette, 2011), la perspective de recourir aux données probantes dans les recherches est une préoccupation récente en éducation (Slavin, 2020). En évaluation des apprentissages, le recours aux données probantes répond à la nécessité de fournir aux praticiens et aux décideurs un nouvel éclairage sur la question cruciale des meilleures pratiques évaluatives.

Le but de la présente étude consiste à documenter les recherches scientifiques ayant identifié les pratiques en évaluation formative qui favorisent l’apprentissage des élèves dans les contextes de l’enseignement primaire et secondaire. Plus spécifiquement, il s’agit de répertorier, à partir d’une revue systématique, les meilleures pratiques de l’évaluation formative prouvées efficaces dans les écrits scientifiques pour aider les élèves à bonifier leurs apprentissages. Les pratiques évaluatives, l’évaluation des apprentissages et les données probantes sont d’abord définies dans le cadre conceptuel. Puis suivent les aspects méthodologiques de la recherche, la synthèse des articles retenus pour l’analyse, la présentation des résultats et la discussion. Les implications et limites de la recherche sont mentionnées avant la conclusion.

2. Cadre conceptuel

2.1 Les pratiques évaluatives

Les pratiques évaluatives font partie du large concept des pratiques enseignantes. Elles renvoient au « savoir évaluer » des enseignants, c’est-à-dire au système de connaissances rationnelles à la base duquel ces derniers tiennent la mise en oeuvre de l’activité d’évaluation des apprentissages en classe (Deaudelin, Desjardins, Dezutter, Thomas, Corriveau, Lavoie, Bousadra et Hébert, 2007 ; Morrissette et Nadeau, 2011). Les pratiques évaluatives regroupent divers aspects de la situation d’évaluation, allant de la conception à la sélection des instruments d’évaluation et à leur mise en oeuvre. En tant que telles, les pratiques évaluatives sont des manières concrètes plus ou moins formalisées de penser, d’agir, d’utiliser les outils, les procédures, les langages, les codes et normes et les traces qui se rapportent à l’évaluation des apprentissages (Mottier Lopez, 2015).

En contexte de salles de classe, les pratiques évaluatives sont influencées par la vision de l’enseignement et de l’apprentissage d’une part et par la vision que l’enseignant a de son propre rôle d’autre part (Black et Wiliam, 1998). En cela, les pratiques évaluatives sont étroitement liées aux politiques éducatives qui en définissent et en instaurent les valeurs fondamentales ainsi que les décisions concernant les normes et procédures en la matière (Broadfoot et Black, 2004).

2.2 L’évaluation des apprentissages

Le concept d’évaluation des apprentissages est défini diversement dans les écrits. À l’échelle de la classe, l’évaluation est une activité qui vise à recueillir et à interpréter les informations sur les apprentissages scolaires d’un élève ou d’un groupe d’élèves afin de prendre une décision. Vue du côté de l’enseignant, elle permet de juger de l’efficacité de l’acte pédagogique. Au niveau de l’élève, l’évaluation permet de déterminer l’atteinte ou non des objectifs d’apprentissages poursuivis (Laurier, Tousignant et Morissette, 2005). Plus largement, l’évaluation des apprentissages inclut l’ensemble des activités et méthodes utilisées pour obtenir les données sur les connaissances, compétences et comportements des élèves (ministère de l’Éducation du Québec, 2003). Selon les objectifs, les enseignants recourent à des instruments d’évaluation plus ou moins formels ou fréquents et impliquant plus ou moins les élèves (Mottier Lopez, 2015).

Dans les recherches, deux principales caractéristiques ressortent des conceptualisations de l’évaluation des apprentissages scolaires. Ces caractéristiques distinguent l’évaluation de l’apprentissage (assessment of learning) de l’évaluation pour l’apprentissage (assessment for learning). L’évaluation de l’apprentissage se rapporte à la finalité pour laquelle l’évaluation est effectuée. Elle fait référence à l’évaluation sommative ou certificative, précisément conçue pour servir les objectifs de responsabilité, de classement ou de certification du niveau de compétence des élèves. L’évaluation pour l’apprentissage fait référence à l’évaluation formative. L’une des caractéristiques essentielles de l’évaluation formative réside dans le fait que les preuves des acquisitions des élèves sont interprétées pour déclencher un ensemble d’actions et de pratiques au niveau des enseignants et des élèves qui visent à produire des apprentissages meilleurs (Black et Wiliam, 1998 ; Wiliam, 2011).

Il n’existe pas de consensus sur les composantes de l’évaluation formative (Dunn et Mulvenon, 2009). Cependant, six composantes sont répertoriées dans le rapport de l’Organisation de coopération et de développement économiques (2005). Il s’agit de 1) l’instauration d’une culture de classe encourageant l’interaction et l’utilisation d’outils d’évaluation ; 2) la définition d’objectifs d’apprentissage et du suivi des progrès individuels des élèves ; 3) l’utilisation de méthodes d’enseignement variées ; 4) le recours à des méthodes d’évaluation diversifiées ; 5) garantir une rétroaction sur les performances de l’élève et l’adaptation de l’enseignement en fonction des besoins des élèves et 6) l’implication active des élèves dans le processus d’évaluation. En tant que processus de recherche et d’interprétation d’informations à utiliser par les enseignants pour déterminer où en sont les élèves dans leurs apprentissages afin de prendre des décisions sur ce qui doit être fait pour les aider à y parvenir au mieux, les pratiques de l’évaluation formative nécessitent des recherches probantes (Andersson et Palm, 2017 ; Wiliam, 2011 ; Yorke, 2003).

2.3 Les données probantes en évaluation des apprentissages

Le concept de données probantes (evidence-based en anglais) est utilisé dans le sens large des pratiques fondées sur les preuves. La traduction du concept en français est approximative et différentes terminologies sont utilisées selon les domaines et les publications : politiques basées sur les résultats de recherche, pratiques efficaces, ou encore, pratiques ou recherches basées sur les preuves (Rey, 2014 ; Slavin, 2020). Les données probantes font référence à la causalité et sont utilisées pour montrer qu’une chose en rend une autre plus évidente (McQueen et Anderson, 2000). Les pratiques fondées sur les données probantes utilisent des connaissances probabilistes validées par des preuves, contrairement aux approches qui se basent sur la tradition, les conventions, les croyances ou les données non scientifiques (Bissonnette, Gauthier et Péladeau, 2010).

Les recherches montrent que le débat sur le sujet des données probantes était au départ un débat académique sur des questions épistémologiques. Le concept a été utilisé d’abord en médecine avant d’être introduit graduellement dans diverses disciplines (McQueen et Anderson, 2000). Par la suite, les données probantes ont été liées à des questions pragmatiques, notamment pour résoudre des problèmes et prendre des décisions en connaissance de cause. L’identification des données probantes sur une pratique permet d’appliquer une démarche scientifique pour identifier les universaux qui caractérisent l’exercice d’une profession, c’est-à-dire le « que faire » individuel ou collectif (Larose et coll., 2011).

Au point de vue de la méthodologie, les recherches basées sur les données probantes reposent sur des procédés scientifiques spécifiques. Elles recourent aux revues systématiques, aux méta-analyses et aux démarches expérimentales ou quasi expérimentales. Slavin (2020) distingue trois niveaux de preuves : les preuves solides (provenant d’au moins une étude expérimentale), les preuves modérées (provenant d’au moins une étude quasi expérimentale) et les preuves prometteuses provenant d’au moins une étude corrélationnelle.

Les données probantes en enseignement répondent donc au besoin de constituer un corpus de données scientifiques homologuées par la communauté scientifique attestant ou remettant en cause la validité, le caractère opératoire, relatif ou absolu des connaissances disciplinaires et des savoirs de sens commun propres à la profession enseignante (Larose et coll., 2011). Identifier les pratiques évaluatives probantes, c’est faire connaitre ce qui fonctionne efficacement en matière d’évaluation, c’est-à-dire des pratiques évaluatives qui, d’un point de vue éducatif et pédagogique, peuvent améliorer l’expérience d’apprentissage et influencer positivement les rendements des élèves (Organisation de coopération et de développement économiques, 2005). La présente recherche s’intéresse aux données probantes en évaluation formative.

3. Méthodologie

Dans cette section, la méthodologie de la recherche est présentée. L’approche des revues systématiques est retenue pour cette étude. Elle permet d’utiliser une méthode d’identification, d’évaluation et de synthèse des principales connaissances existantes dans un domaine visé suivant une démarche rigoureuse et reproductible (Landry, Becheikh, Amara, Ziam, Idrissi et Castonguay, 2008). Largement utilisées par plusieurs auteurs, les approches des revues systématiques sont plus transparentes, structurées et complètes et leurs résultats sont jugés plus fiables en termes de pertinence, d’utilité ou d’efficacité qu’une revue de littérature (Bearman, Smith, Carbone, Slade, Baik, Hughes-Warrington et Neumann, 2012 ; Dagenais, Martin et Renaud, 2013 ; Munn, Stern, Aromataris, Lockwood et Jordan, 2018).

La présente étude recourt spécifiquement à l’approche méthodologique de Gough (2007) qui utilise une démarche en neuf étapes : 1) la formulation des questions/objectifs de recherche ; 2) la définition des critères d’inclusion et d’exclusion ; 3) l’articulation de la stratégie de recherche documentaire ; 4) la vérification des critères d’inclusion et d’exclusion des articles ; 5) le report des résultats de la stratégie de recherche, 6) l’extraction des données pertinentes pour la recherche ; 7) l’évaluation de la qualité méthodologique des articles retenus ; 8) la synthèse quantitative ou qualitative des résultats communs des articles ; 9) la présentation synthétique des résultats et les conclusions de la recherche.

À l’étape 1, le but de l’étude a préalablement été défini dans l’introduction. À l’étape 2, six critères d’éligibilité des études ont été fixés. Ces critères sont relatifs a) au titre, b) à la période de publication, c) à la langue de publication, d) au résumé, e) au texte de l’article et f) au contexte scolaire. Sur le plan du titre, l’article devrait contenir au moins un des trois concepts de la recherche ou leurs synonymes (tableau 1). Quant aux critères d’inclusion/exclusion, les articles devraient être publiés dans une revue scientifique avec comité de lecture au cours des 22 dernières années, soit entre 1998 et 2020. Ces articles devraient être en français ou en anglais et leur texte intégral devait être accessible. Les articles théoriques et professionnels, les rapports gouvernementaux, les communications de conférences et les sections de livres ont été exclus. Les recherches documentaires acceptées devraient être des revues systématiques, des méta-analyses ou des critiques de méta-analyses.

Dans les caractéristiques du résumé, les articles devraient être de devis quantitatif, qualitatif ou mixte, tout en faisant référence à un des trois concepts à l’étude ou leurs synonymes. Les objectifs, le contexte de l’étude, les méthodes d’analyse ainsi que les résultats devraient être clairement précisés. Le dernier critère fait référence au contexte de l’évaluation des apprentissages dans l’enseignement primaire et postprimaire (ou secondaire) (tableau 1). Les articles ayant utilisé le terme « collège » dans le sens de l’enseignement préuniversitaire ou universitaire n’ont pas été retenus.

À l’étape 3 de la démarche, une bibliothécaire professionnelle de l’université d’attache a été consultée pour aider à l’élaboration de la stratégie de recherche documentaire. La chaine de recherche a été formulée et une liste des concepts opératoires (mots clés) et leurs synonymes a été dressée en vue des recherches sur les bases de données. Les synonymes utilisés proviennent de la littérature et du thésaurus (vocabulaire contrôlé du dictionnaire) (tableau 1). Les concepts en anglais et leurs synonymes ont été utilisés pour la recherche dans trois bases de données (Education Source, ERIC, PsycINFO).

Tableau 1

Les concepts opératoires et leurs synonymes pour la recherche documentaire

Les concepts opératoires et leurs synonymes pour la recherche documentaire

-> Voir la liste des tableaux

La recherche documentaire a été réalisée entre octobre et décembre 2020 (figure 1). Sept bases de données contenant la plupart des publications en éducation ont été consultées. Ces bases sont Education Source, ERIC, PsycINFO pour les bases de données en anglais et Ariane, Erudit, Cairn.info, les bases bibliographiques Pascal et Francis en français. Des recherches complémentaires sur Google Scholar et un examen de références des articles répertoriés ont été effectués. La synthèse de la chaine de recherche des articles est présentée dans la figure 1.

À l’étape 4, 2741 articles trouvés suivant la stratégie de recherche ont été exportés vers le logiciel Endnote X9 et soumis à la vérification des critères d’inclusion et d’exclusion. La vérification a permis d’éliminer 1614 doublons. Le reste des 1127 articles a été soumis à l’application du critère relatif à la langue permettant de supprimer 104 articles. Au total, 1023 articles ont été soumis à l’application du critère relatif à l’année de publication et à la publication dans une revue scientifique avec comité de lecture. L’application de ces critères a permis de supprimer 961 articles et d’en sélectionner 62. L’examen complet de ces articles a permis d’évaluer la pertinence de leur qualité relativement aux critères d’inclusion liés au titre, au résumé, au contexte scolaire et à la disponibilité des textes. Il est apparu que 30 articles ne correspondaient pas aux critères et ont été supprimés lors du report des résultats et de l’extraction des données aux étapes 5 et 6. Des articles supprimés, 14 avaient des questions de recherche non pertinentes, sept n’avaient pas précisé la méthodologie utilisée et neuf autres études ont porté sur un échantillon universitaire.

Enfin, l’examen des références des 32 articles retenus a permis d’identifier trois articles supplémentaires qui satisfaisaient tous les critères d’inclusion. En définitive, la recherche documentaire a permis d’identifier 35 articles pertinents portant sur les pratiques d’évaluation formative des apprentissages. Ces articles ont été analysés en suivant les critères d’une évaluation fondée sur des données probantes. Le contrôle de la qualité méthodologique des articles retenus (clarté des objectifs/questions de recherche, méthodes d’analyse appropriées, qualité de la présentation des résultats) effectué à l’étape 7 montre que ces études se conforment aux exigences méthodologiques fixées. Les articles retenus ont été lus intégralement et les résultats pertinents ont été enregistrés manuellement pour la synthèse à l’étape 8 et la présentation synthétique des résultats et les conclusions de la recherche à l’étape 9.

4. Caractéristiques des articles retenus

Six types de recherches répartis en deux catégories composent les articles retenus pour l’analyse. Des recherches documentaires composées de revues systématiques (n = 6), de méta-analyses (n = 3) et de critiques de méta-analyses (n = 2) ayant examiné des études concernant les pratiques de l’évaluation formative forment la première catégorie. La deuxième catégorie est composée d’études réalisées en contexte de classe. Des recherches quantitatives (n = 12), qualitatives (n = 6) et mixtes (n = 6) sur les pratiques de l’évaluation formative au primaire ou au secondaire ont été retenues dans cette catégorie. Les détails sont présentés dans l’annexe.

Toutes les études sont de langue anglaise. Selon le contexte géographique (excluant revues systématiques, méta-analyses et critiques de méta-analyse), 24 recherches ont été réalisées dans 19 pays. Neuf études ont été menées en Europe (Allemagne, Chypre, Écosse, Espagne, Irlande, Norvège ; Royaume-Uni, Slovaquie, Suède). Sept études ont été réalisées en Amérique (Canada, Chili et États-Unis) et six études relèvent du contexte asiatique (Corée du Sud ; Hong Kong ; Pakistan ; Taiwan ; Turquie). Une étude a été menée en Afrique du Nord (Algérie) autant qu’en Océanie (Nouvelle-Zélande).

Figure 1

Synthèse de la chaine de recherche des articles

Synthèse de la chaine de recherche des articles

-> Voir la liste des figures

Alors que les recherches documentaires ont analysé des études ayant porté sur les pratiques de l’évaluation formative dans les contextes scolaires du primaire et du secondaire sans distinction, 14 études réalisées en contexte de classe se sont déroulées au primaire, deux études ont eu lieu à la fois au primaire et au secondaire et huit études se sont déroulées exclusivement au secondaire. Les disciplines couvertes par l’ensemble des études sont les mathématiques (n = 5), le français (n = 2), la lecture/écriture (n = 3), l’anglais (n = 4), l’informatique (n = 1), la biologie (n = 2), la chimie (n = 1), l’éducation physique (n = 1) et les études sociales (n = 1). Deux études ont concerné plus d’une discipline à la fois (lecture/français, mathématiques, biologie, anglais, études sociales). Sept études n’ont pas précisé les disciplines.

Sur le plan de la méthodologie, les revues systématiques ont analysé entre 17 et 39 articles. Une étude a recouru à une approche méta-analytique à effets aléatoires tandis que les deux autres méta-analyses ont utilisé l’analyse de contenu. Les méta-analyses ont respectivement porté sur l’examen de 13 à 40 études empiriques. Les critiques de méta-analyse ont examiné deux méta-analyses.

Les recherches quantitatives ont utilisé un devis expérimental (n = 6) et quasi expérimental (n = 6). Les instruments de collecte des données sont essentiellement les questionnaires et les tests. Les échantillons aléatoires des études variaient de n = 55 à n = 13 567 pour les élèves et de n = 1 à n = 906 pour les enseignants repartis dans des écoles (entre n = 1 à n = 360). Les modèles d’analyse des données sont les statistiques descriptives, les corrélations, le test t, l’ANOVA, l’ANCOVA, les régressions linéaires et les tests chi carré.

Les études qualitatives ont emprunté le modèle d’étude de cas. Les entrevues, les observations directes, les prises de notes et les artéfacts ont été les méthodes de collecte des données. Les échantillons variaient de 2 à 118 pour les enseignants et de 21 à 305 pour les élèves. L’analyse par thèmes émergents, l’analyse de contenu et la comparaison constante ont été les moyens d’analyse des données qualitatives.

Les approches quantitatives des études mixtes ont utilisé un devis quasi expérimental. Les volets qualitatifs ont adopté le modèle d’étude de cas. Les moyens de collecte des données étaient des questionnaires et des tests pour les approches quantitatives. Les études de cas ont recouru à des entrevues semi-dirigées, à l’observation directe et l’analyse de données documentaires existantes. Les échantillons dans ces études varient entre 4 et 162 participants pour les enseignants et entre 100 et 375 pour les élèves. Alors que les analyses quantitatives des recherches mixtes ont recouru aux statistiques descriptives combinées au test t et au test ANOVA, le volet qualitatif a utilisé l’analyse par thèmes émergents et l’analyse de contenu.

5. Résultats

Le but de cette recherche consiste à tenter d’identifier les meilleures pratiques en évaluation formative prouvées dans le contexte de l’enseignement primaire et secondaire. Sept pratiques de l’évaluation formative reconnues comme meilleures ressortent des résultats des articles soumis à l’analyse. Le regroupement des différentes études par thématique en lien avec ces pratiques est fait au tableau 2 ci-dessous.

5.1 Les meilleures pratiques prouvées en évaluation formative

Cette section présente les résultats essentiels concernant les pratiques décrites dans les études comme les meilleures pratiques prouvées en évaluation formative. Les résultats d’analyse détaillés incluant les articles et leur méthodologie sont en annexe.

5.1.1 L’autoévaluation et l’évaluation par les pairs

L’autoévaluation est une situation d’évaluation où l’élève est amené à porter un jugement sur ses propres compétences à travers l’établissement d’objectifs et de critères d’appréciation précis. Le processus d’évaluation par les pairs amène l’apprenant à porter un jugement sur le travail d’autrui (Leclerc, 2013). L’autoévaluation et l’évaluation par les pairs sont examinées à travers dix études, dont une revue systématique (Sebba, Crick, Yu, Lawson, Harlen et Durant, 2008), une méta-analyse (Sanchez, Atkinson, Koenka, Moshontz et Cooper, 2017), trois recherches quantitatives (Chang, Liang et Chen, 2013 ; Panadero, Tapia et Huertas, 2012 ; Sadler et Good, 2006), deux recherches qualitatives (Ní Chróinín et Cosgrave, 2013 ; Noonan et Duncan, 2005) et trois recherches mixtes (Burner, 2016 ; Butler et Lee, 2010 ; Vandergrift, 2000). La moitié des études ayant abordé les deux pratiques à la fois, nous décidons de regrouper leurs résultats sous la même rubrique.

Tableau 2

Synthèse des études par thématique en lien avec l’évaluation formative

Synthèse des études par thématique en lien avec l’évaluation formative

-> Voir la liste des tableaux

La revue systématique (Sebba et coll., 2008) et la méta-analyse (Sanchez et coll., 2017) ont porté sur les effets de l’autoévaluation et de l’évaluation par les pairs sur les apprentissages des élèves. Ayant analysé 26 études empiriques, les résultats de la revue systématique de Sebba et coll. (2008) révèlent que les pratiques de l’autoévaluation et de l’évaluation par les pairs sont des moyens d’autorégulation ayant une incidence positive sur les rendements scolaires des élèves. Leur mise en oeuvre transforme la relation de dépendance des élèves avec l’enseignant en une relation d’interdépendance, tout en augmentant leur estime de soi et leur engagement envers l’apprentissage. Cependant, l’apport de ces deux pratiques diffère selon le sexe, l’origine ethnique ou les résultats scolaires antérieurs des élèves.

Fondés sur l’analyse de 33 articles, les résultats de la méta-analyse effectuée par Sanchez et coll. (2017) démontrent qu’au-delà du développement des compétences autorégulatrices chez les élèves du primaire et du secondaire, l’autoévaluation et l’évaluation par les pairs renforcent leurs capacités de rétention en rendant plus claire leur compréhension de la matière évaluée. Alors que les gains des élèves qui se sont évalués ont été estimés comme étant plus importants dans les études analysées, l’étude conclut que l’autoévaluation et l’évaluation par les pairs sont des pratiques d’évaluation formative efficaces qui aident les élèves à mieux apprendre et à mieux réussir aux tests subséquents.

Les trois études quantitatives (Chang et coll., 2013 ; Panadero et coll., 2012 ; Sadler et Good, 2006) ont porté sur l’autoévaluation et l’évaluation par les pairs dans le contexte de l’enseignement secondaire à Taiwan, à Madrid et aux États-Unis. En plus de vérifier leurs impacts sur l’apprentissage des élèves, deux de ces études (Chang et coll., 2013 ; Sadler et Good, 2006) ont examiné leur validité et leur fiabilité. Les résultats des trois études indiquent que non seulement l’autoévaluation et l’évaluation par les pairs par les élèves sont des méthodes dont la fiabilité et la validité sont appropriées, mais elles développent également les capacités autorégulatrices des élèves tout en les conduisant à de meilleurs apprentissages. Les élèves ayant participé à l’autoévaluation obtiennent de meilleurs résultats aux tests subséquents comparativement à ceux ayant été évalués par leurs pairs dans l’étude de Sadler et Good (2006).

Les potentialités de l’autoévaluation et de l’évaluation par les pairs sont enfin rapportées par les études qualitatives (Ní Chróinín et Cosgrave, 2013 ; Noonan et Duncan, 2005) et mixtes (Burner, 2016 ; Butler et Lee, 2010 ; Vandergrift, 2000) ayant interrogé l’expérience des enseignants et des élèves de leur utilisation de ces pratiques. Les résultats révèlent que, selon les enseignants, l’autoévaluation et l’évaluation par les pairs sont des approches flexibles et adaptées pour la responsabilisation, la motivation et l’autonomie des élèves. Combinées au partage des objectifs d’apprentissage et des critères d’évaluation, ces pratiques aident les élèves à bonifier leurs apprentissages par le biais de la rétroaction. Cependant, les résultats de trois études (Burner, 2016 ; Butler et Lee, 2010 ; Noonan et Duncan, 2005) révèlent que les enseignants ne peuvent pas les utiliser fréquemment dans chaque classe. Ces derniers préfèrent l’évaluation par les pairs en raison de l’immaturité ou de l’incapacité de leurs élèves à s’engager avec précision et équité dans l’autoévaluation.

5.1.2 L’autorégulation

L’autorégulation en évaluation fait référence à l’ensemble des activités d’évaluation qui vise à développer la capacité de l’élève à planifier, surveiller et évaluer son apprentissage à travers ses propres stratégies (Leclerc, 2013 ; Organisation de coopération et de développement économiques, 2005). La pratique de l’autorégulation a été examinée dans une étude quantitative (Perels, Dignath et Schmitz, 2009). Elle a consisté à examiner les effets de la formation des compétences d’autorégulation sur l’apprentissage ainsi que sur la réussite en mathématiques dans le contexte de l’école primaire en Allemagne. Les résultats rapportés des tests ANOVA à mesures répétées révèlent que les élèves (n = 55) des classes expérimentales ont amélioré leurs rendements en mathématiques à la suite d’évaluations formatives soutenues par l’autorégulation. L’étude conclut que le développement de l’autorégulation offre des possibilités d’apprentissage étendues tout en ayant un potentiel d’améliorer les rendements des élèves.

5.1.3 L’évaluation par le portfolio

L’efficacité de l’évaluation par le portfolio est soutenue par les résultats de trois études, dont une revue systématique (Burner, 2014) et deux études qualitatives (Mak et Wong, 2018 ; McLaren, 2012). La revue systématique a étudié le potentiel formatif de l’évaluation par le portfolio dans les cours de rédaction à l’école primaire. Les résultats basés sur l’analyse des 39 articles révèlent qu’en facilitant la rétroaction et la révision des textes par les élèves, l’évaluation par le portfolio est une pratique d’évaluation exempte d’anxiété qui impacte positivement à la fois les processus d’apprentissage et les rendements des élèves.

Mak et Wong (2018) ont examiné comment les enseignants du primaire encouragent l’autorégulation des élèves du primaire (n = 69) par le biais de l’évaluation par le portfolio dans le contexte de Hong Kong. Quant à la recherche de McLaren (2012), elle a analysé les potentialités d’une approche e-scape (e-solutions for creative assessment in portfolio environment) pour soutenir l’évaluation de l’apprentissage. Les résultats des deux études démontrent que l’évaluation par le portfolio est un moyen pour le diagnostic et la rétroaction en évaluation formative. En cela, les études concluent que le portfolio est une activité de responsabilisation des élèves qui contribue à promouvoir l’apprentissage autorégulé à travers la participation des élèves à la réflexion, ainsi que le développement de leur autonomie et de leurs capacités en autoévaluation.

5.1.4 L’utilisation des grilles d’évaluation

L’efficacité de l’utilisation des grilles d’évaluation pour soutenir l’apprentissage a été abordée dans une revue systématique (Panadero et Jonsson, 2013). Portant sur 21 articles ayant examiné si et comment les grilles d’évaluation ont un impact sur l’apprentissage des élèves, les résultats de cette revue systématique révèlent que l’élaboration et le partage des critères d’évaluation ainsi que leur utilisation avec les élèves accroissent la transparence de l’évaluation et aident au processus de rétroaction tout en améliorant l’autonomie des élèves. Cependant, l’efficacité des grilles d’évaluation dépend de la qualité des indicateurs d’apprentissage et de la participation directe des élèves à leur élaboration et à leur interprétation.

5.1.5 La rétroaction

La rétroaction ressort de façon générale dans plusieurs études comme une composante cruciale de la remédiation dont les fonctions aident les élèves à apprendre. Ses formats et impacts ont été spécifiquement examinés dans une étude qualitative (Lee, 2007) et une étude mixte (Parr et Timperley, 2010). La recherche qualitative a analysé dans le contexte de Hong Kong la nature et les fonctions de la rétroaction des enseignants (n = 26) afin de déterminer dans quelle mesure elle permet de stimuler l’évaluation formative et les apprentissages des élèves du secondaire (n = 174). L’analyse par thèmes émergents des textes des élèves révèle que la rétroaction a eu un effet positif ou négatif selon sa nature, sa qualité et sa variété. Les élèves préfèrent les rétroactions orales interactives par rapport à celles écrites et les rétroactions constructives positives aux rétroactions négatives et directives. L’étude de Parr et Timperley (2010) a visé à définir les caractéristiques de la rétroaction de qualité chez des enseignants du primaire (n = 59) et ses impacts sur l’apprentissage des élèves (n = 375) dans le contexte de l’école primaire en Nouvelle-Zélande. Les résultats montrent qu’une rétroaction directive faite de commentaires négatifs et non ciblés est frustrante pour les élèves, contrairement aux rétroactions orales et positives et aux discussions interactives qui sont jugées comme deux types de rétroaction plus utiles. Sur le plan des effets sur l’apprentissage, les résultats démontrent qu’il y a une corrélation significative moyennement élevée entre la qualité de la rétroaction fournie par les enseignants et l’étendue moyenne des gains en écriture chez les élèves (r = 0,69). L’étude conclut que la rétroaction, dépendamment de ses qualités, favorise l’efficacité de l’évaluation formative et contribue à développer les compétences des élèves en écriture.

5.1.6 La carte conceptuelle

La carte conceptuelle ou cartographie conceptuelle est un outil représentant de façon structurée un ensemble de concepts reliés sémantiquement dont les relations de construction sont décrites par des mots (Farza, 2018). Une revue systématique (Stevenson, Hartmeyer et Bentsen, 2017) a examiné comment les technologies de cartographie conceptuelle sont un outil stimulant l’apprentissage autorégulé chez les élèves du primaire et du secondaire. L’analyse basée sur 17 articles révèle que les technologies de cartographie conceptuelle influencent positivement l’apprentissage autorégulé tout en améliorant les compétences métacognitives et la motivation des élèves à divers degrés.

5.2 La mise en oeuvre de l’évaluation formative

Les impacts de la mise en oeuvre de l’évaluation formative en tant qu’unité de pratiques intégrées sont examinés dans près de la moitié des études (17 sur 35). Au niveau des recherches documentaires, deux revues systématiques (Heitink, Van der Kleij, Veldkamp, Schildkamp et Kippers, 2016 ; Leong, Ismail, Costa et Tan, 2018) et deux méta-analyses (Black et Wiliam, 1998 ; Kingston et Nash, 2011) ont examiné cette question. Les revues systématiques ont porté sur la mise en oeuvre de l’évaluation formative dans les contextes de l’Asie de l’Est (Leong et coll., 2018) et de l’Australie (Heitink et coll., 2016). Les résultats indiquent que, malgré les conceptualisations divergentes de l’évaluation formative présentées dans les recherches, des preuves indiquent, dans les deux revues systématiques, que les pratiques de l’évaluation formative aident les élèves à mieux apprendre.

Cependant, les effets positifs des pratiques de l’évaluation formative sont mis en lien avec l’efficacité de son implémentation. L’efficacité des pratiques en évaluation formative est dépendante de la qualité de la rétroaction fournie aux élèves, de l’implication de ces derniers dans l’élaboration et le partage des objectifs et critères d’évaluation, de l’amélioration des compétences des enseignants et des élèves à l’utilisation des stratégies de l’évaluation formative. À ce niveau, les résultats des deux revues systématiques révèlent unanimement que les impacts positifs des pratiques de l’évaluation formative sur l’apprentissage des élèves sont faibles, limités ou nuls lors de mises en oeuvre inefficaces.

Des facteurs tels le manque de capacités des enseignants et la pression des examens externes sont signalés comme des obstacles majeurs à la mise en oeuvre de l’évaluation formative. Dans certains contextes, des traditions d’apprentissage enracinées faisant de l’enseignant le détenteur ultime des connaissances créent aussi des attitudes, tant chez les élèves que chez les enseignants, qui posent des défis à une démarche collaborative de l’évaluation où les responsabilités de l’apprentissage sont partagées avec les élèves (Leong et coll., 2018). Les deux études suggèrent que l’efficacité de l’évaluation formative exige un équilibre entre les connaissances, compétences, croyances et attitudes aussi bien des enseignants que des élèves.

Les résultats de la méta-analyse de Black et Wiliam (1998) et de celle de Kingston et Nash (2011) ont montré que les pratiques efficaces de l’évaluation formative ont des impacts positifs importants sur l’apprentissage des élèves, quel que soit leur niveau scolaire. Black et Wiliam (1998) incluent, dans les qualités de l’évaluation formative, deux principales caractéristiques, à savoir la diversification des instruments et la rétroaction fournie pour aider les plus faibles. La taille d’effet de l’évaluation formative est comprise entre 0,40 et 0,70 dans l’étude de Black et Wiliam (1998) et dans celle de Kingston et Nash (2011), elle est située entre 0,20 et 0,25. L’évaluation formative serait plus efficace en enseignement de l’anglais qu’en enseignement des mathématiques ou des sciences (taille d’effet moyen respective : 0,32 ; 0,17 et 0,09). L’évaluation formative intervenant après une formation des enseignants et les pratiques soutenues par les systèmes informatisés se révèlent plus efficaces que celles basées sur les approches ordinaires avec une taille de l’effet moyen de 0,30 et 0,28 respectivement en anglais et en mathématiques (Kingston et Nash, 2011).

Les résultats de ces deux méta-analyses sont remis en cause dans les analyses critiques de Dunn et Mulvenon (2009) et McMillan, Venable et Varier (2013). Relevant des problèmes méthodologiques dans ces deux méta-analyses, les examens critiques révèlent que les effets estimés de l’évaluation formative seraient plus faibles que ceux présentés dans les méta-analyses. Selon les auteurs, la certitude que l’utilisation de l’évaluation formative augmente directement les résultats des élèves est une idée répandue par convention. L’inexistence d’une définition et de composantes exactes de l’évaluation formative profite à « des approches méthodologiques suspectes dans les efforts visant à démontrer des effets positifs qui pourraient être attribués aux évaluations formatives » (Dunn et Mulvenon, 2009, p. 1, traduction libre). Les auteurs suggèrent que les généralisations sont inappropriées et qu’en l’absence de plus de données empiriques, les résultats revendiqués dans les méta-analyses de Black et Wiliam (1998) et de Kingston et Nash (2011) doivent être considérés comme provisoires.

Les résultats de huit études quantitatives (Andersson et Palm, 2017 ; Babinčáková, Ganajová, Sotáková et Bernard, 2020 ; Boumediene et Hamzaoui-Elachachi, 2017 ; Burns, Klingbeil et Ysseldyke, 2010 ; Phelan, Choi, Vendlinski, Baker et Herman, 2011 ; Polly, Wang, Martin, Lambert, Pugalee et Middleton, 2017 ; Saeed, Tahir et Latif, 2018 ; Vásquez, Nussbaum, Sciarresi, Martínez, Barahona et Strasser, 2017) rapportent aussi des preuves de l’efficacité des pratiques de l’évaluation formative dans divers contextes (Algérie, Chili, États-Unis, Pakistan, Suède, Slovaquie). Les résultats des différentes études révèlent des impacts positifs, aussi bien sur les processus d’apprentissage que sur l’amélioration des rendements chez les élèves du groupe expérimental par rapport aux élèves des groupes témoins en français, en lecture/écriture, en orthographe et en mathématique. Cependant, l’étude de Saeed et coll. (2018), dans le contexte pakistanais, indique que la plupart des enseignants (n = 500) des écoles primaires et secondaires reconnaissent les potentialités de l’évaluation formative, mais que ces derniers utilisent plus l’évaluation sommative.

Les résultats des recherches de Burns et coll. (2010), Polly et coll. (2017) et de Vásquez et coll. (2017) qui ont examiné l’utilisation d’un programme d’évaluation formative basée sur la technologie, respectivement dans le contexte de Floride, de la Caroline du Nord et du Chili, rapportent des preuves de l’efficacité de l’évaluation formative assistée par ordinateur. L’étude de Burns et coll. (2010) a porté sur un échantillon de 360 écoles. La recherche de Polly et coll. (2017) a suscité la participation de 906 enseignants et 13 567 élèves. L’étude de Vásquez et coll. (2017) a porté sur un échantillon de 90 élèves. Les résultats issus des différentes analyses montrent une augmentation du niveau de rendements de tous les élèves du groupe expérimental grâce à l’évaluation formative assistée par ordinateur. Il y a un effet positif sur le pourcentage d’élèves qui réussissent aux évaluations sommatives (Burns et coll., 2010). Les études concluent que l’évaluation formative assistée par les technologies est plus efficace pour atteindre de meilleurs apprentissages et rendements.

Enfin, deux études qualitatives (Antoniou et James, 2014 ; Büyükkarci, 2014) et une étude mixte (Kirton, Hallam, Peffers, Robertson et Stobart, 2007) qui ont examiné comment les enseignants et les élèves perçoivent l’efficacité de l’évaluation formative parviennent à des résultats comparables à ceux des études précédentes. Les résultats indiquent que les pratiques formatives sont adoptées sans réserve par les enseignants et les écoles qui jugent que les principales pratiques mises en oeuvre impactent positivement la responsabilisation des élèves, leur motivation, leur autonomie et leurs rendements dans les tests sommatifs. Cependant, bien que les enseignants aient des perceptions positives de l’utilisation des pratiques de l’évaluation formative, leur défaut de compétences et le manque de temps limitent leur mise en oeuvre effective (Antoniou et James, 2014).

6. Discussion

Notre recherche visait à documenter les recherches scientifiques ayant identifié les meilleures pratiques évaluatives en évaluation formative qui favorisent l’apprentissage des élèves dans les contextes de l’enseignement primaire et secondaire à partir d’une revue systématique. La recherche a identifié 35 études probantes révisées par les pairs. Sept pratiques clés de l’évaluation formative sont promues dans les recherches : l’autoévaluation, l’autorégulation, l’évaluation par les pairs, l’évaluation par le portfolio, l’utilisation des grilles d’évaluation, la carte conceptuelle et la rétroaction.

Deux hiérarchies de preuves concernant les pratiques de l’évaluation formative se dégagent des résultats des études : les pratiques confirmées et les pratiques en développement. Les pratiques confirmées sont celles dont les preuves sont supportées par les résultats de plusieurs études d’envergure, dont les revues systématiques, les méta-analyses, les critiques de méta-analyse, les études quantitatives expérimentales ou quasi expérimentales ainsi que les études qualitatives.

Cinq pratiques de l’évaluation formative sont des pratiques probantes confirmées. Il s’agit de l’autoévaluation, de l’évaluation par les pairs, de l’évaluation par le portfolio, de l’utilisation des grilles d’évaluation et de la carte conceptuelle. Ces pratiques confirmées de l’évaluation formative ont une incidence sur les processus d’apprentissages et sur les rendements des élèves. Leur efficacité est discutée à travers plusieurs études probantes, dont les revues systématiques (Burner, 2014 ; Panadero et Jonsson, 2013 ; Sebba et coll., 2008 ; Stevenson et coll., 2017), les méta-analyses (Black et Wiliam, 1998 ; Sanchez et coll., 2017), les études quantitatives (Babinčáková et coll., 2020 ; Chang et coll., 2013 ; Panadero et coll., 2012 ; Sadler et Good, 2006), qualitatives (Lee, 2007 ; Mak et Wong, 2018 ; McLaren, 2012 ; Ní Chróinín et Cosgrave, 2013 ; Noonan et Duncan, 2005) et mixtes (Burner, 2016 ; Butler et Lee, 2010 ; Vandergrift, 2000).

Les pratiques en développement sont celles identifiées par les recherches comme meilleures, mais dont les preuves d’efficacité sont toujours en train d’émerger en regard du nombre limité d’études probantes qui supportent leurs résultats. Elles concernent les pratiques d’autorégulation et les formats des rétroactions. Si l’autorégulation conduit les élèves à de meilleurs apprentissages, le développement des compétences autorégulatrices mis en lien avec la pratique de l’autoévaluation dans les études (Mak et Wong, 2018 ; Panadero et coll., 2012) n’est supporté que par une étude (Perels et coll., 2009).

Quant à la rétroaction, bien que sa pratique ressorte dans plusieurs études comme une condition substantielle de la remédiation et de l’efficacité de l’évaluation formative (Black et Wiliam, 1998 ; Heitink et coll., 2016), la relation entre la qualité ou le format des rétroactions fournies aux élèves et le développement de leurs apprentissages n’est pas discutée dans plusieurs études. Les études qui discutent de l’efficacité de la qualité de la rétroaction à partir de sa nature et de ses variétés (Burner, 2016 ; Lee, 2007 ; Parr et Timperley, 2010) indiquent que les rétroactions normatives et négatives sont inefficaces, contrairement aux rétroactions interactives et positives, reconnues favorables à l’autorégulation des apprentissages. Ces conclusions sont conformes aux résultats des recherches de Grangeat et Lepareur (2019) et d’Hattie et Timperley (2007) qui ont examiné la nature et les conditions de mise en oeuvre de la rétroaction en classe. Ces études notent que la rétroaction n’est pas efficace pour tous les élèves et que l’état actuel des recherches ne présente que des esquisses de modèles de rétroactions à utiliser.

Les impacts positifs de la mise en oeuvre de l’évaluation formative en tant qu’ensemble des pratiques sur les apprentissages des élèves sont largement promus dans la majorité des études retenues. Que ce soit au niveau des revues systématiques (Burner ; 2014 ; Panadero et Jonsson, 2013 ; Sebba et coll., 2008 ; Stevenson et coll., 2017), des méta-analyses (Black et Wiliam, 1998 ; Sanchez et coll., 2017), des études quantitatives (Andersson et Palm, 2017 ; Babinčáková et coll., 2020 ; Boumediene et Hamzaoui-Elachachi, 2017 ; Panadero et coll., 2012 ; Perels et coll., 2009 ; Phelan et coll., 2011 ; Polly et coll., 2017 ; Sadler et Good, 2006), qualitatives (Antoniou et James, 2014) et mixtes (Büyükkarci, 2014 ; Kirton et coll., 2007), des preuves aident à soutenir l’idée que la pratique de l’évaluation formative aide les élèves à mieux apprendre en agissant sur trois domaines en situation d’apprentissage : la motivation à étudier, la prise de conscience par les élèves de leur propre processus d’apprentissage et leur rendement scolaire.

Les revues systématiques et les méta-analyses ont montré que les pratiques d’une évaluation formative de qualité ont des impacts positifs importants sur les apprentissages des élèves, quel que soit leur niveau scolaire, et ce, même si elles doivent être relativisées par les critiques de méta-analyse (McMillan et coll., 2013 ; Dunn et Mulvenon, 2009). Les effets positifs constatés dans les études quantitatives qui ont examiné l’impact de l’évaluation formative et de ses pratiques sur les apprentissages et les rendements corroborent son rôle crucial dans la promotion de l’apprentissage en classe. Les recherches montrent que, lorsque les enseignants reçoivent des formations pour les aider à s’améliorer en évaluation formative, ou lorsque l’évaluation formative est appuyée par la technologie, les impacts sur les apprentissages et sur les rendements des élèves sont meilleurs (Andersson et Palm, 2017 ; Burns et coll., 2010 ; Kingston et Nash, 2011 ; Polly et coll., 2017 ; Vásquez et coll., 2017).

Les potentialités de l’évaluation formative établies dans les recherches quantitatives sont conformes aux résultats des études qualitatives et mixtes ayant examiné les perceptions et les expériences des enseignants et des élèves. Les différentes conclusions des études quantitatives, qualitatives et documentaires défient ainsi l’hypothèse développée par certains auteurs selon laquelle l’idée que l’utilisation de l’évaluation formative augmente directement les rendements scolaires est une sagesse conventionnelle (Dunn et Mulvenon, 2009).

Dans les recherches répertoriées dans la présente étude, l’efficacité de l’ensemble des pratiques de l’évaluation formative est étroitement liée aux conditions de leur mise en oeuvre. Les revues systématiques qui ont pris en compte les questions relatives aux conditions de mise en oeuvre de l’évaluation formative (Heitink et coll., 2016 ; Leong et coll., 2018) révèlent que certaines croyances et attitudes des enseignants et des élèves, ou encore, la pression des examens externes sont des obstacles qui limitent la mise en oeuvre efficace des pratiques liées à l’évaluation formative en classe.

Alors que ces conclusions sont partagées dans la méta-analyse de Black et Wiliam (1998), qui lie les effets positifs des évaluations formatives à leur qualité, les résultats des recherches quantitatives, qualitatives et mixtes (Burner, 2016 ; Büyükkarci, 2014 ; Noonan et Duncan, 2005 ; Saeed et coll., 2018) permettent de relever que, malgré la conscience de l’utilité des pratiques de l’évaluation formative, le manque de compétences des enseignants et l’immaturité des élèves du primaire et du secondaire sont discutés comme des défis qui limitent les pratiques effectives des activités liées à l’évaluation formative.

Le perfectionnement professionnel des enseignants, la formation des élèves, la modification des pratiques d’évaluation, le changement d’attitudes en rapport avec le rôle de l’élève dans l’enseignement-apprentissage sont autant de conditions pour implémenter les pratiques gagnantes de l’évaluation formative en salle de classe. À défaut, certains auteurs s’inquiètent de l’effet à long terme des pratiques d’évaluation formative mal comprises ou de la création d’écarts entre les élèves par l’évaluation formative qui n’est pas bien mise en oeuvre (Antoniou et James, 2014 ; Chouinard, Bowen, Cartier, Desbiens, Laurier, Plante et Butler, 2005).

7. Implications

Trois constats ressortent à la suite de cette revue systématique. Le premier constat est relatif aux contextes et aux disciplines concernées par les études. Dans l’ensemble, plus d’études ont été envisagées dans le contexte de l’école primaire où 14 études quantitatives, qualitatives et mixtes ont été réalisées contre sept études conduites dans le contexte du secondaire. Concernant les disciplines, l’évaluation formative a été envisagée dans plusieurs disciplines scolaires (mathématiques, lecture/écriture, français, biologie, anglais, informatique, éducation physique, sciences sociales). Les mathématiques et l’anglais au primaire se dégagent comme les disciplines où l’utilisation de l’évaluation formative est plus explorée dans les études. Il est important que des études soient envisagées dans les autres disciplines, surtout dans le contexte du secondaire.

Le deuxième constat distingue deux groupes de pratiques de l’évaluation formative à travers les recherches. L’autoévaluation, l’évaluation par les pairs, l’utilisation du portfolio, la carte conceptuelle, les grilles d’évaluation se révèlent comme des pratiques confirmées dans les recherches probantes. Des revues systématiques, des méta-analyses et des recherches quantitatives fournissent des preuves de leurs potentialités. Les résultats positifs des effets du développement des compétences d’autorégulation des élèves et des formats de la rétroaction (discussions interactives et orales) sur les apprentissages situent ces pratiques comme des pratiques émergentes et prometteuses en évaluation formative. Cependant, le nombre limité de recherches probantes les ayant examinées nécessite d’autres recherches expérimentales et longitudinales afin de les confirmer.

Le dernier constat est relatif au contexte géographique et à la langue des études analysées. Selon les zones géographiques et la langue, les pays européens, américains et asiatiques (enregistrant respectivement neuf, sept et six études) dominent les recherches probantes réalisées en évaluation des apprentissages, contrairement aux contextes africain et océanique. Des articles retenus, aucune étude n’est francophone. Cela implique que des efforts restent à faire dans ces contextes éducatifs.

8. Limites de la recherche

Cette recherche présente des limites qu’il convient de relever. La première limite de cette revue systématique est inhérente à toute recherche documentaire : l’exhaustivité. En effet, il se pourrait que cette recherche n’ait pas identifié toutes les études liées aux pratiques évaluatives probantes, d’autant plus que le critère linguistique (français et anglais seulement) excluait déjà des études potentiellement importantes menées dans d’autres langues. Ensuite, considérant qu’il existe plusieurs conceptualisations des composantes de l’évaluation formative, il a été impossible de définir un plan de concepts exhaustifs pour chercher le corpus des études dans les bases de données. Il se pourrait que, par le fait même, nos équations de recherche n’aient pas permis de couvrir totalement le champ conceptuel des pratiques évaluatives. Aussi l’approche utilisée n’a pas recouru à un accord d’interjuges pour évaluer les études analysées. Il est nécessaire de mener d’autres recherches documentaires sur les pratiques évaluatives probantes.

9. Conclusion

Cette recherche visait à documenter les pratiques évaluatives formatives probantes dans le contexte de l’enseignement primaire et secondaire. La recherche systématique a abouti à l’analyse de 35 articles révisés par les pairs. Les résultats révèlent que l’évaluation formative est un outil qui a un impact sur l’apprentissage des élèves, tant sur le processus que sur les résultats. Sept pratiques de l’évaluation formative, dont cinq confirmées et deux en développement, sont mises en évidence dans les études comme étant efficaces pour améliorer l’apprentissage des élèves : l’implication des apprenants dans le processus d’évaluation à travers les pratiques de l’autoévaluation, l’évaluation par les pairs, l’autorégulation, l’évaluation par le portfolio, l’utilisation des grilles d’évaluation, la carte conceptuelle et la rétroaction. Cependant, les études mettent leur efficacité en lien avec les conditions de mise en oeuvre. Les recherches montrent des défis en lien avec une mise efficace de ces pratiques d’évaluation dans les salles de classe. De nombreux facteurs de l’environnement scolaire, dont des facteurs liés aux compétences des enseignants et des élèves, la pression des examens et le manque de temps, limitent l’efficacité des pratiques de l’évaluation formative ou font en sorte que des tentatives de promotion de l’évaluation formative échouent dans certains contextes.

Il y a des implications pour les politiques, les pratiques et la recherche. Sur le plan des politiques et des pratiques, il est important que les politiques éducatives instaurent un environnement d’apprentissage favorable à l’émergence et à la pratique de l’évaluation formative par les enseignants. Au point de vue de la recherche, il est nécessaire de mener d’autres recherches documentaires systématiques sur les pratiques évaluatives probantes ainsi que des études longitudinales afin de confirmer l’efficacité des pratiques identifiées.

forme: 2277968.jpg
Noaga Dieudonné Kaboré
Étudiant à la maitrise, Université Laval

forme: 2277969.jpg
Éric Frenette
Professeur, Université Laval

forme: 2277970.jpg
Marie-Hélène Hébert
Professeure, Université TÉLUQ