Corps de l’article

Introduction

L’incertitude médicale

L’incertitude est prégnante dans le soin. Depuis plus de 50 ans, les définitions qui en sont proposées sont de plus en plus riches et complexes, au point d’être parfois trop approximatives pour être utiles (Babrow et al., 1998 ; Beresford, 1991 ; Biehn, 1982 ; Fox, 1980). Han et al. (2011) constatent que les apports théoriques peinent à déboucher sur une évolution des pratiques, du fait d’une grande disparité des phénomènes que recouvre le terme incertitude et de l’absence de taxonomie claire de cette notion sur laquelle s’appuyer. Ils proposent une définition au niveau le plus fondamental de l’incertitude qui répond à tous les phénomènes rattachés à ce terme : la perception subjective d’une ignorance (Han et al., 2011). À partir d’une revue de la littérature médicale, mais aussi de la littérature en communication, en ingénierie et en psychologie, ils exposent un cadre de compréhension qui synthétise les différentes théories et perspectives concernant le phénomène d’incertitude. Cette taxonomie (science de la classification) conceptuelle intégrative comporte trois dimensions qui caractérisent l’incertitude dans le soin selon : a) ses sources (probabilité, ambiguïté, complexité), b) ses enjeux (scientifique, pratique, personnel) et c) son locus. Chacun des enjeux de l’incertitude peut être généré par une ou plusieurs des sources.

Par exemple, un homme envisageant une prostatectomie radicale pour un cancer récemment diagnostiqué peut expérimenter l’incertitude selon plusieurs enjeux : le risque de récidive après la chirurgie, la compétence de son chirurgien et de l’hôpital choisi, sa capacité à endurer les effets secondaires potentiels (p. ex., le dysfonctionnement érectile ou l’incontinence urinaire), le retentissement de ces effets secondaires potentiels sur sa vie maritale, sa vision du bien-être ou le sentiment d’accomplissement de ses objectifs de vie. En théorie, des probabilités existent pour chacun de ces enjeux, bien qu’elles soient inconnues à des degrés variables, eux-mêmes amplifiés par des degrés variés de complexité. La troisième dimension de cette taxonomie, le locus, correspond au lieu où s’exprime l’incertitude. Le locus traduit le fait que l’incertitude s’inscrit dans une relation de soin puisqu’elle peut être présente, à des degrés variables, chez le soignant comme le soigné ou chez son entourage.

La tolérance à l’incertitude médicale

La tolérance à l’incertitude médicale et la formation à sa gestion connaissent un intérêt croissant ces 30 dernières années (Cooke & Lemay, 2017 ; Han et al., 2019 ; Russel et al., 2021). La nécessité d’investir ces sujets est actuellement renforcée par la crise sanitaire induite par la pandémie de coronavirus et par les multiples incertitudes qu’elle génère. Pourtant, cette dimension de l’exercice de la médecine est actuellement peu abordée en formation médicale initiale, tout au moins en tant qu’objet explicite d’enseignement et d’apprentissage.

Une étude transversale a été réalisée auprès de tous les directeurs de département de médecine générale des universités de médecine allopathique des États-Unis pour décrire comment la gestion de l’incertitude est intentionnellement et systématiquement enseignée. Elle met ainsi en évidence que l’objectif pédagogique « discuter avec le patient de toute incertitude dans le diagnostic ou la prise en charge » est celui qui a le moins d’heures d’enseignement dédié. En effet, 38 % des départements de médecine générale déclarent même n’avoir aucune formation dédiée à cet objectif (Ledford et al., 2015).

Former les professionnels et professionnelles de la santé à sa gestion nécessite de procéder par étapes :

  • Définir le modèle de compréhension de l’incertitude sur lequel s’appuierait son approche pédagogique ;

  • Chercher un outil d’évaluation cohérent avec ce modèle disponible pour la communauté francophone afin d’évaluer les formations proposées.

Revue de littérature

De multiples publications récentes abordent la problématique de la formation à l’incertitude. La taxonomie de Han et al. (2011) décrite au début de cet article clarifie la diversité et la complexité des situations d’incertitude rencontrées dans l’exercice médical. En 2017, un article paru dans Academic Medicine fait le constat de la prégnance de l’incertitude dans l’exercice médical et met en avant la nécessité d’intégrer cette dimension dans la formation au raisonnement clinique (Cooke & Lemay, 2017). La même année est publiée dans International Journal of Medical Education une revue de la littérature sur la connaissance épistémique dans la formation médicale. Eastwood et al. (2017) y font la proposition pédagogique d’une approche réflexive qui positionne la pratique comme l’endroit propice pour développer de nouveaux savoirs et pour apprendre à explorer l’incertitude en engageant des sources de connaissances variées, y compris tacites ou expérientielles. Deux ans plus tard, ce constat d’incertitude inhérente à l’exercice médical est confirmé dans un article paru dans Medical Teacher, où les auteurs proposent 12 conseils à destination des étudiants et des professeurs pour en améliorer la formation (Gheihman et al., 2019).

C’est en 2020, dans Pédagogie Médicale, qu’est proposé un modèle de compréhension de l’incertitude en tant qu’objet d’apprentissage (Motte et al., 2020). C’est ce modèle que nous sélectionnons. En effet, tout en restant cohérent avec les publications précédentes, ce modèle permet d’envisager une approche pédagogique globale de l’incertitude qui dépasse les conseils ponctuels ou l’approche centrée sur le raisonnement clinique.Trois principales dimensions sont décrites dans ce modèle :

  1. La diversité et la complexité des composantes de l’incertitude ainsi que son caractère inhérent à l’exercice médical sont à rapporter au fait que cet exercice médical est une pratique soignante, plutôt qu’une science appliquée. L’incertitude est générée par l’expérience complexe de l’agir médical ;

  2. La tolérance à l’incertitude et sa gestion en médecine nécessitent une capacité réflexive tant dans les connaissances qui sont mobilisées que dans leur mise en application concrète et dans des épistémologies personnelles riches ;

  3. L’enrichissement des épistémologies personnelles peut avoir lieu à travers une pédagogie expérientielle et réflexive lorsque l’individu, concrètement confronté aux limites de ses croyances pour faire face à une situation, s’engage dans un processus visant à les faire évoluer.

En fonction des types d’incertitude rencontrés et du contexte dans lequel ils sont vécus, le soignant va mobiliser différentes épistémologies dans un processus collectif (comprenant au minimum le médecin et le patient) et réflexif de transaction avec son environnement. Certains auteurs explorent les implications des concepts clés de leur modèle sur la formation et proposent un ancrage pragmatiste (Noiriel, 1994 ; Schön, 2011) de la pédagogie de l’incertitude médicale qui pourrait s’appuyer sur trois grandes dimensions : expérientielle, réflexive et collective. Une telle approche représente un changement de paradigme dont les champs d’application sont nombreux. Une évaluation de sa mise en oeuvre est donc indispensable et nécessite d’avoir à disposition des outils ayant subi un processus de validation.

Outils d’évaluation de l’incertitude médicale actuellement disponibles

De nombreuses échelles d’évaluation ont été développées au cours des 50 dernières années, essentiellement pour évaluer la tolérance à l’incertitude ou à l’ambiguïté (termes parfois utilisés indistinctement pour désigner le même concept) en médecine (Furnham & Ribchester, 1995 ; Hillen et al., 2017). Cependant, aucun outil en français ayant subi un processus de validation n’a fait l’objet d’une publication. Or, la communauté médicale francophone a besoin d’investir et d’évaluer la formation à l’incertitude tout autant que le reste du monde. Il est par conséquent nécessaire d’identifier un outil d’évaluation cohérent avec le modèle précité qu’il serait possible de traduire et de tester pour présenter des preuves de validité appuyant les inférences faites à partir des données.

La majorité des échelles d’évaluation de l’incertitude ou de l’ambiguïté existantes souffrent d’une faible fidélité ou de fondements théoriques trop flous (Furnham & Ribchester, 1995 ; Hillen et al., 2017). Si l’on cherche à évaluer la tolérance à l’incertitude médicale en contexte de soin, l’échelle qui semble la plus utilisée est la Physicians’ Reactions to Uncertainty (PRU), conçue en 1990 et révisée en 1995 (Gerrity et al., 1990). Cette échelle évalue de façon décontextualisée l’angoisse liée à l’incertitude dans le soin, l’inquiétude quant aux conséquences négatives ainsi que la capacité à communiquer l’incertitude au patient et aux collègues. La diversité et la complexité de l’incertitude inhérente à l’agir médical n’apparaissent pas dans cette évaluation ; le lien entre la gestion de l’incertitude et les épistémologies personnelles non plus. Par conséquent, la compréhension de l’incertitude sur laquelle repose la PRU est insuffisamment cohérente avec un modèle de compréhension de l’incertitude tel qu’il a été évoqué ci-dessus.

La Tolerance of Ambiguity in Medical Students And Doctors (TAMSAD; voir Annexe 1) semble plus pertinente au regard de ce modèle (Hancock et al., 2015). Pour ces auteurs, l’ambiguïté serait le stimulus, tandis que l’incertitude serait la réaction à une situation ambiguë. Ils font l’hypothèse qu’un individu ayant des épistémologies personnelles plus riches serait plus tolérant à l’ambiguïté. Ils postulent aussi que la tolérance à l’ambiguïté n’est pas un trait figé, mais est susceptible de changer en fonction de l’environnement et du contexte. Ce rapport à l’épistémologie ainsi que le fait que la tolérance à l’incertitude/l’ambiguïté soit évolutive en fonction de l’environnement et du contexte sont des caractéristiques du modèle de compréhension de l’incertitude qu’on retrouve dans cette échelle, et pas dans les autres. Pour mesurer la tolérance à l’ambiguïté des étudiants en médecine et des jeunes docteurs, Hancock et al. (2015) définissent les caractéristiques de leur échelle. Elle doit contenir des items contextualisés cliniquement; avoir une quantité et une variété suffisantes d’items pour être sensible à des changements discrets; traiter la tolérance à l’ambiguïté comme étant le résultat d’une construction complexe, potentiellement multidimensionnelle et susceptible d’évoluer; et faire la preuve d’une bonne fidélité.

Les auteurs de la TAMSAD ont publié les preuves de validité de leur échelle finale de 29 items en suivant des recommandations internationalement reconnues (Downing, 2003). La validité liée au contenu vient de la provenance des items. Ils sont tous dérivés d’une analyse de la littérature pédagogique, de théories de pédagogie médicale et d’échelles préexistantes d’évaluation de la tolérance à l’ambiguïté.

Tous les items ont été rédigés comme des affirmations vis-à-vis desquelles les répondants doivent évaluer leur accord sur une échelle de Likert à 5 points allant de 1 = pas du tout d’accord à 5 = tout à fait d’accord avec un score intermédiaire 3 = neutre. La plupart des échelles préexistantes d’évaluation de l’incertitude utilisent elles aussi une échelle de Likert pour l’évaluation (Budner, 1962 ; Geller et al., 1993 ; Gerrity et al., 1990). Le processus de réponse a été pris en compte lors du développement de l’échelle. Les items inadéquats ou difficiles à comprendre ont été retirés ou réécrits par des universitaires et par des cliniciens. Une étude pilote a été réalisée auprès de 10 étudiants et internes à qui il était demandé de commenter les items qu’ils trouvaient difficiles à comprendre ou pour lesquels il était difficile de répondre. Les données recueillies pour tester les preuves de validité appuyant les inférences faites à partir des données ont été vérifiées.

L’analyse factorielle d’une version de la TAMSAD à 38 items indiquait que ces items ne pouvaient pas être subdivisés en une liste réduite de facteurs interprétables. L’extraction des principaux facteurs a mis en évidence 13 facteurs dont la valeur propre était >1, mais le diagramme d’éboulis (scree plot) suggérait une solution à 5 facteurs représentant 33 % de la variance totale. Cependant, les cinq facteurs ne permettaient pas d’interprétation simple (même après le recours à une rotation varimax) et de nombreux items n’avaient pas de coefficient de saturation >0,30 ou avaient un effet modéré de saturation sur plus d’un facteur. Le recours à des méthodes de rotation ou d’extraction alternatives n’a pas permis de trouver une solution simple. Le score de l’alpha de Cronbach initial fut calculé à 0,75 et les auteurs ont interprété ces résultats comme suggérant que l’échelle TAMSAD agissait comme une approche unidimensionnelle de la tolérance à l’ambiguïté. Ils ont ensuite cherché à améliorer la concision et la fiabilité de l’échelle en réduisant le nombre d’items. Le retrait de sept items a permis d’augmenter la consistance interne de l’échelle à 0,80. Finalement, deux items supplémentaires qui avaient une corrélation ajustée item/total <0,20 ont été retirés. L’alpha de Cronbach est resté inchangé à 0,80. Cette mesure de consistance interne est supérieure à celles obtenues pour les échelles de tolérance à l’ambiguïté préexistantes (Budner, 1962 ; Geller et al., 1993).

La relation de la tolérance à l’ambiguïté mesurée par la TAMSAD à d’autres variables telles que l’identité de genre, le fait d’avoir été en stage, l’avancée dans le cursus ou le choix de spécialité a été recherchée. Les conséquences de passation de la TAMSAD sont jugées minimes. Remplir le questionnaire de 29 items prend 5 à 10 minutes et les auteurs jugent peu probable que cette durée ait un impact négatif sur les étudiants. Nous avons donc sélectionné cette échelle pour la pertinence de son approche et des concepts sur lesquels elle s’appuie, pour son design d’élaboration ainsi que pour sa fiabilité.

Notre objectif est la mise à disposition à la communauté médicale d’une traduction française adaptée culturellement de la TAMSAD et pour laquelle des preuves de validité des scores obtenus soient évaluées selon les mêmes critères de validation que pour l’échelle originale. Pour ce faire, nous procéderons à une traduction et à une adaptation culturelle de l’échelle, puis à une vérification des propriétés psychométriques, dont nous présenterons les forces et faiblesses dans la discussion concernant les cinq sources de validité qui doivent être considérées (Downing, 2003) : la validité liée au contenu, le processus de réponse, la structure interne de l’échelle, la relation aux autres variables et les conséquences d’utilisation de cette échelle.

Méthode

Traduction et adaptation culturelle

Pour obtenir une version française de ce questionnaire la plus fidèle à la version originale (TAMSAD ; voir Annexe 1), nous nous sommes référés à des recommandations de traduction et d’adaptation culturelle reconnues (Guillemin et al., 1993). Plusieurs traductions doivent être produites par au moins deux traducteurs indépendants en privilégiant des traducteurs professionnels traduisant dans leur langue maternelle. Autant de traductions inversées doivent être produites par des traducteurs indépendants, et ce, toujours en privilégiant des traducteurs professionnels traduisant dans leur langue maternelle. Pour notre travail, deux traductions de l’échelle originale vers le français ont été obtenues grâce à deux traducteurs professionnels indépendants de langue maternelle française. Puis, deux traductions inversées des versions françaises vers l’anglais ont été réalisées par deux traducteurs professionnels indépendants de langue maternelle anglaise.

Un comité de relecture constitué avait pour objectif de produire la version finale de la traduction à partir des traductions et des traductions inversées. Multidisciplinaire, il était composé d’experts de l’objet du questionnaire et d’individus constituant le public cible du questionnaire. La présence de membres bilingues était une plus-value. Au besoin, le comité a pu solliciter l’aide de l’auteur principal du questionnaire original pour s’assurer de maintenir les concepts sous-jacents lors de la traduction. Il pouvait modifier ou éliminer des éléments non pertinents, ambigus ou non adéquats, et produire des tournures plus adaptées.

Par ailleurs, la formulation des questions était soumise à des règles : utiliser des phrases courtes avec des mots clés dans chaque proposition, aussi simples que possible ; privilégier la voix active plutôt que passive ; répéter les noms plutôt qu’utiliser des pronoms ; employer des termes spécifiques plutôt que généraux ; éviter d’utiliser des métaphores et des expressions familières, le mode possessif, des adverbes, des termes « vagues » et des phrases contenant deux verbes différents qui suggèrent des actions différentes.

L’objectif était d’arriver à une équivalence :

  • sémantique : Même sens des termes employés ;

  • idiomatique : Les expressions familières dans une culture ne sont pas traduites mot à mot. Il faut trouver un équivalent culturel dans la langue de traduction ;

  • expérientielle : Lorsqu’une expérience est évoquée dans la proposition originale, mais n’existe pas ou peu dans la culture cible, un équivalent dans la culture cible doit être trouvé ;

  • conceptuelle : Renvoie au fait que parfois le sens des mots est identique, mais les concepts qui y sont rattachés sont différents d’une culture à l’autre. Il faut que les concepts évoqués soient correspondants.

Notre comité de relecture a comparé les traductions inversées avec la version source afin de statuer sur une version française finale la plus proche de la version originale. Il était composé de sept individus :

  • 1 médecin chercheuse en pédagogie médicale ayant travaillé plusieurs années au Canada (bilingue anglophone) ;

  • 2 internes de médecine générale représentatifs du public cible et ayant une expertise du fait de leurs travaux de recherche en cours dans le cadre de leur thèse d’exercice, l’une sur l’exploration qualitative de l’incertitude chez les internes de médecine générale, l’autre contribuant directement à cet article ;

  • 1 médecin généraliste et chef de clinique universitaire, qui dirigeait la thèse d’exercice sur l’exploration qualitative suscitée ;

  • 1 médecin généraliste et enseignant-chercheur, qui est l’auteur principal de cet article ;

  • 1 médecin généraliste remplaçant et chef de clinique universitaire ;

  • 1 psychologue et enseignant-chercheur en psychologie.

Enfin, un prétest peut être effectué auprès d’un échantillon de population qui répond au questionnaire dans le but d’identifier des erreurs ou des écarts de traduction (Guillemin et al., 1993).

Qualité psychométrique de la version française

Recueil des données

La version finale du questionnaire en français (TAMSAD fr ; voir Annexe 2) est une échelle comportant 29 items, comme la version originale. Pour chacun de ces items, la personne interrogée est invitée à évaluer son (dés)accord avec une affirmation au moyen d’une échelle de Likert à 5 points : 1 = pas du tout d’accord, 2 = pas d’accord, 3 = neutre, 4 = d’accord et 5 = tout à fait d’accord.

La TAMSAD fr a été soumise aux étudiants en médecine de 4e et 6e année d’une faculté de médecine et maïeutique française par l’intermédiaire d’un questionnaire en ligne sur la plateforme Sphinx. En plus de l’échelle TAMSAD fr, le questionnaire recueillait les informations suivantes : âge, identité de genre et spécialités médicales à laquelle ils aimeraient accéder après les Épreuves classantes nationales (ECN). Les courriels étaient demandés pour pouvoir apparier les réponses lors des deux temps distincts de recueil de données. Les réponses ont été anonymisées à l’aide d’un tableau de correspondance.

Le recueil des données des étudiants de 6e année de médecine a été effectué, pour les phases test et retest, sur les tablettes électroniques fournies par la faculté avant la réalisation d’un examen. Les étudiants de 4e année ont utilisé leur propre support informatique à la faculté au début d’un cours magistral pour la phase test. Pour la phase retest, ils ont été invités à remplir à nouveau le questionnaire par le biais d’un courriel communiquant le lien du questionnaire en ligne.

Tous les étudiants avaient pour consigne en phase retest de répondre aux questions comme s’il s’agissait de la première fois qu’ils y répondaient, sans chercher à se souvenir des réponses qu’ils avaient sélectionnées la fois précédente. L’intervalle entre les deux passations allait de 8 semaines à 12 semaines et 1 jour. Cet intervalle de temps a été décidé de sorte qu’il soit suffisamment long pour que les étudiants ne se souviennent pas de leurs réponses et suffisamment court pour que leur tolérance à l’ambiguïté ait peu évolué. L’ensemble du protocole de recherche a reçu un avis favorable de la commission de recherche des départements de médecine et maïeutique de l’université d’appartenance en décembre 2018. La faculté de médecine et maïeutique de l’établissement a autorisé cette recherche.

Analyse des données

À partir de l’interface de la plateforme Sphinx, les données ont été rassemblées sur le logiciel Microsoft Excel et analysées à l’aide du logiciel de traitement de données Statistica 10.0 (StatSoft). Les questionnaires présentant des données manquantes à l’échelle TAMSAD fr n’ont pas été utilisés pour l’analyse.

Critère de jugement principal

La version anglaise de l’échelle TAMSAD a fait l’objet d’une analyse factorielle par ses auteurs lors de sa création et de son processus de validation. La TAMSAD fr est une traduction française respectant le nombre, l’ordre et la signification des items de la version originale.

Le critère de jugement principal est la mesure de la consistance interne de la TAMSAD fr avec le calcul du coefficient alpha de Cronbach (valeurs brutes sans les écarts-types) à partir de l’échelle de réponse en 5 points. Le coefficient alpha de Cronbach (α) est utilisé pour vérifier la cohérence avec laquelle plusieurs items d’une étude ou d’un test évaluent la même compétence ou caractéristique. Il est donc adapté à l’évaluation de la consistance interne d’une échelle unidimensionnelle (qui mesure un seul concept) comme la TAMSAD (Taber, 2018). Plus le coefficient alpha de Cronbach est proche de 1, plus la corrélation des items est forte. Un indice supérieur à 0,70 (résultat considéré comme acceptable) indique que les items mesurent vraisemblablement un même construit, ce qu’on cherche à démontrer pour conclure à une bonne cohérence interne (Schweizer, 2011). Les comparaisons de moyenne sont réalisées avec le test de Student et les résultats agrémentés de la taille d’effet sont présentés par le d de Cohen.

Critères de jugement secondaires

Le score de chaque étudiant à la TAMSAD fr a été calculé. Les auteurs de la TAMSAD ont communiqué lors de la publication de leur échelle un calcul de conversion de la moyenne des scores de 1 à 5 de leur échelle en un score de 0 à 100 pour en faciliter la comparaison. Comme pour la version originale (voir Annexe 1), certains items, marqués d’un astérisque, nécessitent une inversion de la réponse pour le calcul (1 devient 5 ; 2 devient 4 ; 3 reste 3). Il faut ensuite transformer le score moyen de l’échelle de 1 à 5 en un score de 0 à 100 en utilisant la formule : Nouveau score = 25 (Ancien score - 1).

Ces scores ont été utilisés pour :

  • Étudier l’influence de divers facteurs sur le niveau de tolérance à l’ambiguïté (identité de genre, niveau d’études médicales et spécialité envisagée, comme lors de la validation de l’échelle originelle par Hancock et al., 2015) ;

  • Évaluer la stabilité test/retest (corrélation intraclasse).

RÉSULTATS

Traduction et adaptation culturelle

Déroulement

Lors de la réunion du comité, pour chaque item en anglais, les deux traductions étaient proposées. Les membres devaient choisir de façon consensuelle laquelle était la plus proche de la version originale, puis l’adapter si nécessaire en suivant les recommandations décrites dans la méthode.

Aucun item n’a été retiré et l’ordre de présentation des items est identique à celui de l’échelle originale. Pour quatre items, le comité a conservé sans la modifier la traduction proposée par un des deux traducteurs professionnels. Pour sept items, la version retenue est une association de formulations proposées par les deux traducteurs professionnels. Pour les items restants, le comité a composé la version française à partir de formulations proposées par les traducteurs professionnels, complétées par des propositions faites par les membres du comité pour respecter les objectifs d’adaptation culturelle (clarté et équivalence, comme détaillées dans la méthode).

Exemple

À titre d’exemple, pour l’item 1, la formulation originale en langue anglaise était : « I would enjoy tailoring treatments to individual patient problems ». Les traductions vers le français étaient : « Je prendrai plaisir à aménager les traitements aux problèmes individuels des patients » et « J’aimerais bien établir des traitements sur mesure correspondant aux problèmes particuliers de chaque patient ». Les traductions inversées vers l’anglais étaient : « I take pleasure in adapting treatments to the individual problems of patients » et « I would like to offer personalized treatments specific to each patient’s problems ». La version finale travaillée puis adoptée par le comité est : « J’apprécierais d’adapter les traitements aux problèmes individuels des patients ».

Droit de modification et éclaircissements de l’auteur principal de la version originale

Pour certains items, conformément à la méthodologie, le comité a pu apporter une modification, aboutissant à une formulation inédite, parfois à une formulation mixte empruntant aux deux traductions proposées. Toutefois, lorsque les avis divergeaient ou que le comité n’arrivait pas à trancher sur la formulation à adopter, l’auteur principal de l’échelle originale en anglais a été consulté par courriel. Les incertitudes étaient essentiellement liées à certains termes pouvant avoir plusieurs significations en langue française.

Ce fut le cas pour deux items. D’abord, dans l’item 2 formulé « I have a lot of respect for consultants who always come up with a definite answer », le terme consultants évoquait à certains membres du comité les médecins – généralistes ou spécialistes – très expérimentés, instruits, pouvant correspondre aux « professeurs » ; et à d’autres, les médecins spécialistes d’un organe ou d’une discipline (non généralistes). Il s’est avéré que la volonté de l’auteur principal était de faire référence aux médecins spécialistes. La traduction suivante a donc été adoptée par le comité : « Les médecins spécialistes que je respecte beaucoup sont ceux qui apportent toujours une réponse tranchée ». Les membres du comité de relecture ont été sollicités par courriel pour leur approbation, après avoir pris connaissance de la précision de l’auteur principal.

Ensuite, pour l’item 14 formulé « Being confronted with contradictory evidence in clinical practice makes me feel uncomfortable », l’auteur principal a également été interrogé à propos du terme evidence pour savoir s’il faisait référence aux preuves scientifiques qui peuvent parfois être contradictoires ou aux éléments (cliniques, paracliniques, etc.) d’une situation, pour un patient, qui sont parfois contradictoires. La réponse de l’auteur a orienté la traduction vers « données contradictoires » en référence à une situation clinique propre.

Par ailleurs, l’item 21 formulé « I feel uncomfortable when textbooks or experts are factually incorrect » a fait l’objet de plusieurs modifications. Les termes factually incorrect, initialement traduits « manifestement dans l’erreur » par le comité, ont été finalement modifiés en « inexacts dans les faits ». La première traduction était jugée trop marquée, orientant vers une réponse en accord avec la proposition. L’expression « inexacts dans les faits » semblait apporter plus de nuance et invitait l’individu interrogé à se positionner.

La version finale (voir Annexe 2) a été validée par l’ensemble du comité comme étant au plus proche du questionnaire original. Il n’a pas été possible de réaliser de prétest pour contrôler la clarté des items. Cependant, la participation au comité d’internes de médecine générale, représentant une partie du public cible de l’échelle, a permis de vérifier la clarté des items durant le processus de traduction.

La clarté des items a aussi été contrôlée au moment de la présentation de l’échelle TAMSAD fr aux étudiants pour la vérification des qualités psychométriques. Lorsque les étudiants ont rempli le questionnaire en présentiel à la faculté, des membres de l’équipe participant à l’étude étaient présents pour répondre aux difficultés et pour leur apporter des précisions si nécessaire. Aucune clarification n’a été demandée, ce qui laisse supposer une bonne compréhension du questionnaire et de ses modalités de passation.

Analyses psychométriques

Taux de réponse

En phase test, le questionnaire a été diffusé à 105 étudiants de 6e année et à 52 étudiants de 4e année (n = 157). Tous ont répondu. Un questionnaire a été exclu, car il était partiellement rempli (taux de réponse = 99 %).

En phase retest, les 157 mêmes étudiants ont été sollicités. Parmi eux, 30 étudiants n’ont pas répondu au questionnaire (19 %). En 6e année, 84 étudiants ont répondu et 9 questionnaires étaient incomplets ; en 4e année, 43 étudiants ont répondu et 3 questionnaires étaient incomplets. Au total, 115 questionnaires étaient exploitables (taux de réponse = 73 %). La répartition de la population étudiée (questionnaires TAMSAD fr remplis) est présentée dans le Tableau 1.

Tableau 1

Effectifs des sous-populations dans l’échantillon d’étudiants en médecine

Effectifs des sous-populations dans l’échantillon d’étudiants en médecine

-> Voir la liste des tableaux

Consistance interne des scores

Le coefficient alpha de Cronbach a été calculé en utilisant les questionnaires complets recueillis, c’est-à-dire avec une réponse pour les 29 items, pour l’ensemble des répondants du test et du retest, mais aussi pour les sous-populations en fonction de l’identité de genre ou de l’avancée dans les études (4e ou 6e année de médecine). Les résultats sont présentés dans le Tableau 2.

Tableau 2

Alphas de Cronbach calculés en fonction des sous-populations

Alphas de Cronbach calculés en fonction des sous-populations

-> Voir la liste des tableaux

Les valeurs sont plus hétérogènes et plus basses lors du test que lors du retest. L’alpha de Cronbach est mesuré à 0,68 pour l’ensemble des questionnaires recueillis lors du test et à 0,76 lors du retest. La valeur d’alpha de Cronbach la plus basse est mesurée à 0,58 pour les résultats des étudiants de 4e année lors de la 1re passation du questionnaire.

Pour le calcul de la stabilité test-retest, seuls les questionnaires qui pouvaient être appariés (entre les 1re et 2e passations) étaient utiles. Parmi les 115 réponses exploitables lors de la 2e passation, les questionnaires pour lesquels l’adresse courriel n’était pas fournie ou était incorrecte ne pouvaient pas être mis en correspondance : les questionnaires de 6 étudiants ont donc été exclus. Le calcul de la stabilité de l’échelle a donc porté sur 109 étudiants, soit 218 questionnaires. Le coefficient de corrélation intraclasse est mesuré à 0,77 (p = 0,00), ce qui permet de conclure à une bonne reproductibilité de notre questionnaire.

Scores

Un score pour la TAMSAD fr a été calculé pour chaque étudiant à partir des réponses lors du test et du retest. Les scores moyens, les écarts-types ainsi que les valeurs minimales et maximales en fonction des sous-populations étudiées sont présentés dans le Tableau 3.

Tableau 3

Scores moyens sur 100 à la TAMSAD fr au test et au retest en fonction des sous-populations

Scores moyens sur 100 à la TAMSAD fr au test et au retest en fonction des sous-populations

-> Voir la liste des tableaux

Ainsi, la moyenne des scores de l’ensemble des étudiants ayant répondu au test de façon complète est 53,9 (E-T = 7,7). On constate que les scores moyens évoluent entre 52,9 (E-T = 6,9) et 56,2 (E-T = 7,4) et qu’ils sont discrètement plus élevés lors du retest, sans que la différence soit significative : moyenne lors du test = 53,9 (E-T = 7,7) ; moyenne lors du retest = 55,3 (E-T = 8,3) ; t(75) = 1,43 ; p = 0,15 ; taille d’effet d = 0,17. La faible taille d’effet montre l’absence de différence de score moyen entre les deux tests.

Un des objectifs secondaires de ce travail était de repérer l’influence de différents facteurs sur la tolérance à l’ambiguïté, comme lors du processus de validation de l’échelle originale par Hancock et al. (2015). Nous avons recherché une possible influence sur le score de l’identité de genre, du niveau d’études médicales et de la spécialité envisagée au cours des Épreuves classantes nationales (ECN).

Le test t de Student n’a pas trouvé de différence significative entre les scores des répondants de sexe masculin et féminin lors du test : moyenne hommes = 54,2 (E-T = 7,4) ; moyenne femmes = 53,7 (E-T = 7,8) ; t(75) = 0,33 ; p = 0,74 ; taille d’effet d = 0,06. La faible taille d’effet montre l’absence de différence de score moyen entre les tests réalisés par les hommes et ceux réalisés par les femmes.

Il n’y a pas non plus de différence significative entre les scores des répondants des étudiants de 4e année et ceux de 6e année : moyenne 4e année = 52,9 (E-T = 6,9) ; moyenne 6e année = 54,4 (E-T = 8) ; t(75) = 0,90 ; p = 0,34 ; taille d’effet d = 0,16. La faible taille d’effet montre l’absence de différence de score moyen entre les tests réalisés par les étudiants de 4e année et ceux réalisés par les étudiants de 6e année.

Les différentes spécialités au choix dans l’échelle ont été préalablement classées selon sept groupes : les spécialités médicales, les spécialités chirurgicales, les spécialités relatives aux urgences (comprenant la réanimation et la médecine d’urgence), la pédiatrie, la psychiatrie, la radiologie et la médecine générale. Ce regroupement était calqué sur celui choisi par les auteurs de l’échelle originale. Les informations de la Figure 1 sont présentées à titre descriptif uniquement, car les effectifs des différents sous-groupes de spécialité sont insuffisants pour réaliser une analyse comparative.

Figure 1

Moyenne du score à l’échelle TAMSAD fr avec intervalle de confiance à 95 % en fonction de la spécialité envisagée par l’étudiant au moment du test

Moyenne du score à l’échelle TAMSAD fr avec intervalle de confiance à 95 % en fonction de la spécialité envisagée par l’étudiant au moment du test

-> Voir la liste des figures

DISCUSSION

Concernant la traduction et l’adaptation culturelle, les recommandations principales des bonnes pratiques (Guillemin et al., 1993) ont été respectées, mais certaines recommandations n’ont pas pu être mises en oeuvre, du fait de contraintes de temps et de budget. Ainsi, ces auteurs préconisent, lorsque possible, d’avoir recours à quatre équipes de traducteurs, plutôt qu’à quatre traducteurs individuels. Ils exposent aussi l’intérêt d’une étape de prétest afin de mettre en évidence d’éventuelles erreurs, qui seraient révélées par une incompréhension ou par une hésitation de la part de la personne interrogée.

Si ces recommandations supplémentaires n’ont pas pu être mises en oeuvre, le respect des recommandations principales a permis l’obtention d’un questionnaire en français approuvé par l’ensemble du comité, à l’issue d’un processus accompagné de l’auteur principal de l’échelle originale, qui a notamment commenté les traductions inversées vers l’anglais. De plus, lors de la 1re passation à la population cible, les étudiants avaient la possibilité de réagir ou de poser des questions à une des personnes responsables de l’étude présentes. Les étudiants n’ont fait part d’aucune difficulté de compréhension et n’ont posé aucune question concernant le contenu du questionnaire ou ses modalités de passation.

Les auteurs de la TAMSAD ont présenté, lors de la publication de leur échelle, les sources de validité de leur instrument qui doivent être considérées (Downing, 2003; Hancock et al., 2015). Étant donné que notre traduction française de la TAMSAD respecte le nombre, le processus de réponse, l’ordre et la signification des items de la version originale, nous considérons que les arguments de validité des auteurs de la TAMSAD en anglais concernant le contenu, le processus de réponse et l’unidimensionnalité de l’échelle sont transposables à la TAMSAD fr. L’unidimensionnalité de la TAMSAD en anglais a été argumentée par une analyse factorielle, qui pourrait être réalisée sur la TAMSAD fr lors de son utilisation future. C’est cette unidimensionnalité qui permet l’utilisation de l’alpha de Cronbach pour évaluer la consistance interne de la TAMSAD fr (Raykov & Marcoulides, 2010). Nous avons choisi de vérifier la consistance interne de la TAMSAD fr comme preuve de validité.

Ainsi, l’alpha de Cronbach de la TAMSAD fr est calculé à 0,68 lors du test et à 0,76 lors du retest. L’interprétation des valeurs d’alpha de Cronbach est très variable dans la littérature (Taber, 2018). Toutefois, lorsqu’il est utilisé pour évaluer la consistance interne d’une échelle unidimensionnelle, on considère le plus souvent le résultat satisfaisant entre 0,70 et 0,90. Nos résultats sont donc en faveur d’une bonne consistance interne de la TAMSAD fr telle qu’elle a été traduite. Il n’a donc pas été nécessaire d’en retirer ni d’en modifier des items a posteriori.

Or, nos alphas sont inférieurs à ceux de l’échelle originale en anglais (α = 0,80). La principale explication de cette différence peut être l’absence dans notre échantillon de médecins diplômés ou en formation d’interne, tandis que, dans l’article original présentant la TAMSAD, 411 étudiants en médecine, mais aussi 75 foundation doctors (équivalent britannique d’internes de médecine) ont été recrutés pour remplir le questionnaire. Dans notre étude, il s’agissait uniquement d’étudiants en médecine de 2e cycle. L’échantillon de l’article original était donc plus hétérogène dans ses niveaux d’études, et la compétence (la tolérance à l’ambiguïté) était donc davantage dispersée. Une plus grande dispersion de l’aptitude dans une population conduit à un accroissement de la consistance de l’instrument, soit un accroissement de l’alpha de Cronbach, dans le cas de notre questionnaire.

Lorsqu’on compare les alphas de Cronbach en fonction des populations et du test ou du retest, l’alpha le plus bas est celui des étudiants les plus jeunes lors du test, mais il y a une homogénéisation des résultats lors du retest. Il y a probablement une compréhension et une utilisation du questionnaire qui s’améliorent à l’usage. Ce phénomène semble accéléré par l’avancée dans leur cursus des utilisateurs, qui augmente peut-être leur connaissance de l’incertitude médicale.

Malgré un nombre de données recueillies inférieur lors de la phase de retest et malgré l’appariement des questionnaires, qui a permis l’analyse sur 109 étudiants (pour 157 approchés au total), la reproductibilité (ou fidélité test-retest) a été démontrée puisqu’on observe de la stabilité entre les scores moyens des étudiants entre les deux temps de passation (coefficient de corrélation intraclasse = 0,77 ; p = 0,00). L’alpha de Cronbach et la fidélité test-retest apportent donc des arguments de validité de la structure interne de la TAMSAD fr. Lors d’utilisations ultérieures de la TAMSAD fr, ces arguments pourront être vérifiés. D’autres mesures telles que le coefficient oméga pourraient enrichir l’évaluation de cette échelle (Béland & Michelot, 2020).

Concernant la relation aux autres variables, notre étude ne trouve pas d’association significative entre le score de tolérance à l’ambiguïté et les différents facteurs étudiés : l’identité de genre, l’avancée dans les études médicales ou le fait d’avoir une attirance particulière pour la médecine générale ou une autre spécialité.

La première hypothèse que nous formulons pour expliquer cette absence de différence entre les groupes est un manque de puissance du fait de la taille réduite de notre échantillon. La seconde hypothèse est que cette absence de différence soit effectivement le reflet de la réalité, car, dans la littérature, à ce jour, aucun consensus ne se dégage sur l’influence de ces différents facteurs. Plusieurs auteurs ayant étudié la problématique sont d’ailleurs parvenus à des résultats contradictoires (Geller et al., 1990 ; Han et al., 2015 ; Politi & Légaré, 2010).

La TAMSAD fr a été utilisée dans cette étude uniquement à visée descriptive et aucune conséquence sur les étudiants n’a été mise en évidence. À notre connaissance, elle est la seule échelle d’évaluation en français de la tolérance à l’ambiguïté présentant des preuves de validité. Les échelles d’évaluation en anglais de tolérance à l’incertitude ou à l’ambiguïté sont nombreuses et reposent sur des approches très variées de la tolérance, de l’incertitude ou de l’ambiguïté, dont une comparaison détaillée a été publiée récemment (Hillen et al., 2017). Nous justifions le choix de la TAMSAD comme outil mis à la disposition de la communauté francophone par la cohérence des concepts mobilisés pour sa conception avec ceux mis en avant par le modèle de compréhension de l’incertitude que nous avons retenu pour la richesse de ses perspectives pédagogiques (Motte et al., 2020) et par la rigueur avec laquelle Hancock et al. (2105) ont présenté des preuves de validité pour leur échelle TAMSAD.

L’incertitude médicale est un phénomène riche et complexe. La TAMSAD fr devrait permettre de mieux en évaluer la tolérance auprès de la population francophone. Or, d’autres dimensions devront être évaluées dans le cadre de la formation. Par exemple, certains auteurs proposent d’utiliser le test de concordance de script (TCS) pour évaluer le raisonnement clinique en contexte d’incertitude (Charlin, 2006 ; Charlin et al., 2005). La communication de l’incertitude et son évaluation sont aussi des domaines de recherche prometteurs qui nécessiteront la mobilisation conjointe des équipes enseignantes et des équipes de recherche (Han et al., 2019 ; Kalke et al., 2021).

CONCLUSION

L’évaluation psychométrique de la TAMSAD fr atteste que cette traduction de l’échelle constitue un outil cohérent et fiable. Cependant, ces résultats méritent d’être confirmés au cours d’utilisations ultérieures. L’utilisation de cette échelle sur de plus grands échantillons permettrait d’effectuer une analyse du fonctionnement différentiel des items (differential item functioning ou DIF) pour déterminer dans quelle mesure chaque item peut mesurer différentes capacités pour les membres de sous-groupes distincts, mais aussi une analyse d’équation de la personne (person-fitanalysis) pour détecter les personnes interrogées qui s’écartent des réponses attendues à la TAMSAD fr.

Les concepts mobilisés lors de la conception de l’échelle originale en anglais s’accordent à ceux développés dans les publications récentes dédiées à la compréhension de l’incertitude médicale qui ouvrent de nouvelles perspectives pédagogiques (Cooke & Lemay, 2017; Eastwood et al., 2017 ; Han et al., 2011 ; Motte et al., 2020). La mise à la disposition pour la communauté scientifique francophone de cet outil fiable et pertinent qu’est la TAMSAD fr permet aux équipes pédagogiques et de recherche d’évaluer la tolérance à l’ambiguïté de leurs étudiants dès à présent ou au cours d’initiatives pédagogiques de formation à la gestion de l’incertitude.