Enjeux expérientiels de l'utilisation de l'IA en anatomopathologie

Collet, Laurent; Durampart, Michel; Heiser, Laurent; Picard, Ludovic

1. Introduction

Cet article exploite une recherche menée au sein du cabinet médical d’anatomo-cyto-pathologie MEDIPATH (https://medipath.fr/) et porte sur les transformations du travail d’analyse diagnostique du tissu prostatique dans un contexte d’intégration d’un logiciel supportée par une intelligence artificielle (IA) développée par la société IBEX (https://ibex-ai.com/) pour l’aide à la pratique exploratoire et de diagnostic. Ces transformations ne vont pas a piori de soi et peuvent même générer des tensions au moment du raisonnement médical (Goût, 2015) s’il n’y a pas maillage entre logiques techniques de rationalisation et logiques professionnelles prudentielles dans l’établissement individuel ou collectif d’un diagnostic. À ce propos, Champy met en exergue

la fragilité particulière du travail professionnel prudentiel face à des injonctions à l’objectivité, à la prévisibilité et à la performance, qui sont impossibles à satisfaire dans les situations d’incertitude où la prudence est requise, ou encore la propension particulière des membres des professions à pratique prudentielle à se mobiliser en faveur de conceptions particulières de leur activité (Champy, 2012, p. 232)

rend d’autant plus important mais difficile leur rationalisation.

1.1 Contexte

Les progrès réalisés durant la dernière décennie dans le domaine des sciences computationnelles associés à des performances de calcul et de stockage de données toujours plus élevées dans le domaine de l’informatique ont permis un essor significatif des applications basées sur l’apprentissage automatique, l’apprentissage profond et les réseaux convolutionnels, communément regroupés sous le terme d’intelligence artificielle ; terme en réalité flou, mais dont les discours d’accompagnement promettent une nouvelle ère industrielle.

Le secteur de la santé est considéré comme l’un des domaines privilégiés pour le développement de ces applications à base d’intelligence artificielle[1]. Charlet et Bringay (2019) ont d’ailleurs repéré la publication de 108 articles scientifiques sur cette question entre 2011 et 2018 pour les seules Journées francophones d’Ingénierie des Connaissances, qui a lieu tous les ans. L’analyse automatique de ces articles donne à voir sept thématiques récurrentes : 1) construction d’ontologies et de terminologies médicales, 2) leur alignement et leur interopérabilité entre experts médicaux ou à l’international, et avec les patients, 3) le traitement automatique de la langue pour le domaine de la santé et notamment, dans l’analyse des dossiers patients, 4) les bonnes pratiques en matière d’aide à la décision des médecins, 5) la recherche d’informations, d'annotations et de recommandations pour l’indexation des documents à numériser, 6) la fouille de données de santé pour des tâches de prédiction, 7) l’analyse des médias sociaux utilisés par les patients.

Alors que les meilleures solutions techniques sont encore en débat, le secteur médical connaît d’ores et déjà des mutations plus ou moins profondes liées à l’apparition et à l’utilisation des technologies basées sur l’intelligence artificielle dans la pratique médicale[2], soulevant un bon nombre de questions quant aux enjeux organisationnels, éthiques, juridiques, et économiques qui touchent le secteur (Besse, Besse-Patin, Castets-Renard, 2020) et en premier lieu l’imagerie médicale. Si les algorithmes étaient déjà utilisés dans la fabrication et dans l’élaboration des images médicales (échographie, IRM), ce n’est que très récemment que les systèmes basés sur l’IA sont devenus suffisamment puissants et fiables pour prétendre eux-mêmes à une analyse visuelle des images produites en vue de l’élaboration ou du contrôle d’un diagnostic. Il est même des domaines où l’IA est désormais envisagée pour une intégration routinière dans les protocoles de prise en charge médicaux. Nous pouvons citer, sans prétention exhaustive, les domaines de la radiologie[3], de la dermatologie[4], de l’ophtalmologie[5], et bien sûr de l’anatomopathologie[6], qui ont en commun le recours privilégié à l’observation visuelle dans l’établissement des diagnostics.

1.2 Problématique

Cependant, désireux d’avoir un avis distancié et critique sur les conséquences du déploiement d’une IA dans leur métier, les médecins anatomopathologistes du cabinet médical MEDIPATH ont mandaté des chercheurs du laboratoire IMSIC (http://www.imsic.fr/) pour analyser, lors de la phase de test d’un logiciel basé sur une IA, l’expérience vécue (Bonfils et al., 2019) par un public de huit médecins de ce cabinet médical, c’est-à-dire au sens subjectif que ces individus attribuent à leurs activités dans une perspective critique d’émancipation (comme augmenter ses savoir et savoir-faire) versus aliénation (diminution des savoirs et savoir-faire par rationalisation technique) dans le cadre d’un changement de leurs habitudes de travail. Autrement dit, il s’agissait d’analyser comment les possibles transformations affectives, psycho-cognitives et pragmatiques du travail d’analyse étaient vécues par des médecins face à de possibles phénomènes de rationalisations organisationnelles, bien analysées en sciences de l’information et de la communication (Bouillon, 2013) et qui relèvent deux grandes perspectives possibles : soit comme un état organisé, soit comme un processus. Cette dernière dimension processuelle de l’organisation de santé, confrontée aux dispositifs informatiques rationalisant, peut se matérialiser dans un langage allant de l’expression individuelle au vocabulaire partagé, dont la prise en compte peut avoir du sens lorsqu'on s'intéresse à l’expérience vécue par l’intégration d’une IA dans une activité médicale à pratique prudentielle (Champy, 2015), et dans un réagencement des activités pendant la séquence temporelle de diagnostic et dans l’espace du bureau de travail du médecin.

Ainsi, cette étude n’avait aucune vocation évaluative du logiciel en cours de développement ou de la méthode de travail de la société IBEX ou encore de son algorithme, et visait une dimension non encore abordée : les potentiels de transformation réelle et non fantasmée du travail d’analyste par la solution développée.

1.3 Appareillage méthodologique

La méthode d'observation employée a été celle de la restitution subjective en situation (Schmitt et Aubert, 2017), qui demande de filmer les situations de travail, puis de faire parler les individus filmés sur leurs cours d’action. Ces entretiens sont ensuite analysés à travers une grille distinguant six unités d’action : par quoi le médecin est-il attiré (une couleur, une pastille, une lame annotée, etc.) ? Comment se lie-t-il à l'élément qui l’a attiré (avec une manipulation physique, une fonction de logiciel, etc.) ? Quel résultat attend-il de son action en lien avec l’élément repéré (vérification, grossissement et déplacement sur l’image, etc.) et quelle est l’expérience passée mobilisée ? Que voit-il ou pense-t-il ? Quelle décision prend-il (valide ou non un diagnostic, complète ou non un compte-rendu) ?

L’ensemble forme un langage symbolique et fertile appelé le signe hexadique (Theureau, 2015). Il permet de saisir les connaissances en actes d’un sujet pendant le cours d’action (ibid.). L’analyse commence d’abord par l’identification d’un signe ayant attiré l’attention du médecin (ou représentamen), se poursuit par celle des attentes du sujet (Attentes), de ses préoccupations (Anticipation), puis de ce qu’il pense ou se dit pendant l’action (Unité du cours d’action) et finalement sa décision finale (Interprétant). Ces six unités ou questionnements ont été utilisés comme des marqueurs de l’expérience ou du processus cognitif du médecin pendant l’usage du logiciel.

Nous avons, toutefois, dû faire preuve d’agilité méthodologique pour nous adapter en permanence aux conditions matérielles de réalisation de cette recherche, en gardant comme boussole le meilleur moyen de comprendre l’expérience vécue lors de l’appropriation d’une IA. En effet, à l’origine, le devis de cette recherche (Bujold et al., 2016) prévoyait uniquement trois séquences de captations de huit médecins : avant le déploiement de l’IA, au moment de son déploiement, après quelques semaines d’utilisation en situation réelle d’analyse. Or, lors de la première captation en Janvier 2020, qui correspond à la phase exploratoire de connaissances préalables et nécessaires du métier d’anatomophalogiste et le vécu des médecins de MEDIPATH avant l’introduction de la nouvelle solution logicielle, nous avons connu le phénomène de saturation des données au bout de quatre observations, ce qui nous a conduits à vivre les observations complémentaires comme une vérification de nos interprétations (voir tableau 1). Puis, pendant la phase de déploiement, nous avons dû tenir compte des obligations de confinement en France et ne pas pouvoir compter sur une captation en vue subjective, ce qui a été compensé par l’enregistrement de l’activité à l’écran grâce au dispositif de captation et d’enregistrement à distance Zoom. Après cette seconde séquence, les résultats de l’analyse de l’expérience vécue des médecins pendant l’appropriation de l’IA, et les séances collectives de confrontation des interprétations entre chercheurs de l’IMSIC, nous ont conduits à penser une troisième phase qui a été organisée sous la forme d’un focus group avec tous les médecins. D’une durée de 90 minutes, ce dernier prévoyait d’explorer trois thèmes : le point de vue individuel sur l’IA et la démarche de conception, une discussion collective sur nos conclusions, et pour terminer une projection individuelle sur l’avenir.

Ainsi, la méthode qualitative déployée a reposé sur un processus organisationnel articulant trois séquences comme le résume le tableau ci-dessous. Chaque séquence de la méthode nous a alors permis de bénéficier d’une perspective de développement de nos données et la réduction des préoccupations et représentations individuelles préétablies sur l’intelligence artificielle, l’analyse médicale, le cancer, etc.

Tableau 1

**Méthode qualitative séquentielle**

2. Le terrain de l’analyse anatomo-cyto-pathologique

MEDIPATH est une entreprise médicale du secteur libéral indépendante avec une mission de santé publique dans le diagnostic anatomo-cytopathologique et plus particulièrement du cancer. Cette Société d’Exercice Libéral par Action Simplifiée (SELAS) est détenue par les médecins anatomopathologistes qui y exercent, répartis sur 18 sites en région PACA, Occitanie et parisienne, ce qui en fait la première plateforme libérale de pathologie en France. Medipath est accréditée en génétique somatique, histologie, cytologie et virologie. La société auto-revendique une volonté de se donner tous les moyens technologiques modernes, en s’impliquant dans une démarche qualité de haute exigence pour l’accréditation de ses plateaux techniques et de ses sites médico-administratifs, dans le but de fournir à ses praticiens et à ses patients les meilleures garanties de qualité, de fiabilité et d'efficacité possibles dans la réalisation de ses missions[7].

C’est dans cette optique que la société Medipath s’est rapprochée en 2019 de la jeune pousse israélienne IBEX-Medical Analytics pour monter un partenariat de recherche prospective pour l’élaboration d’un logiciel d’aide au diagnostic anatomopathologique sur biopsies prostatiques ayant pour objectif une utilisation en première lecture. Le but de Medipath, lorsque la société est entrée en relation avec Ibex, était de pouvoir doter ses praticiens·nnes d’un outil moderne et fiable (propagation et efficience de l’IA en imagerie médicale), adapté (basé sur les besoins des médecins et sur le compte rendu final), ainsi que performant (gain de temps pour le médecin dans l’analyse des biopsies prostatiques) en identifiant les biopsies anormales.

Suite à la lecture et à l’analyse d’une base de données de plus de 60 000 lames de biopsies prostatiques, issues de diverses institutions médicales et de leurs diagnostics associés établis préalablement par des experts anatomopathologistes internationaux, la société IBEX a développé un algorithme, établi à partir de l’état de l’art en matière de reconnaissance d’images et de machine learning, capable de détecter de façon autonome la présence de foyers tumoraux sur les lames scannées[8]. Ainsi, une méthode classique de fouille de données a été utilisée pour « extraire de la connaissance nouvelle à partir de grandes quantités de données de santé » en s’appuyant sur la recherche de motifs visuels dans des images et en les recoupant avec les diagnostics rédigés par les médecins[9] [10]. Ainsi, « les régularités extraites à partir des gros volumes de données médicales vont alors pouvoir être utilisées pour des tâches de prédiction par exemple pour l’aide au diagnostic de tumeurs cérébrales » (Charlet, Bringay, p. 34). En revanche, nous n’avons pas pu avoir plus d’information que celles fournies par Ibex sur le mode de construction et de fonctionnement de l’IA, comme par exemple si elle utilise des prédicateurs et des règles comme dans la solution du robot IAFA (Zalila, 2018). Quoi qu’il en soit, à la suite de différentes collaborations avec le secteur médical et à l’utilisation de l’algorithme ainsi développé, Ibex a conçu différents systèmes logiciels qui se déclinent, en 2020, sous 3 formes différentes :

Ibex second read (Galen System) établit une lecture diagnostique parallèle à celui du ou de la pathologiste, ce qui permet un contrôle qualité en alertant le praticien en cas de diagnostic discordant.[11] La solution Galen System pour la prostate a reçu, début 2020, son label de Conformité Européenne (CE) [12]pour l’analyse des biopsies prostatiques parallèlement au travail d’analyse des médecins anatomopathologistes ;
Ibex first read (Galen System) pour guider les médecins dans la priorisation des diagnostiques en alertant le ou la praticien·nne sur les cas potentiellement les plus urgents ;
Galen platform-galen prostate, la solution développée avec Medipath pour assister et guider le ou la praticien·nne dans son processus de diagnostic initial et complet jusqu’à l’établissement du compte-rendu. Galen prostate regroupe les capacités de « first read » et « second read » au sein d’une même plateforme.

Ce partenariat de recherche et développement succède à une phase de test par Medipath de la solution « second read » d’Ibex, qui consiste à faire effectuer un diagnostic par une solution logiciel basée sur l’intelligence artificielle afin de le confronter au diagnostic effectué par les praticiens.nnes. Cette phase de test a pu démontrer la pertinence et l’utilité de l’IA dans la détection de faux négatifs[13] et a également permis une première familiarisation de l’équipe de médecins avec l’algorithme au cœur des solutions proposées par IBEX.

Figure 1

**Interface de l’IA pour ce qui est du travail sur les lames**

La coopération entre Ibex et Medipath a reposé sur une démarche de design thinking (Norman, 2013) toujours en cours au moment de nos observations de mars à mai 2020 : pour fournir un outil non pas « sur mesure » mais adapté, les équipes de la jeune pousse israélienne ont intégré les capacités de leur algorithme à une interface basée sur l’architecture et le design global de la solution « second read » testée par les médecins, mais aussi sur les besoins énoncés par ces derniers et sur l’observation de leur pratique habituelle de travail (nous entendons par là une pratique de l’anatomopathologie prostatique au microscope, non assistée par une IA). Notamment, ces besoins concernaient l’analyse et la validation des informations successives nécessaires à l’établissement du diagnostic et du compte rendu final, ainsi que la présence de fonctions annexes pour faciliter l’exercice de l’analyse (règles pour mesurer, raccourcis claviers) ou reproduisant des fonctions de navigation de base nécessaires à l’analyse visuelle fine (zoom à différentes échelles, déplacement sur les biopsies, etc.). Cette démarche a été fortement appréciée par l’ensemble des médecins parce qu’ils l’ont trouvé bienveillante. Elle aura permis d’aboutir à un produit final, dont l’utilisation est jugée ludique et agréable.

Séance de formation par IBEX dans les locaux de MEDIPATH et démarche de Thinking — Figure 2

Séance de formation par IBEX dans les locaux de MEDIPATH et démarche de *Thinking*

Pour autant, cette démarche de co-design s’est limitée à de l’interopérabilité technique (Grosjean, 2019, repère 11) et posait autant de questions de transformations à venir du métier, sans y répondre, qu’elle apportait de réponses pragmatiques et ergonomiques d’utilisation. Sans pour autant prétendre à ce que notre étude et nos observations qui se sont déroulées parallèlement à cette phase de développement logiciel, participent d’une interopérabilité sociale, elle permet aux huit médecins de Médipath, qui ont participé à ce travail de réflexion et de design thinking avant et pendant le déploiement de ce nouvel outil sur leur poste de travail, de mieux se saisir de leur nouvel environnement de travail et ainsi d’en faciliter l’acceptabilité et l’appropriation.

Il convient de préciser ici qu’aucun cas traité dans le cadre de cette étude n’est actuel : ce sont des cas déjà traités. Comme le logiciel utilisé par les praticiens est en cours de test et de développement, même si l’algorithme est « validé », les cas traités, tous anonymisés, sont des cas d’archive qui ne présentent plus aucun enjeu médical. Pour autant, l’application en cours de développement par les équipes d’Ibex et de Médipath, marque bien une évolution pour la pratique de l’anatomopathologie des tissus prostatiques avec l’intégration d’une IA en première lecture. Ainsi, nous avons souhaité interroger, d’une part, la façon dont se construisait la relation entre les praticiens de Medipath et le logiciel d’Ibex au moment de la découverte et de l’adoption de ce nouvel agent « intelligent » dans la pratique de la médecine anatomopathologique, et d’autre part, les éventuelles transformations des habitudes organisationnelles ou individuelles de travail.

3. Le cours d’action du pathologiste sans IA

D’abord, la première observation a permis de constater que l’espace de travail des médecins était organisé pour gagner du temps en assurant une continuité entre plateaux de lames, microscope et compte-rendu. Ensuite, le travail d’analyse repose sur une série d’opérations pragmatiques et cognitives, dont l’enjeu principal est d’arriver à un taux de certitude très élevé pour rédiger un compte rendu d’analyse, qui confirme ou infirme la suspicion d’un clinicien ou d’un radiologue. Le but final est de valider définitivement un diagnostic et de livrer un compte-rendu comportant tous les éléments nécessaires à la prise en charge thérapeutique et pronostique du patient. Le microscope est alors central dans le processus d’analyse diagnostique.

Figure 3

**Le poste de travail d’un médecin analyste**

Concernant l’utilisation de cet outil, les techniques des anatomopathologistes sont hétérogènes : nous parlons de screening effectué pas à pas, deux par deux, ou de manière globale. Cependant, d’une part, les screenings respectent la cartographie de la prostate, et, d’autre part, tous les médecins cherchent les signes de présence du cancer et une fois ces signes trouvés les catégorisent. Dans ce contexte, la pensée semble en tension entre l’hypothético-déductif et l’induction, voire l’abduction, pour mieux contrôler ce qui est en train d’être fait : le demandeur de l’analyse suspecte un cancer (hypothèse), l’anatomopathologiste cherche des critères morphologiques sur la lame d’histologie, qui permet de formuler un diagnostic (déductif). Dans le cours de l’analyse, le grading évolue dans le temps suite au repérage de critères morphologiques convergents ou divergents (inductif). Par ailleurs, certaines traces ne sont pas claires et forment un doute dans l’esprit de l’analyste, conduisant à de nouvelles lectures de lames pour fermer de nouvelles pistes (abduction). Enfin, la décision finale peut être prise immédiatement ou être reportée au lendemain ou suite à des analyses immunohistochimiques complémentaires (déductif). D’ailleurs, l’appel à une aide complémentaire est très courant, voire majoritairement utilisé. Chaque médecin développe ainsi ses propres stratégies, dont la fonction centrale et commune est d’éloigner le plus possible les affects, qui n’ont pas leur place afin ne pas troubler le travail en cours.

Pour résumer, l’activité d’analyse a pour objectif un traitement pour le patient et les différents cours d’action visent à éliminer les doutes chez l’analyste en réduisant les possibles erreurs d’interprétation des lames. Comment se situe l’IA par rapport à cette logique d’action ?

4. L’expérience d'utilisation de l’IA

Les recherches de l’IMSIC permettent de savoir que l’appropriation d’une technologie a lieu lorsqu’un projet passe

de la fiction de la conception à des usages en continuité ou rupture avec les habitudes des usagers via des objets articulant de l’ancien à du nouveau et que dans ce cadre il faut tenir compte de l’énonciation scientifique des usagers [...] qui porte sur plusieurs dimensions : l’utilisabilité ou ergonomie de la plateforme [...] l’utilité en contexte pour créer des activités [...], et l’usage permettant de nouvelles relations tendant vers l’autonomie vis-à-vis des données, des informations et des connaissances, et de l’avis des autres (Collet, 2016, p. 76).

L’appropriation renvoie donc à un processus complexe qui engage des émotions, de la cognition et des habitudes (Bonfils et al., 2018) professionnellement constituées par l’expérience de l’analyse prostatique au microscope. Ces habitudes vont subir une tension du fait de l’expérience nouvelle engendrée par l’usage de l’IA, avec l’utilisation du poste informatique comme nouvel outil d’établissement du diagnostic. C’est pourquoi nous avons analysé l’expérience vécue des huit médecins dans le cadre de l’usage d’une nouvelle technologie mise au service de l’analyse afin d’identifier les freins et facteurs favorables à son appropriation. Pour ce faire, nous avons bénéficié de la demande des développeurs du logiciel, qui leur avaient fixé comme objectif de travailler sur 20 cas précédemment analysés au microscope. Ainsi, notre observation concernait une expérience nouvelle sans risque pour les docteurs de se tromper sur leur diagnostic final, du fait même de ce nouvel environnement numérique.

L’expérience vécue des individus, en particulier au sein des dispositifs numériques (Bernard, 2018), est d’un intérêt fécond pour les sciences de l’information et de la communication. Cependant, saisir scientifiquement l’expérience vécue (Schmitt, 2018, p. 95) pose de nombreux problèmes en particulier du point de vue méthodologique. De plus, la crise sanitaire du Covid-19 aurait pu tuer cette initiative dans l’œuf mais paradoxalement du fait même que les huit médecins concernés par cette phase d’appropriation de l’IA travaillaient avec un ordinateur pour analyser des lames numérisées a sensiblement facilité notre travail. En effet, toutes les personnes concernées ont accepté de partager leur écran d’ordinateur via un système de visioconférence nous permettant d’enregistrer ce qui était partagé. Nous avions également pris le soin de les informer que si l’enregistrement était actif, nous nous absenterions pour les laisser conduire seuls leur analyse et ne pas leur donner l’impression d’être observés. C’est un élément important qui, dans d’autres protocoles conduits au sein du laboratoire (Auteur, 2019), a déjà prouvé son efficacité pour s’assurer de ne pas perturber les individus pendant leur action située.

Dès lors, nos premières données, grâce au consentement éclairé des personnes concernées, constituaient un premier corpus de vidéos subjectives. D’un point de vue épistémologique, ce matériau doit être considéré comme des données brutes de l’activité. À ce stade, raconter l’expérience vécue des sujets serait prématuré. Dans un second temps, il s’agissait d’augmenter ces traces ou vidéos par les commentaires des concernés en leur proposant, toujours à distance et via notre système de visioconférence, de raconter naturellement ce qu’ils avaient vécus. Tous ont accepté de participer à ces entretiens organisés dans la foulée de la captation des données brutes. Cette étape prévoyait leur remise en situation afin de construire notre second corpus de données, celui des entretiens en re-situ subjectif invitant à un retour vers un passé récent, soit environ 5 minutes après la captation des vidéos. Notre accompagnement consistait à laisser la personne raconter ce qu’elle avait fait, pensé ou vécu afin d’entraîner un processus de réminiscence le plus abouti possible et récupérer des données phénoménales concernant l’activité des praticiens avec le support fourni par IBEX.

4.1. L’exploration de la conscience des médecins anatomopathologistes

C’est à partir de ce second corpus d’entretiens, tous traduits en verbatim, que nous avons cherché à décrire le fonctionnement de la conscience (Delestage, 2018) des médecins pendant l’usage de l’IA. Il s’agissait de l’étape d’analyse dont l’objectif visait à retrouver l’ordre dans lequel l’expérience vécue s’était déroulée. Par précaution épistémologique, nous avons utilisé le langage symbolique de Jacques Theureau (2015), qui constitue un langage de description selon le « présupposé [que] les phénomènes ont lieu dans un certain ordre ou selon une certaine matrice » (Schmitt et Aubert, 2017, p. 49). Faute de pouvoir le détailler, nous nous contenterons d’écrire que cette matrice est constituée de six unités du cours d’action (ou d’expérience) que nous avons adaptées au contexte de l’analyse du tissu prostatique. Pour faciliter notre travail d’analyse, et suivre la proposition d’autres chercheurs ayant utilisé le langage symbolique dans d’autres contextes (Rouve et Ria, 2008; Schmitt et Meyer-Chemenska, 2014), nous avons traduit les six unités du cours d’action en autant de questions (voir tableau 2). Ces questions tiennent compte du contexte spécifique de l’analyse des tissus prostatiques conduite sous l’environnement logiciel d’IBEX. Ce travail de traduction, des unités d’action en question, a pu être réalisé à partir de notre observation non-participante de l’activité de l’analyse prostatique sous IBEX pendant une session de formation organisée par le représentant du produit de cette société environ un mois avant le protocole des entretiens en re-situ subjectifs.

Tableau 2

**Le signe Hexadique de Theureau (2015) traduit en six questions**

Pour remplir nos grilles d’analyse, nous avons systématiquement commencé par repérer les éléments ayant attiré l’attention des médecins, ce qui est l’élément déclencheur de leur action (ou conscience) : une pastille de couleur (verte, jaune ou rouge). Ainsi, dans l’extrait du verbatim suivant, nous pouvons repérer les unités d’action avant de les introduire dans une grille synthétique (cf. annexe).

donc je suis dans le cas vert (R) je commence par regarder (E) les spots bénins, les spots verts, en un coup d’œil vu le grossissement est bon on voit bien que tout est bénin sur les zones sélectionnées, après j’en choisis une et je me balade sur la lame (pour faire un check, pour tout vérifier en fait (A), on s’oblige pour l’instant à regarder toute la lame (UCA) pour bien vérifier que ibex n’est pas passé à côté d’un foyer tumoral et euh… […], j’ai bien vérifié que c’était bénin (I) qu’il y avait pas de cancer et ensuite je coche tous les autres items (Dr.5B).

Dans ce cas, le représentamen indique que le sujet observé est attiré par une pastille verte assignée à la lame numérisée par le logiciel IBEX. Ce R fait réagir le médecin en procédant à un grossissement (son Engagement) qu’il justifie par le fait de devoir vérifier, pour l’instant, si la prescription est juste (Attentes). C’est une préoccupation qui l’entraîne, dans une certaine mesure, à se promener ou à balayer la zone comme lorsqu’il regardait au microscope. Il finit par valider ce qu’IBEX lui avait proposé (Interprétant).

Notre méthodologie a permis de nous rapprocher le plus près possible de l'expérience des médecins pendant l'appropriation du logiciel IBEX. Ainsi, ils sont souvent préoccupés par la justesse des informations du logiciel : ils agissent en priorité pour trouver la preuve qui permet de confirmer ou infirmer la couleur de la pastille. La pensée en mode quasi-exclusivement hypothético-déductif cherche à se rassurer et à trouver son pouvoir d’agir au sein du nouvel environnement. Ceci génère parfois un manque de confiance qui nécessite de vérifier les résultats du logiciel ou de les compléter. C’est un des enjeux expérientiels majeurs comme l’illustre ce nouvel extrait : « d’abord je vais prouver qu’il y a bien du cancer sur la lame c’est le plus important, donc on se balade » (Dr. 5B). Cependant, comme le souligne Dr 5B, « on se force un peu parce qu’à terme en fait il n’y aura pas besoin ». Ainsi, leur confiance est au moment de l’observation relativement fragile tout en précisant que tous ont été très impliqués dans l’évolution du logiciel en faisant des retours d’expérience utilisateur régulièrement à la société qui développe l’IA. C’est pourquoi nous retrouvons souvent la trace d’une pensée inductive se déployant pour conduire une analyse ergonomique sur le logiciel en repérant, en cours d’analyse, ce qui pourrait être perfectionné :

celle-là c’est pareil il n’a pas su me dire combien il y avait de fragments donc j’ai estimé qu’il y avait trois biopsies donc j’ai mesuré parce que ça n’avait pas été fait par l’algo, j’ai trouvé d’ailleurs que… ça dépend des cas, mais j’ai eu plusieurs cas où il ne mesurait pas du tout, il y a pas mal de biopsies qui ne mesurait pas du tout donc je sais pas (Dr. 4B).

Une attitude qui peut pousser le pathologiste à adopter une posture critique par rapport aux technologies, comme l’envisage ce sujet :

l’intelligence artificielle sans nous ça peut poser des problèmes si on la laisse totalement débridée on n’en est pas encore là, on est obligé d’avoir l’œil humain pour recadrer les choses quand ça va pas (Dr. 1B).

La compréhension des pathologistes est issue de leur technicité avec le microscope et celle-ci ne disparaît pas complètement lorsqu’ils interagissent avec la machine. La vision sur l’écran nécessite toujours de contrôler les affects, ce qui facilite l’exploration des fragments en grossissant (ou en zoomant) sur les zones suspectes. Les pathologistes décrivent une investigation qui vise à compléter, confirmer et parfois infirmer les résultats « prémachés » (Dr. 2B) de la machine. Les pathologistes éprouvent également un plaisir comparable avec celui qui était ressenti lors de la vision avec le microscope.

Enfin, vient en dernière étape le moment du grading du cancer qui est réalisé grâce à une fiche de diagnostic. Précisons que d’un point de vue éthique, l’environnement numérique ne fait pas oublier au pathologiste qu’il est en train d’analyser le cas d’un malade :

[…] puis je remplis les petits commentaires, les observations, la présence de dysplasie, comme j’avais mis du grade 4 dans le Gleason je rajoute qu’il n’y a pas de foyer cribriforme de grade 4 parce que c’est un critère important pour le clinicien (Dr. 4B).

Nous avons relevé la présence de cette dynamique triadique dans tous les cours d’expérience finissant par avoir une incidence sur notre méthodologie concernant l’expérience vécue de l’analyse prostatique sous l’environnement IBEX.

4.2. Expérience entre continuité et rupture

Le marqueur de l’attention des médecins (R) permet de fragmenter les verbatim sans trop de difficultés. Chaque marqueur de l’attention ouvre la possibilité de trouver d’autres unités d’action, et pour reprendre la métaphore de l’univers de l’analyse prostatique, de zoomer, de grossir ou de nous balader dans leurs modes de réflexion. Les combinaisons entre les unités d’action montrent que le domaine cognitif est très actif pendant l’action située. Notre analyse est tout autant microscopique que la leur lorsqu’ils analysent une lame. Nous finalisons l’analyse d’un cours d’expérience en associant toutes les unités des cours d’expérience ce qui est comparable à l’activité d’évaluation du grading. C’est ainsi, grâce à leur consentement et à une analyse progressive et sur le temps long, que nous avons diminué le risque d’erreur concernant l’interprétation de leur expérience d’utilisation de la solution IBEX. Nos résultats nous ont permis de trouver le bon grading de chaque cours d’expérience, qui prend la forme d’enjeux expérientiels :

liés au savoir propre de l’anatomopathologiste, c’est-à-dire à ce qu’il voit ou a l’habitude de voir et sa capacité à anticiper les attentes du clinicien;
liés à une expérience esthétique, notamment d’utilisation passée du microscope conduisant à procéder à des grossissements, à balayer les lames et passer de lame en lame, ou pour le dire autrement de conserver le plaisir que procurait l’usage d’un microscope;
liés à la vérification des résultats de l’IA dans le cadre d’une confiance fragile par rapport aux résultats de la machine, d’où la nécessité de vérifier et de donner la priorité au praticien· grâce à l’utilisation de la barre d’espacement pour enlever les couleurs de la machine et reprendre la main sur les résultats;
liés à l’ergonomie du logiciel pour qu’Ibex améliore l’interface, tienne compte des attentes du groupe des anatomopathologistes testeurs dont la volonté, unanime, est de gagner en temps et en degrés de confiance sur l’analyse des tissus prostatiques.

Ainsi, les cours d’expérience se concentrent autour d’une enquête qui permet aux médecins d’apporter la preuve de ce que la machine avance ; preuve permettant de donner un accord ou non aux prescriptions et à se laisser convaincre ou non. Il s’agit également de s’assurer, conformément à la pratique habituelle, que le diagnostic ou que les comptes rendus finaux soient les plus précis et aboutis possibles. Nous retrouvons le même enjeu de grading que dans l’analyse sans IA et une prise en compte du malade qui est derrière les biopsies. Toutefois, pendant les cours d’expérience, nous notons une prise de distance par rapport au logiciel et une approche critique par rapport aux nouvelles technologies.

4.3. Uniformisation des activités

L’observation et l’analyse des 8 verbatim d’un point du point de vue lexical avec une autre approche qualitative complète l’étude du cours d’expérience à proprement parler. Elle permet également d’identifier un phénomène d’uniformisation de l’activité suite à l’introduction du logiciel sur les postes de travail. Ces mutations sont particulièrement visibles lorsque sont comparés les verbatim de la deuxième phase d’observations à ceux réalisés lors de la première phase.

Dans les entretiens en re-situ subjectifs effectués lors de l’appropriation de l’IA, dès le début, la présence récurrente des vocables et des termes empruntés directement au vocabulaire de l’interface logiciel est frappante. Avant même d’avoir traité les 20 premiers cas soumis pour éprouver le fonctionnement de l’outil, nous retrouvons la quasi-totalité de la terminologie utilisée par le logiciel : « heatmap », « les points d'intérêts » ou « POI », « les spots » et les « pastilles » ainsi que leur couleur et la signification associée font partie intégrante de la pratique d’analyse en train de se construire et sont des éléments symboliques incontournables à la description et à la compréhension de l’activité. Le vocabulaire utilisé par les différents médecins tend donc à s’uniformiser en se conformant au nouveau référentiel lexical proposé par l’outil.

Nous observons parfois un glissement dans le rapport à l’activité avec une certaine prise de distanciation, qui se traduit par un glissement du « je » utilisé pour décrire la pratique traditionnelle au « on » ou « nous » utilisé lorsqu’il s’agit de décrire la pratique supportée par le logiciel. L’impact du logiciel se traduit également, dans son intégration au discours, à travers la figure d’un troisième agent, également acteur du diagnostic. Nous retrouvons dans les verbatim de la deuxième phase d’observation les traces d’un dialogue entre l'IA, souvent assimilée au logiciel, voire à l’ordinateur lui-même, et le médecin, systématiquement présent par un retour au « je » ou au « on », qui marque le moment où il reprend la main pour valider une décision :

en cliquant sur « tissue length » il me dit comment il a calculé sa taille, je suis ok ou je ne suis pas ok, là je me rends compte qu’il a oublié un petit bout (Dr.2B).

Il me dit aussi qu’il y a une faible probabilité d’atrophie (Dr. 4B).

Il y avait une faute de frappe, il n’a pas voulu me valider, on corrige la faute de frappe et on peut valider la lame (Dr.5B).

Il a interprété que c’était du bénin; je trouve qu'il n’y en a pas assez, il m’en a mis juste ce petit truc, je suis pas convaincue, je lui mets non (Dr. 8B).

C’est également à travers ce discours que le praticien évalue la pertinence du nouvel agent informationnel mais aussi la pertinence des modalités de ses interactions avec lui. En fournissant de premier abord l’élément engageant du dialogue (le représentamen), l’application va d’une façon similaire, modifier sensiblement l’activité en prescrivant au praticien une méthodologie étape par étape qui répond aux besoins diagnostiques en fonction de la catégorisation des cas par l’algorithme.

Une des premières informations que le logiciel fournit au praticien au moment de l’analyse est la catégorisation du cas selon 3 catégories : bénin en vert, malin en rouge, jaune ou gris pour les lames non interprétables pour le logiciel, sachant que la couleur grise correspond à un problème technique de scannérisation sur plus de 10% de la lame. Dans les récits d’expérience de nos huit médecins, cette information initiale a des répercussions directes sur leurs pratiques. Le logiciel, en fonction de la catégorisation des lames, propose des fonctions différentes. Ainsi pour valider le diagnostic, il leur est possible de ne se référer qu’aux points d’intérêt (POI) retenus par le logiciel comme étant des éléments remarquables de la lame. L’adoption de cette vérification est hétérogène puisque certains se fient désormais totalement à cette fonction alors que d’autres continuent après les POI à vérifier l’ensemble de la lame.

donc là, ça c’est une lame verte aussi, [...] c’est un POI, donc je l’ai regardé un peu plus précisément, ça reste bénin (Dr.1B).

je suis dans un cas vert, je commence par regarder les spots bénins, les spots verts, en un coup œil vu que le grossissement est bon, on voit bien que tout est bénin sur les zones sélectionnées, après j’en choisis un et je me balade sur la lame pour faire un check, pour tout vérifier en fait, on s’oblige pour l’instant à regarder toute la lame pour bien vérifier (Dr.5B).

Cet exemple illustre assez bien cette oscillation qui se joue entre une sorte de conformation de la pratique au design du logiciel, à travers les outils proposés et une liberté conservée d’opérer le diagnostic en se détachant volontairement de certaines fonctions pour les éprouver de manière critique. De la même façon, le screening des lames ne s’opère pas systématiquement avec l’assistance de la heatmap. Bien sûr, celle-ci reste utilisée pour guider le diagnostic, mais parfois aussi, seulement à des fins de contrôle ou de confirmation au moment où sont renseignés les items des rapports de cas.

donc je vais direct contrôler que les zones qu’il m’a notées sont bien du cancer... (Dr.8B).

je regarde le cancer mais j’évalue aussi le Gleason comme ça j’ai pas besoin d’y retourner et puis après je peux faire mes mesures, donc j’ai pu évaluer en même temps que je me baladais sur la lame qu’il y avait pas d’extensions extra capsulaire [...] donc je peux remplir mes petites cases (Dr.4B).

“l’atrophie on vérifie, on regarde si il y a des spots qui s’allument ou pas, et il y en a plein, ça tombe bien, on en avait vu donc, on peut cocher oui (Dr.5B).

Pour finir, on constate une uniformisation générale du récit d’activité qui correspond aux étapes chronologiques de diagnostic proposées par l’interface. Tous les praticiens suivent les prescriptions du logiciel et leurs récits prennent ainsi souvent la forme d’une énumération des items à remplir dans le rapport de cas alors que la répétition de cette séquence chronologique est difficile à identifier de façon si évidente dans les récits de notre première série d’observations.

4 fragments, on mesure, le diagnostic c’est bon c’est bien bénin, la PIN on vérifie qu’il n’y en a pas, il y a pas de spots rouges qui s’allument et puis on en a pas vu, l’atrophie on en a vu plein ça tombe bien il y a des spots rouges qui s’allument et l’inflammation j’en ai pas vu, même si il y a des spots rouges elle est pas significative, il y en a trop peu donc je mets non (Dr.5B).

En se conformant, dans une certaine mesure, aux prescriptions du même agent « intelligent », la pratique des huit médecins, ou en tout cas le récit qu’ils en font, s’est uniformisée. Les vocables et les signes utilisés par l’interface du logiciel sont assimilés et repris dans la description de l’activité. De la même façon, les différentes méthodologies et approches, propres à chaque praticien, se sont lissées et, d’une certaine manière, conformées suite à l’utilisation et l’appropriation du logiciel.

5. Conclusion

Le contexte de l’étude n’a pas permis d’étudier l’usage au quotidien de l’IA d’aide à l’analyse de biopsies prostatiques parce que son déploiement est en cours d’étude au sein du cabinet médical, et dépendra, notamment, des résultats de notre propre recherche. Nos conclusions ne peuvent être que temporaires car une étude sur le sujet devrait dépasser deux conditions actuelles : ne pas se limiter aux médecins volontaires pour participer au projet de l’IA et être utilisée en situation d’analyse de nouveaux cas. Afin d’atténuer cette faiblesse, nous avons organisé un focus group avec tous·tes les médecins de l’étude en leur demandant de se projeter dans l’avenir.

De cette dernière étape, il ressort que ce n’est pas une extrapolation que de conclure que le logiciel prolonge les habitudes de travail des médecins pathologistes et que le cours de l’action avec l’IA n’est pas en rupture totale avec le cours de l’action sans IA. La méthode de design thinking d’IBEX ou de design participatif (Grosjean, Bonneville, Marrast, 2019) pour développer l’ergonomie de son IA ̶ interface et découpage en unités d’information et d’action du travail ̶ s’est avérée efficiente. Dès lors, si la réduction du temps d’analyse se confirme, tout en renforçant la confiance du ou de la médecin, son déploiement devrait se faire sans rencontrer de difficulté majeure. En effet, le rapport au temps et à la confiance dans le diagnostic sont les deux dimensions clés de l’appropriation : réduction pour la première et augmentation pour la seconde. Leur mode de réflexion est beaucoup moins inductif, voire abductif, pour tendre vers une hégémonie de l'hypothético-déductif : le diagnostic produit par l’IA et son interprétation des lames (hypothèse) est vérifié par les analystes (déductif), qui passent moins de temps sur la recherche de traces nouvelles (induction et abduction). Seule, cette dernière transformation questionne les rôles réciproques de l’IA et de l’analyste : Qui est le sujet opérateur principal de l’analyse : l’analyste ou le logiciel ? L’analyste devient-il l’adjuvant de la machine à calculer ou est-ce l’inverse ?

5.1 Apports de cette recherche

Au final, le phénomène de rationalisation, auquel participe l’IA, pourrait faire gagner du temps au praticien et augmenter de manière non négligeable la confiance dans le cadre de l’étude de cas simples. L’analyse de l’expérience vécue de l’utilisation de l’IA dans les cas des biopsies prostatiques, complétée par le retour réflexif à l’occasion du focus group, montre que les médecins développent de nouvelles croyances sur l’IA dans leur contexte de travail. Selon eux, l’IA permet de simplifier leurs activités cognitives en situation d’analyse de cas simples du fait d’un changement du processus de pensée. Alors, se profile pour ces cas une activité intellectuelle moins intense car, comme ils le disent, ils ne sont plus obligés de tout « screener ». Par contre, pour les cas les plus compliqués, à savoir ceux où l’IA n’exprime pas de certitudes, l’activité reste tout autant compliquée et stressante.

Pour le dire autrement, l’analyse de tissus prostatiques par l’IA n’est pas tant liée à une diminution de la charge cognitive qu’à une redistribution ou nouvelle répartition de celle-ci, comme nous aurions pu le croire, avant cette recherche, du fait du poids des discours des médias sur la performativité de l’IA. Ces discours montrent ainsi leur limite. Un processus de redistribution de l’activité cognitive est en cours, celui-ci s’effectuant pendant l’expérience vécue. Les allers-retours entre ce qui a été vécu pendant la phase de test, sur des cas déjà traités dans des conditions normales au microscope, et la réflexion, à un niveau macroscopique, sur les attentes du travail d’un anatomopathologiste, relèvent d’un processus d’apprentissage de l’humain avec la machine. Même si les médecins n’en sont finalement qu’au tout début, comme le décrit l’un des participants à l’étude, et que le logiciel va continuer à apprendre, poursuit ce dernier, la rencontre entre lui, ses collègues et cette IA génère un processus de déshabituation/réhabituation qui se joue pendant et entre les expériences vécues. Par ailleurs, le temps long de développement des usages montre également les limites du design participatif comme ont déjà pu l’anticiper Grosjean, Bonneville et Marrast :

Cependant, de nouveaux défis attendent l’équipe au-delà des phases de tests fonctionnels du prototype en situation pour valider certains concepts; défis qui concerneront par exemple la durabilité dans le temps, notamment sur les questions de disponibilité, d’engagement et d’évolution des besoins du groupe de praticiens, ou du recrutement de nouveaux partenaires (Grosjean, Bonneville, Marrast, 2019, p. 20).

En dehors du secteur médical, ce temps long conduit, par exemple, les acteurs de la communication digitale à concevoir dans une logique de design d’interface utilisateur plutôt que de design d’expérience utilisateur (Collet, Baros, 2019).

5.2 Perspectives

Les enjeux expérientiels ont donc été particulièrement importants pendant la phase de test et de design participatif. Sur de nouveaux cas, c’est-à-dire en routine dans des situations appelées à être vécues d’un point de vue éthique, ces enjeux s’effaceront-ils ? La situation de travail sera-t-elle moins stressante qu’avec le microscope ? Cela est probable puisque, sous l’œil d’un regard calculateur (Foucault, 2004) automatisé, « l’articulation entre l’espace de la délibération et celui du savoir et des bonnes pratiques peut alors se produire » (Goût, 2015, p. 331) plus rapidement dans les cas les plus simples et de manière mieux mesurée dans les cas plus compliqués à interpréter. Par contre, ce que ne peut pas montrer, même anticiper cette étude, est de savoir s’il peut se produire un changement radical de paradigme cognitif, organisationnel et économique dans la profession prudentielle d’anatomopathologiste allant vers une aliénation du médecin expert à un techno-pouvoir d’intelligence artificielle. Pour ce faire, il faut attendre la diffusion de la technologie avant d’envisager une telle analyse critique.

Enjeux expérientiels de l'utilisation de l'IA en anatomopathologie Experiential Issues of the Use of AI in Anatomopathology

Résumé

Abstract

1. Introduction

1.1 Contexte

1.2 Problématique

1.3 Appareillage méthodologique

2. Le terrain de l’analyse anatomo-cyto-pathologique

3. Le cours d’action du pathologiste sans IA

4. L’expérience d'utilisation de l’IA

4.1. L’exploration de la conscience des médecins anatomopathologistes

4.2. Expérience entre continuité et rupture

4.3. Uniformisation des activités

5. Conclusion

5.1 Apports de cette recherche

5.2 Perspectives

Notes

Bibliographie

Liste des figures

Liste des tableaux

Résumés

Résumé

Abstract

Corps de l’article

1. Introduction

1.1 Contexte

1.2 Problématique

1.3 Appareillage méthodologique

2. Le terrain de l’analyse anatomo-cyto-pathologique

3. Le cours d’action du pathologiste sans IA

4. L’expérience d'utilisation de l’IA

4.1. L’exploration de la conscience des médecins anatomopathologistes

4.2. Expérience entre continuité et rupture

4.3. Uniformisation des activités

5. Conclusion

5.1 Apports de cette recherche

5.2 Perspectives

Parties annexes

Notes

Bibliographie

Liste des figures

Liste des tableaux

Outils de citation

Citer cet article

Exporter la notice de cet article