Corps de l’article

Historiquement, les arts de la scène – comme le théâtre, la musique, l’opéra et la danse – sont définis par la rencontre entre des artistes et un public, dans un lieu précis – un théâtre, soit un espace consacré, délimité par une architecture, divisé entre une scène et une salle –, pour un temps donné – une durée limitée à quelques heures. Qu’ils se déploient dans un théâtre en hémicycle, à l’italienne ou sur une scène centrale, ils présupposent ainsi une production et une réception simultanées, une communauté coprésente, que nous pourrions dire synchrone et syntope (par symétrie et par respect de l’étymologie grecque), en direct et in situ[1]. Cela va tellement de soi qu’on hésite à le mentionner : les arts de la scène – les spectacles vivants, les performing arts, etc. – se présentent sur une scène – justement. Mais aujourd’hui, la scène ne va plus de soi, pour toutes sortes de raisons historiques – notamment technologiques.

Je me propose de faire ici l’ébauche d’une cartographie de cette scène reconfigurée par les technologies. Il ne s’agira pas de décrire une scène en particulier, celle d’un art, d’une salle, d’une oeuvre singulière, mais la scène en général, toutes les scènes, institutionnelles et non institutionnelles, celles des arts de la scène et celles des autres arts qui ont une dimension scénique (c’est-à-dire, peut-être, tous les arts). L’objectif est d’esquisser un cadre théorique, avec une portée descriptive – qui permette d’analyser les oeuvres – mais aussi une portée prospective – qui permette d’envisager d’autres possibilités. Mais je prendrai souvent l’opéra comme exemple, puisque le point de départ de la réflexion est un séminaire interdisciplinaire de création d’opéra et de composition de musique pour la scène (automne 2021-hiver 2022), mis sur pied par Ana Sokolović, compositrice et professeure à la Faculté de musique de l’Université de Montréal (UdeM), et Zoey Cochran, musicologue et directrice adjointe à la recherche et à la coordination scientifique de la Chaire de recherche du Canada en création d’opéra. Le séminaire était centré sur la cocréation de quatre microopéras médiatiques de cinq minutes, chacun en réalité augmentée pour l’espace domestique, par des étudiant·e·s de la Faculté de musique, de la Faculté de l’aménagement et de la Faculté des arts et des sciences de l’UdeM, de l’École nationale de théâtre du Canada (ent), avec la collaboration des professeur·e·s Marie-Josèphe Vallée (Faculté de l’aménagement - École de design, UdeM), Olivier Asselin (Faculté des arts et des sciences, Département d’histoire de l’art et d’études cinématographiques, UdeM), Diane Pavlović et Andrea Romaldi (ent) et Sarah Bild (École de danse contemporaine de Montréal), de Normal Studio, d’inédi et de l’Opéra de Montréal.

L’opéra : Gesamtkunstwerk, collage ou bric-à-brac ?

Aussi pur qu’il puisse sembler, un art est toujours un véritable un assemblage d’éléments hétérogènes, une « activité collective », qui dépend de « chaînes de coopération », régies par des « conventions », dans un « monde », ou alors un agencement d’« acteurs », humains et non humains, d’actions et d’interactions, dans un « réseau sociotechnique »[2].

L’opéra par exemple assemble toutes sortes de matériaux – livret, partition et esquisse, musique, voix et corps, maquillages, coiffures et costumes, accessoires et décors, lumières, effets, etc. –, de formes et de motifs – airs et récitatifs, mélodies et orchestrations, jeu et mise en scène, scènes et actes, ouverture et intermèdes, figures et intrigues, genres et styles, répertoire, leitmotivs, effets visuels, etc. –, d’outils et d’appareils – instruments de musique, lumières, machines, etc. –, d’actions, individuelles et collectives, de tâches fondées sur une division singulière du travail – composition, écriture, direction d’orchestre, interprétation vocale et instrumentale, mise en scène, scénographie, éclairage, mais aussi financement, production, etc. – d’acteurs et de réseaux – de production, de distribution et de réception, etc. –, de lieux, d’architectures et d’institutions – salle de répétition, atelier, théâtre, etc. –, d’expériences aussi – actives d’un côté, passives de l’autre, avec des effets, physiques et psychologiques, sensoriels et affectifs ; etc. Quoi qu’on en pense, aucun de ces éléments n’est exclusif à l’opéra, aucun n’est essentiel. Pas même la rencontre du théâtre et du concert, du récit et de la musique, du dialogue et du chant, de l’interprétation dramatique et de l’interprétation musicale, de la mise en scène et de la direction d’orchestre. Il existe des spectacles joués et chantés auxquels on refuse le titre d’opéra (comme le « théâtre musical » ou la « comédie musicale ») et inversement, il est possible d’imaginer des spectacles sans jeu ni chant qui relèvent néanmoins de l’opéra (comme un opéra entièrement mécanique et synthétique).

Cet assemblage de « propriétés » peut sembler stable et permanent, éternel – pour les amateur·rice·s, l’opéra existe depuis toujours et pour toujours –, mais il est précaire et contingent, historique – pour les historien·ne·s, l’opéra est né (selon l’histoire officielle, un moment au début du xviie siècle, quelque part en Italie, entre Florence, Mantoue et Venise, autour de Peri et de Monteverdi), il aurait atteint sa maturité (en Europe au xixe siècle, entre Mozart et Puccini) et il pourrait bien mourir un jour[3]. En tous cas, il se transforme constamment, au gré des circonstances. Certaines propriétés sont délaissées (comme la versification ou l’éclairage à la chandelle, puis au gaz), d’autres sont conservées (comme le chant « lyrique »), de nouvelles sont intégrées (comme l’amplification et le surtitrage). En fin de compte, l’opéra est peut-être comme le navire Argo, « dont les Argonautes remplaçaient peu à peu chaque pièce, en sorte qu’ils eurent pour finir un vaisseau entièrement nouveau » (Barthes 1975, p. 50). Mais il faut imaginer ici un vaisseau qui, pendant le voyage, change non seulement de matière, mais aussi de forme et de fonction, et qui, en fin de course, n’a d’autre identité que le nom.

La précarité et la contingence d’un art sont particulièrement visibles au moment de son institution, quand il est en train de s’établir, et dans les moments de « crises », politiques, sociales et économiques – comme les guerres, les révolutions, les crises économiques et les révolutions technologiques –, qui produisent des tensions ou des ruptures et exigent des ajustements ou des reconfigurations.

Aujourd’hui, la condition historique de l’opéra est plus visible que jamais, avec les révolutions numériques qui interrogent les frontières entre les images, les médias, les plateformes, les appareils, les lieux et les publics. C’est parce que les nouvelles images nomades s’émancipent de leurs lieux traditionnels – elles se mettent à circuler librement, dans tous les lieux et entre les lieux, dans l’espace privé et dans l’espace public, dans l’espace domestique et dans la ville, dans les moyens de transport et dans les rues, etc. – que les lieux traditionnels des anciennes images sédentaires se manifestent aujourd’hui dans une nouvelle évidence – le théâtre pour les arts de la scène, comme le musée pour les oeuvres d’art et la salle de cinéma pour les films.

C’est ainsi rétrospectivement que la scène est devenue l’origine de l’opéra, que cette condition accidentelle fut essentialisée – avec tout ce qui la caractérise, notamment l’« immédiateté » du spectacle, la « présence » des interprètes, la dimension « publique » et « collective » de l’expérience.

Skènè et technè : une brève histoire

Évidemment, la scène n’en est pas à ses premières « crises ». Dans la modernité, avec le développement du capitalisme, avec les révolutions industrielles et postindustrielles, la scène est ébranlée chaque fois qu’une « nouvelle » technologie s’impose, d’abord les technologies opticochimiques, électriques, électromagnétiques et électroniques, comme la photographie, le phonographe et le cinéma, la radio, la télévision et la vidéo, etc., puis les technologies numériques, comme le jeu vidéo et la réalité virtuelle, augmentée et mixte, Internet et le web, les réseaux sociaux et les jeux en ligne, les plateformes mobiles, les biotechnologies et l’intelligence artificielle, etc.

Souvent, les technologies restent périphériques, elles sont utilisées autour de la scène, pour la diffuser, comme un simple moyen de capter et d’enregistrer les spectacles (avec des caméras, des microphones et d’autres capteurs), de les distribuer sur divers supports (des cylindres ou des disques et des bobines de pellicule, des cassettes et des vidéocassettes, des cd et des dvd), ou de les télédiffuser dans un réseau électrique ou électromagnétique, dans divers médias, sur diverses plateformes (radio, télévision, web, réseaux sociaux, applications mobiles, etc.) et de les présenter en différé ou en direct (live), sur divers appareils (écran géant et haut-parleurs, poste radio, téléviseur, ordinateur, console, casque, tablette, téléphone, etc.) et en d’autres lieux (salle de cinéma, espace domestique, espace public, etc.)[4].

Cet usage repose souvent sur une conception primaire des technologies et des technologies de communication en particulier, qui les considère comme des médias au sens traditionnel du terme, comme de simples « formes » pour transmettre des « contenus », des « canaux » pour « communiquer » des « messages ». Selon cet idéal communicationnel de transparence et de neutralité, les contenus ne sont pas ou ne devraient pas être transformés par les formes, ni les messages par les canaux, ni les spectacles par les technologies. Mais dans les faits, toute captation et toute diffusion requièrent toujours une certaine adaptation, du contenu à la forme, du message au canal, du spectacle à la technologie, qui peut être minimale – comme dans la captation simple – ou importante – comme dans l’adaptation cinématographique (qui exige une réécriture du spectacle, un redécoupage en plusieurs lieux, temps et scènes, une remise en scène et en images, en plusieurs plans, de plusieurs points de vue)[5].

Parfois, les technologies sont centrales, elles sont utilisées sur la scène même, pour l’augmenter, pour éclairer le spectacle, par le gaz, puis par l’électricité, amplifier la voix par des microphones et des haut-parleurs, ajouter des surtitres (et inversement pour jeter le reste de la salle dans le silence et l’obscurité), mais aussi pour renouveler la scénographie et faciliter les changements de décors, de temps et de lieu, pour produire des effets dramatiques, naturels ou fantastiques, visuels et sonores (le jour, la nuit, la mer, l’orage, les éclairs, le feu, etc.), ménager des apparitions et des disparitions, des ascensions ou des chutes (des anges, des damnés, des monstres, des fantômes, etc.), en variant la lumière, par des machines de théâtre, des décors mobiles, des instruments comme la plaque-tonnerre et l’éoliphone, des luminaires et des réflecteurs, puis des projecteurs et des écrans, des haut-parleurs, des caméras et des micros, des images et des sons, préenregistrées, puis en direct, etc.[6].

Souvent, les technologies sont utilisées pour nourrir le vieux rêve de l’oeuvre d’art totale (Gesamtkunstwerk), ébauché par les romantiques et ravivé par les avant-gardes sous le nom de multimédia, qui fait, sur la scène, la synthèse des arts, des médias, des genres, des images et des sons. Mais les technologies sont parfois utilisées à l’inverse pour mettre en question l’unité imaginaire de la scène, son unité de lieu, de temps et d’action, sur le modèle du collage et du montage, qui manifestent au contraire partout l’hétérogénéité des arts, des médias, des genres, des images et des sons. Elles introduisent une différance au coeur même de cette coprésence syntope et synchrone, une virtualisation du corps, un déplacement du point de vue et d’écoute et un retard dans la rétroaction, et elles entraînent ainsi une certaine complexification de la présence, une fragmentation de la scène.

Si les technologies opticochimiques, électriques, électromagnétiques et électroniques ont déjà contribué à compliquer la scène, elles n’ont pas souvent mis en question sa centralité. Mais les technologies numériques la reconfigurent radicalement, en favorisant une extension et une démultiplication narratives et ludiques inouïes[7].

Entracte : pour une narratocartologie transmédiale

Les sciences sont généralement définies et distinguées par leur objet d’études, leur domaine d’objets, leur « territoire ». Et les études savantes des arts sont généralement définies et distinguées par art ou par média : études littéraires, études théâtrales, histoire de l’art, musicologie, études cinématographiques, etc. Si en théorie ces territoires peuvent sembler clairement délimités, en pratique ils sont souvent problématiques. La scène est un objet d’étude particulièrement complexe parce qu’elle accueille plusieurs pratiques artistiques et que plusieurs pratiques artistiques ont une dimension « scénique ». Et la scène reconfigurée par les technologies l’est encore davantage parce que les technologies transforment toutes les pratiques artistiques et que toutes les pratiques artistiques ont désormais une dimension technologique. Souvent, elles utilisent les mêmes outils et elles sont confrontées aux mêmes problèmes.

Cette scène reconfigurée par les technologies relève ainsi de plusieurs disciplines artistiques – non seulement les « arts de la scène » et les « arts du spectacle », comme le théâtre, la musique, l’opéra et la danse, mais aussi le cinéma, la radio, la télévision, les arts visuels, les arts médiatiques, les jeux vidéo, etc. Et elle relève de plusieurs disciplines savantes – les études théâtrales, les études littéraires, la musicologie, l’histoire de l’art, les études cinématographiques, les études télévisuelles, les études du jeu vidéo, etc. Toutes ces disciplines ont bien évidemment des choses essentielles à dire sur la scène, mais chacune a des limites, notamment parce qu’elle inscrit la réflexion dans un cadre d’analyse monoartial ou monomédial, qui privilégie certains problèmes, certains modèles explicatifs, certaines méthodes et certaines histoires[8].

Pour décrire cette scène reconfigurée par les technologies, il est important de revisiter des approches plus fondamentalement transdisciplinaires, comme les études des communications, les études des médias, les études intermédiales, les études de la remédiation, l’archéologie des médias et les études transmédiales, sans oublier les études des sciences et des technologies[9]. Mais dans cet ensemble, la narratologie (l’étude des récits) est une approche particulièrement fructueuse, quand elle s’ouvre, au-delà du récit, aux mondes fictionnels et, au-delà du récit textuel, aux récits audiovisuels.

La narratologie classique[10] distingue dans tout récit trois « niveaux » : l’histoire (« le signifié ou le contenu narratif »), le récit (« le signifiant, énoncé, discours ou texte narratif lui-même ») et la narration (« l’acte narratif producteur et, par extension, l’ensemble de la situation réelle ou fictive dans laquelle il prend place ») (Genette 1972, p. 72)[11]. Et elle se propose d’étudier les rapports entre ces trois niveaux sous diverses « catégories », notamment l’« ordre », la « durée » et la « fréquence » (qui concernent les rapports temporels entre le récit et l’histoire), le « mode » (qui concerne les deux modes de « régulation de l’information narrative », soit la « distance » et la « perspective » ou « focalisation ») et la « voix » (qui concerne le « narrateur », le « destinateur » du récit, et éventuellement le « narrataire », le « destinataire » du récit).

Mais, aussi remarquablement productive qu’elle soit, cette narratologie a au moins trois points aveugles :

  • En insistant sur le récit textuel et littéraire, elle néglige toutes les formes narratives non textuelles et l’impact déterminant du média, de la médialité et de la modalité, sur les rapports entre histoire, récit et narration[12] ;

  • En insistant sur le récit, sur la manière dont le récit construit à la fois l’histoire et la narration, le·la narrateur·rice et le·la narrataire, elle néglige l’étude de la production et de la réception du récit, de l’écriture et de la lecture, de l’expérience[13] ;

  • En insistant sur le temps, sur les relations temporelles ente l’histoire, le récit et la narration, elle néglige l’espace, les relations spatiales entre les trois niveaux[14].

Souvent en effet, la narratologie classique conçoit les récits visuels ou audiovisuels, tels la peinture, le théâtre, l’opéra et le cinéma, comme des récits minimaux, « sans narration », « sans narrateur·rice » et par conséquent sans « narrataire », parce que l’histoire semble s’y présenter d’elle-même, immédiatement, sans médiation, par le moyen de personnages « en acte » et directement aux spectateur·rice·s. Mais, comme l’ont montré les narratologies picturale, théâtrale et filmique, une image, aussi immédiate qu’elle puisse paraître, est toujours rapportée à une instance narrative, unique (dans le cas d’un récit monomédial ou monomodal) ou multiple (dans le cas d’un récit multimédial ou multimodal), qui présente l’histoire, qui peint, met en scène, filme, monte et mixe, qui sélectionne ou construit ses éléments, les ordonne et les agence, dans l’espace et dans le temps, selon une certaine perspective, d’un certain point de vue et d’écoute – une instance narrative non textuelle qu’André Gaudreault a suggéré de nommer, non plus un·e « narrateur·rice », mais un·e « monstrateur·rice », même si elle continue néanmoins de « raconter »[15].

Mais dans le cas des images et des sons technologiques, l’instance narrative se complique, puisqu’elle n’est plus entièrement rapportée à une personne, à une intentionnalitéhumaine (ou humanisée), mais, en partie au moins, à des processus machiniques. Au cinéma, à la radio, à la télévision et dans le jeu vidéo, l’accès à l’histoire, au monde diégétique, n’est plus médié par un texte attribué à un·e narrateur·rice et destiné à un·e narrataire, mais par des images et des sons, attribués à un·e monstrateur·rice et destinés à un·e monstrataire, qui sont souvent, non seulement des personnes, mais aussi des appareils :

  • Des périphériques d’entrée ou d’acquisition (input devices), des capteurs, comme la caméra ou le microphone (réels comme au cinéma ou virtuels comme dans le jeu vidéo), des capteurs de mouvement, etc. ;

  • Des transducteurs et des actionneurs, des appareils de traitement ou de génération, comme les appareils et les logiciels de montage, de mixage, de compositing, de modélisation et les langages de programmation ;

  • Des périphériques de sortie ou de restitution (output devices), des afficheurs, comme l’écran, le casque, les haut-parleurs et les écouteurs ;

  • Et, dans le cas des images et des sons technologiques et interactifs, les périphériques de sorties sont accompagnés d’autres appareils d’entrée, comme les capteurs de mouvement et les contrôleurs. Désormais, le récit, cette médiation entre l’histoire et le·la lecteur·rice, est indissociable de l’interface, technologique et sensori-motrice, les capteurs, les afficheurs et les contrôleurs, entre le monde diégétique et les utilisateur·rice·s.

La narratologie classique définit aussi la narration comme « l’acte de raconter ». Mais cette définition est problématique parce qu’elle est fondée sur une double exclusion. D’abord, elle réduit la narration à « l’acte narratif producteur » et néglige « l’acte narratif récepteur », qui, pourtant, est aussi performatif. Ensuite, elle accorde une attention particulière au·à la « narrateur·rice » et (dans une moindre mesure) au·à la « narrataire », mais elle néglige l’« auteur·rice » et le·la « lecteur·rice » réel·le·s, qu’elle juge extérieur·e·s au récit, à l’oeuvre elle-même et, par conséquent, au champ d’études de la narratologie (ils relèveraient de l’histoire littéraire et de la génétique, de l’herméneutique et des théories de la réception).

L’écriture est évidemment décisive (sans écriture, point de récit), mais la lecture l’est tout autant puisque, lorsqu’elle est lente ou rapide, désordonnée et incomplète, elle peut affecter l’ordre, la durée, la fréquence du récit, son unité même – et notamment lorsque le récit est consigné sur des supports et médié par des appareils qui favorisent cette liberté (comme les supports magnétique, optique ou numérique et des lecteurs analogiques ou numériques, qui permettent d’accélérer, de ralentir, de sauter, d’inverser, etc.). On peut bien penser que la subjectivité de la lecture et la liberté du·de la lecteur·rice sont secondaires, insignifiantes même, parce qu’elles excèdent l’objectivité du texte et l’intention de l’auteur·rice. Mais certains récits reconnaissent cette agentivité de la lecture, ils l’intègrent même parfois dans le récit lui-même – comme le font les oeuvres interactives. Dans une certaine mesure, la « mort de l’auteur·rice » (relative) marque bien la « naissance du·de la lecteur·rice » (relative). Au-delà de l’histoire, du récit et de la narration, la narratologie doit tenir compte de l’écriture et de la lecture, de l’expérience de production et de l’expérience de réception.

Enfin, la narratologie classique s’intéresse beaucoup au temps et bien peu à l’espace, elle examine les relations temporelles entre les niveaux diégétiques (entre le temps de l’histoire et le temps du récit : ordre, durée, fréquence) et entre les instances (entre le temps de la narration et le temps de l’histoire : narration ultérieure, antérieure, simultanée ou intercalée) au détriment des relations spatiales. Gérard Genette expédie la question en quelques mots :

Je peux fort bien raconter une histoire sans préciser le lieu où elle se passe, et si ce lieu est plus ou moins éloigné du lieu d’où je la raconte, tandis qu’il m’est presque impossible de ne pas la situer dans le temps par rapport à mon acte narratif, puisque je dois nécessairement la raconter à un temps du présent, du passé ou du futur. De là vient peut-être que les déterminations temporelles de l’instance narrative sont manifestement plus importantes que ses déterminations spatiales. À l’exception des narrations au second degré, dont le cadre est généralement indiqué par le contexte diégétique […], le lieu narratif est fort rarement spécifié, et n’est pour ainsi dire jamais pertinent[16].

Genette 1972, p. 228

Mais dans le récit, l’espace est aussi important que le temps, et plus encore dans le récit audiovisuel, puisque les images et des sons réfèrent toujours aussi à des lieux, nécessairement et souvent même automatiquement (dans le cas des images et des sons technologiques).

Pour tenir compte de la médialité, de l’expérience et de l’espace, la narratologie doit examiner :

  • À la fois l’histoire et le parcours, le récit et la carte, c’est-à-dire, comme le disait Bakhtine, le chronotope, soit l’espace-temps, la scène, le monde et l’expérience de ce monde[17] ;

  • Non seulement à deux niveaux « diégétiques » (« intradiégétique » et « extradiégétique »), mais à quatre niveaux diégétiques, sur quatre scènes, qui sont nécessairement présentes sans être toujours marquées, soit la scène de production, la scène de l’histoire, la scène du récit et la scène de réception (la « salle ») ;

  • Les relations spatiotemporelles entre ces quatre scènes et les corps qu’elles présentent, entre les scènes de production, de l’histoire, du récit et de réception, entre les corps des personnes, des personnages et des instances narratives qui parlent, chantent, agissent sur chacune de ces scènes, entre les histoires et les parcours des producteur·rice·s, des auteur·rice·s et des interprètes, des personnages, des monstrateur·rice·s, des monstrataires, des capteurs, des afficheurs et des contrôleurs, des utilisateur·rice·s[18] ;

  • Les relations modales – selon la manière dont la médialité donne à la scène de réception un accès à la scène de l’histoire et régule le savoir (la perspective et la focalisation), le percevoir (l’ocularisation, l’auricularisation et la polysensorialité) et le pouvoir (le point d’action et l’interactivité) de l’utilisateur·rice.

Dans une telle ouverture, la narratologie devient non seulement une « narratologie transmédiale »[19], mais une sorte de chronotopologie ou de narratocartologietransmédiale.

xr : une scène reconfigurée, démultipliée et élargie

Une telle approche peut nous permettre de mieux cartographier les reconfigurations actuelles de la scène par les technologies numériques. Cette nouvelle scène est fragmentée et démultipliée, elle est élargie au-delà de sa clôture narrative usuelle, elle est ouverte et potentiellement infinie. Désormais, elle relève autant du worldbuilding que du storytelling[20]. Elle devient, à des degrés divers :

  • Immersive, dans son extension sensorielle, dans la distance au corps et l’interface, dans le rapport entre l’interface sensorielle naturelle et l’interface technologique, entre le champ perceptuel naturel et le champ perceptuel technologique, entre la scène de réception et la scène de l’histoire, quand elle place l’utilisateur·rice en plein centre du monde représenté (dans un corps virtuel humain, à la première personne, à la place de la caméra, ou à la troisième personne, derrière un avatar, dans un corps inhumain ou encore hors de tout corps, dans une sensibilité et une motricité désincarnées), comme dans les expériences de réalité virtuelle et les métavers ;

  • Interactive, dans son extension motrice, dans le rapport entre l’interface motrice naturelle et l’interface technologique, entre le champ moteur naturel et le champ moteur technologique, entre la scène de réception et la scène de l’histoire, avec différents « degrés de liberté », quand elle est non plus monologique, mais dialogique, non plus unidirectionnelle, mais bidirectionnelle ou multidirectionnelle et qu’elle offre à l’utilisateur·rice la possibilité de changer le récit (la perspective, la focalisation, le point de vue et d’écoute, le parcours, l’ordre des scènes, etc.) et/ou l’histoire (les personnages, les objets, l’environnement, les événements, le cours des choses, etc., à partir d’un point d’action et par un ensemble de contrôles), bref le monde, comme dans le jeu vidéo ou les expériences de réalité virtuelle, avec ou sans contrôleurs[21] ;

  • Collaborative et participative, dans son extension auctoriale entre la scène de production et la scène de réception, quand elle devient polyphonique et qu’elle redistribue les pouvoirs auctoriaux et qu’elle accorde des responsabilités à plusieurs auteur·rice·s, aux utilisateur·rice·s, à des machines et à l’intelligence artificielle, comme dans les environnements virtuels partagés[22] ;

  • Collective, dans son extension sociale, quand les scènes de l’histoire et du récit représentent un grand nombre de personnages et de monstrateur·rice·s, une véritable société, comme dans les jeux à mondes ouverts et persistants ; quand les scènes de production et de réception impliquent un grand nombre d’interprètes et d’utilisateur·rice·s et qu’elles sont, non pas individuelles ou familiales, en mode solo ou multijoueur, mais massivement multijoueur, et qu’elles impliquent une communauté plus large, souvent internationale des millions de personnes, comme dans les jeux en ligne massivement multijoueurs (mmogs)[23] ;

  • Multimédiale et transmédiale, dans son extension médiale, quand les quatre scènes sont fragmentées, démultipliées, captées, diffusées et restituées simultanément sur plusieurs médias, sur plusieurs plateformes (web, réseaux sociaux, applications mobiles, etc.) et sur plusieurs appareils (écran géant, téléviseur, ordinateur, console, téléphone, lunettes de réalité virtuelle et/ou augmentée, etc.), comme dans les jeux de réalité alternative et les franchises transmédia[24] ;

  • Multitemporelle et transtemporelle, dans son extension temporelle, quand les scènes de l’histoire et du récit représentent des histoires étendues dans le temps, un grand nombre d’actions et d’événements, un véritable monde, comme dans les téléséries et les jeux persistants ; quand les scènes de production et de réception se déploient non plus à un moment, mais à deux ou à plusieurs moments différents, non pas sur une courte durée, mais sur une longue durée, au-delà d’une simple partie, sur plusieurs jours, des semaines, des mois, des années, comme dans les jeux de réalité alternée ;

  • Multilocale, translocale et géolocalisée, dans son extension spatiale quand les scènes de l’histoire et du récit représentent des histoires étendues dans l’espace, un grand nombre de lieux, un véritable monde, comme dans les jeux à mondes ouverts ; quand les scènes de production et de réception se déploient non plus dans le même lieu, mais dans deux ou plusieurs lieux, n’importe où, dans l’espace privé ou public, dans l’espace domestique ou au travail, dans les transports ou dans la rue, ou au contraire dans des lieux choisis, parfois géolocalisés, in situ, dans un espace de jeu étendu, au-delà du cercle magique, sur un immense territoire – une ville, un pays, le globe ; et que les personnages, les monstrateur·rice·s, les interprètes et les utilisateur·rice·s forment alors une communauté dispersée, une diaspora, comme dans les promenades géolocalisées, les jeux de réalité alternée, les jeux mobiles en réalité augmentée et certaines expériences théâtrales sur Zoom ;

  • Mixte, dans l’extension de l’hybridation, quand les quatre scènes, chacune et/ou toutes ensemble, se déploient à la fois dans le réel et dans le virtuel, en ligne et hors ligne, et qu’elles font dialoguer les corps matériels et les corps immatériels (des personnages, des monstrateur·rice·s et des monstrataires, des interprètes, des utilisateur·rice·s)[25], l’espace physique et l’espace virtuel, le temps physique et le temps virtuel, la scène réelle et la scène virtuelle, la ville et le web, les objets du monde et la banque de données, les communautés physiques et les réseaux sociaux, comme dans les jeux en réalité mixte et les expériences en xr[26].

Cette dernière propriété, la mixité, est importante dans la mesure où elle concerne toutes les autres. Elle varie selon :

  • La proportion entre le réel et le virtuel, mesurée sur un « continuum » qui va du réel pur au virtuel pur, de la « réalité augmentée de virtualité » à la « virtualité augmentée de réalité », de la scène traditionnelle augmentée d’images ou de personnages virtuels à l’environnement virtuel augmenté d’images ou de personnages réels[27] ;

  • Le degré d’alignement entre le réel et le virtuel, qui peut être lâche, quand le virtuel est simplement localisé, ou alors plus serré, quand le virtuel est non seulement localisé, mais aussi parfaitement aligné sur le réel selon la position spatiale et temporelle de l’utilisateur·rice, quand les temps réels et virtuels sont synchronisés, les espaces réels et virtuels syntopisés, comme dans les expériences de réalité augmentée (qui recourent à diverses technologies de localisation, de suivi de mouvement et de reconnaissance de l’environnement : gps, boussole, gyroscope, accéléromètre, caméras, capteurs à infrarouge (lidar), balise de microlocalisation, capteur de proximité, capteur de luminosité ambiante, etc.).

Dans la configuration traditionnelle, la scène et la salle, la scène de production et la scène de réception étaient dans une continuité spatiale et temporelle (compliquée par les espaces et les temps, souvent fictionnels, de la scène de l’histoire et de la scène du récit). La scène et la salle étaient néanmoins séparées par une série de frontières matérielles – le manteau d’Arlequin, le rideau et le cadre de scène, l’avant-scène, la rampe et la dénivellation entre le plateau et la fosse ou le parterre – et une frontière immatérielle – le « quatrième mur » – qui assuraient la « clôture de la représentation », mais qui imposaient aussi une distribution inégale des savoirs, des percevoirs, des pouvoirs, entre les interprètes actif·ive·s, qui parlent, chantent et jouent, et les spectateur·rice·s passif·ive·s, qui regardent et écoutent.

Dans ses reconfigurations technologiques, la scène offre un nouveau « partage du sensible », avec d’autres découpages « des places et des parts », de l’espace et du temps, des savoirs, des percevoirs, des pouvoirs et du commun, qui peut avoir des résonances politiques[28].

Les « trois unités » : les relations spatiotemporelles

Ce nouveau « partage du sensible » est manifeste dans la reconfiguration des rapports spatiaux et temporels entre la scène et la salle par les technologies[29]. Ils peuvent être ramenés à quatre grands types[30] :

  • La diffusion en direct et in situ : la production et la réception se passent au même moment et dans le même lieu, la scène et la salle sont synchrones et syntopes, comme dans le cas du spectacle traditionnel dit vivant ou live sur scène, du miroir qui renvoie l’image de ce qui se trouve devant lui ou de la télévision en circuit fermé[31] ;

  • La diffusion en différé et ex situ : la production et la réception se passent à deux moments et dans deux lieux différents, la scène et la salle sont asynchrones et asyntopes, comme dans le cas des technologies d’enregistrement, de la photographie, du phonographe, du cinéma, de la vidéo et de la télévision en rediffusion, de la vidéo à 360 degrés ; comme dans le cas des technologies interactives, du jeu vidéo et de la réalité virtuelle[32] ;

  • La diffusion en direct et ex situ : la production et la réception se passent au même moment, mais dans deux lieux différents, la scène et la salle sont synchrones, mais asyntopes, comme dans le cas des technologies en direct ou « connectées », du téléphone, du téléphone musical et du théâtrophone, de la radio et de la télévision en direct, de la diffusion en direct en salle de cinéma, de la vidéotéléphonie et de la webdiffusion en direct sur les réseaux sociaux, de la téléprésence, des jeux en ligne et des mmogs persistants[33] ;

  • La diffusion en différé et in situ : la production et la réception se passent à deux moments différents, mais dans le même lieu, la scène et la salle sont asynchrones et syntopes, comme dans le cas des reconstitutions historiques in situ (les reconstitutions historiques et les jeux de rôle grandeur nature ou historical reenactments et live action Role-Playing Games) et des expériences de réalité augmentée, mixte ou étendue géolocalisées[34].

Entre ces quatre grands types de relations spatiotemporelles, toutes les variations sont possibles, selon la distance, la distance spatiale entre la production et la réception (depuis les quelques centimètres du miroir et les quelques mètres de la télévision en circuit fermé jusqu’aux kilomètres de la télévision régulière) ou la distance temporelle (depuis le petit délai de quelques secondes dans la transmission électromagnétique en direct jusqu’aux dizaines d’années des supports de stockage, magnétiques, optiques ou autres). Et puis, les différences s’estompent lorsque la télévision ou la vidéotéléphonie est enregistrée et rediffusée plus tard ou lorsque l’enregistrement est diffusé immédiatement, aussitôt fait, sur les réseaux sociaux.

L’aura : les modalités de la présence

Ces quatre grands types de relations spatiotemporelles entre la scène et la salle nous obligent à repenser la notion de présence. Généralement, l’effet de présence est associé à l’immédiateté, à l’absence de médiation. Mais contrairement à cette idée reçue, l’absence de médiation technologique ne produit en général aucun effet particulier et c’est au contraire la médiation technologique elle-même qui conditionne de l’effet de présence. Les réflexions de Walter Benjamin, puis celles de Roland Barthes sur la photographie l’ont bien montré : certaines photographies – notamment les vieilles photographies, celles qui présentent un certain punctum – ont une étrange présence. Mais cette « aura » ou ce « ça-a-été » n’est pas une présence simple, mais une présence traversée d’absence. Elle est en effet pour Benjamin « un singulier entrelacs d’espace et de temps : unique apparition d’un lointain, aussi proche soit-il » (Benjamin 1996, p. 19) et pour Barthes une « double position conjointe : de réalité et de passé » (Barthes 1980, p. 120).

Selon une certaine doxa, cette présence particulière marquée par l’absence serait liée à l’émotion que suscite immanquablement le passage irréversible du temps et elle se manifesterait ainsi surtout dans les technologies d’enregistrement. Et c’est pourquoi la photographie et le phonographe sont si émouvants : ils nous font voir des corps et entendre des voix passés, souvent morts. Mais la doxa néglige deux faits. Le premier est que les technologies optico chimiques et mécaniques ne sont pas les seules à produire de tels effets de présence : les technologies électriques, électromagnétiques, électroniques et même numériques peuvent aussi acquérir une aura, quand elles sont utilisées pour l’enregistrement et quand, avec le temps, elles sont marquées par l’obsolescence technologique et l’usure des supports. Le second est que cette présence singulière peut être produite, non seulement par des technologies d’enregistrement, mais aussi par des technologies de diffusionen direct : le téléphone, la radio et la télévision peuvent, autant que la photographie, le phonographe et le cinéma acquérir une aura, parce qu’ils mêlent aussi la présence et l’absence, mais autrement, en articulant, non pas le présent et le passé, mais le proche et le lointain[35].

La présence est intimement liée à ce qu’on appelle, depuis Charles S. Peirce, l’indicialité. Mais la réflexion sur l’indicialité a sans doute été faussée par l’hégémonie du modèle photographique. C’est ainsi que Rosalind Krauss en est venue à identifier l’indicialité en général au « photographique », comme si les deux termes étaient parfaitement synonymes, et que Georges Didi-Huberman a pu à réduire l’indicialité à la seule logique de l’empreinte, pour en ignorer toutes les autres modalités (Didi- Huberman [1997]2008, Krauss 1977a et b).

Pourtant, dans ses réflexions inaugurales sur le signe, Peirce avait une conception plus large de l’indice. On le sait : à la différence du symbole, qui réfère en vertu d’une convention, et de l’icône, qui réfère en vertu d’une ressemblance ou d’une analogie, l’indice réfère en vertu d’une « contiguïté », d’une « connexion », d’une « causalité », « physique » et bien « réelle », avec l’objet. Pierce donne de l’indice plusieurs exemples : le moulage et la photographie, certes, mais aussi le coup de tonnerre, l’étoile Polaire, l’air humide, le baromètre, le coup frappé à la porte, la girouette, la flèche, l’ombre, le pronom démonstratif, etc.

De cet ensemble, on peut sans doute retenir deux grands types fondamentaux – la trace (l’empreinte, le fragment, la relique, le monument, etc.) et la manicule (le doigt pointé, la flèche, la fumée, etc.) – qu’Umberto Eco propose de nommer différemment : indice et indizio en italien ou, comme le suggère son traducteur français Jean-Marie Klinkenberg, indice et index (Eco 1988, p. 62, note 1). La trace et la manicule réfèrent tous deux en vertu d’une connexion physique avec leur objet, mais l’une réfère in presentia – en présence de l’objet désigné – et l’autre in absentia – en son absence – comme le dit Eco.

Mais la distinction est plus profonde : elle porte moins sur la présence ou l’absence de l’objet que sur la temporalité et la spatialité de la relation de connexion. Dans l’indice (la trace), la connexion physique est rompue et le signe réfère au passé, c’est-à-dire en différé ; dans l’index (la manicule), la connexion physique est actuelle et le signe réfère au présent, c’est-à-dire en direct. Et dans les deux cas, qu’il soit indice ou index, le signe peut être localisé ou délocalisé – selon qu’il est présenté dans le lieu même auquel il réfère, c’est-à-dire in situ, ou ailleurs, c’est-à-dire ex situ. En fait, si (par fidélité à Peirce et par économie) nous tenons à conserver un seul mot, l’indice, pour définir le genre entier, nous aurions quatre grandes espèces d’indice selon le rapport spatial et temporel qu’il entretient avec son objet : l’indice en direct, l’indice en différé, l’indice in situ et l’indice ex situ.

L’indice ne concerne pas seulement la trace, mais aussi la manicule, non seulement la photographie, le phonographe et le cinéma, mais aussi le téléphone, la radio et la télévision. À partir du moment où ils sont fondés sur une captation et une restitution, et même s’ils sont encodés et décodés, les signaux électriques, électromagnétiques, électroniques et numériques comme la lumière, sont fondés sur une indicialité, c’est-à-dire une continuité physique, une contigüité, une causalité, une sorte de contact. La lumière et l’onde radio appartiennent d’ailleurs toutes deux au même « spectre électromagnétique ».

Ces distinctions faites, les conditions de l’effet de présence se précisent : ce n’est pas seulement la proximité physique – l’indice en général –, mais à la fois une proximité physique et une distance spatiale et/ou temporelle – l’indice en différé et/ou ex situ –, une proximité physique distancée, une différance dans l’identité, une absence dans la présence. Nous aurions ainsi quatre grands types de présence qui correspondent aux quatre grands types de relations spatiotemporelles et aux diverses combinaisons des quatre grandes espèces d’indice, soit (pour emprunter librement à l’ici et maintenant de la phénoménologie, au ça-a-été de Barthes – et au cela est du Werther de Goethe) :

  • La diffusion en direct et in situ manifeste le c’est-ici-maintenant (une double proximité spatiale et temporelle) ;

  • La diffusion en différé et ex situ manifeste le ça-a-été-là-jadis (une double distance spatiale et temporelle) ;

  • La diffusion en direct et ex situ manifeste le c’est-là-maintenant (une distance spatiale et une proximité temporelle) ;

  • La diffusion en différé et in situ manifeste le ça-a-été-ici-jadis (une proximité spatiale et une distance temporelle).

Ces correspondances ne sont pas absolues, mais relatives : aucun type d’indice ne peut garantir, à lui seul, un effet de présence. Car dans les faits, l’effet de présence ne dépend pas seulement de la présence ou de l’absence de médiation, ni de la nature de cette médiation, il dépend aussi, bien sûr, des circonstances, du contexte expérientiel, social et historique. Souvent les technologies évoquent la présence et l’absence, la mort et la résurrection, au moment de leur « naissance », comme à l’origine la photographie, le phonographe et le cinéma ; ou alors, au moment de leur « mort », quand elles sont frappées d’obsolescence ou confrontées à une nouvelle technologie. Mais entre la naissance et la mort, quand elles sont adoptées et généralisées, les technologies ne produisent plus aucun effet de présence. Barthes l’avait déjà noté : la photographie aujourd’hui, disait-il, est « banalisée », elle est reçue avec « indifférence », l’essence de la photographie, son « noème », est « oublié » et « n’agit plus » (Barthes 1980, p. 180-181). Le contexte est décisif : dans un monde généralement présent, dans la vie quotidienne par exemple, la présence pure n’a rien de remarquable et ne produit plus aucun « effet de présence », mais les technologies d’enregistrement et de télédiffusion deviennent magiques ; inversement, dans un monde généralement médié par les technologies, les technologies deviennent banales et ne font plus aucun effet, mais certaines expériences « immédiates », les spectacles vivants sur la scène par exemple, nous paraissent des moments et des lieux exemplaires de la présence.

En fait, la condition essentielle des effets de présence est surtout la dialectique, la dialectique entre la présence et l’absence, entre le présent et le passé, le proche et le lointain, le médiat et l’immédiat, le direct et le différé, l’in situ et le télédiffusé, le réel et le virtuel, comme d’ailleurs entre le réel et le fictionnel. Et c’est pourquoi, sans doute, la réalité mixte et étendue est particulièrement propice aux effets de présence et que la métalepse narrative – la transgression des niveaux diégétiques, le passage entre l’intradiégétique, l’extradiégétique et l’extratextuel – est une figure dominante dans de tels dispositifs technologiques. L’effet de présence n’est jamais plus fort que quand les frontières se brouillent entre l’actuel et le virtuel, entre le réel et la fiction, dans un double mouvement : quand, tout à coup, les personnages et les choses virtuels et fictionnels sortent de l’image et de la scène de l’histoire pour entrer sur les scènes de production ou de réception, dans la vie quotidienne, et devenir des personnes et des choses actuelles et réelles ; et quand, inversement, les personnes et les choses réelles quittent les scènes de production ou de réception pour entrer sur la scène de l’histoire et devenir des personnages et des choses virtuelles ou fictionnelles ; quand les instances narratives, humaines ou mécaniques, virtuelles ou fictionnelles sont « actualisées » et « réalisés » et qu’elles deviennent des personnes et des appareils réels ; et quand, inversement, ces derniers deviennent des personnages et des appareils virtuels et fictionnels sur les scènes de l’histoire ou du récit ; quand tout l’acte communicationnel fictionnel – la production et la réception du message, le médium, la technologie, les appareils et les interfaces virtuels et fictionnels – est « actualisé » et « réalisé » ; et quand, inversement, tout l’acte communicationnel réel est « diégétisé », « narrativisé » et « fictivisé »[36].

« All the World’s a Stage » : une plateforme à l’échelle de la planète

Aussi physiquement séparée, aussi socialement autonome, aussi hétérotopique qu’elle puisse paraître, la scène est toujours inscrite dans la ville et dans la société. Et la scène reconfigurée par les technologies fait partie du réseau sociotechnique, elle est liée, de près ou de loin, aux grandes corporations technologiques, notamment les Big Five – Alphabet (Google), Amazon, Apple, Meta (Facebook) et Microsoft. Les développements récents du côté d’Alphabet et de Meta sont particulièrement déterminants.

Le 28 octobre 2021, en pleine pandémie, Mark Zuckerberg annonce que la compagnie mère Facebook devient officiellement Meta « to reflect its focus on building the metaverse ». Le mot n’est pas nouveau, mais il désigne maintenant un environnement virtuel partagé, un réseau social en réalité virtuelle, d’une ampleur inégalée : « The metaverse will eventually encompass work, entertainment, and everything in between[37] » ; « Our hope is that within the next decade, the metaverse will reach a billion people[38] ».

Quelques jours plus tard, le 8 novembre 2021, John Hanke, dont la compagnie Niantic, dans la mouvance de Google, a créé les jeux de réalité augmentée mobile Ingress et Pokemon Go, lance Lightship, un Augmented Reality Developer Kit (ardk). Contre le métavers de Meta, Hanke veut créer « a real-world metaverse[39] » grâce à la réalité augmentée. Il s’agit de transformer « our globe into a completely new kind of gameboard » en créant « a planet-scale augmented reality platform » et, mieux encore, « an operating system for the world »[40].

Cette coïncidence pourrait sembler le symptôme d’une guerre à finir entre la réalité virtuelle et la réalité augmentée. Mais en fin de compte, les programmes des deux compagnies ne sont pas si différents. Meta s’intéresse aussi à la réalité augmentée : en même temps que la compagnie développe des casques de réalité virtuelle, elle travaille à des lunettes de réalité augmentée – les Ray-Ban Stories et le Projet Aria – et son plus récent casque de réalité virtuelle – le Meta Quest Pro (2022) – est un aussi un casque de réalité mixte. Quoi qu’on en ait dit dans la presse, le métavers de Meta n’est pas un environnement purement virtuel : « The metaverse will feel like a hybrid of today’s online social experiences, sometimes expanded into three dimensions or projected into the physical world[41] ». De même, Niantic s’intéresse aussi à la réalité virtuelle : sa plateforme requiert une numérisation complète de l’espace réel entier pour en tirer un modèle virtuel – une carte 3D du monde, au centimètre – et elle peut très bien présenter dans l’espace physique des expériences de réalité entièrement virtuelle.

En fait, comme nous l’avons vu, il existe entre la réalité virtuelle et la réalité augmentée, non pas une différence de nature, mais une différence de degré : elles se situent sur un même continuum qui va de la réalité pure à la virtualité pure et entre lesquels tous les dispositifs de réalité mixte sont possibles, dans toutes les proportions, de la « virtualité augmentée de réalité » à la « réalité augmentée de virtualité ».

Même si Facebook/Meta et Google/Niantic ont des origines et des parcours très différents – Facebook/Meta est un réseau social qui s’est intéressé à la réalité virtuelle (à partir de l’achat d’Oculus en 2014), Google/Niantic est un moteur de recherche qui s’est intéressé à la cartographie, à la géolocalisation et à la réalité augmentée (à partir de l’achat de Keyhole en 2004) –, leurs ambitions convergent : développer une plateforme de réalité mixte, qui couvre à la fois l’espace virtuel et l’espace physique, et universelle, c’est-à-dire persistante et à l’échelle du monde, accessible en tout temps, en tout lieu, par tous et toutes.

Comme toujours, l’objectif officiel des deux entreprises est purement moral et civique, une véritable utopie sociopolitique. Pour Meta : « we build technology to bring people together. The metaverse is the next frontier in connecting people » ; « the metaverse can enable better social experiences than anything that exists today » ; « in the metaverse, you’ll be able to do almost anything you can imagine—get together with friends and family, work, learn, play, shop, create—as well as completely new experiences » ; et « you’ll be able to spend more time on what matters to you, cut down time in traffic, and reduce your carbon footprint ». Pour Niantic : « using technology to serve humanity is at the core of what we do » ; il s’agit d’amplifier « the positive effect that our technology & products have in public space, across exercise, exploration, and engagement » ; « our impact transcends communities around the world: when people play our games they get moving, they make friends, they explore parks, local historical sites, public art, street fairs, and community events. We’re working to connect people to one another and to the places around them » ; et « we are working to enhance public space, empower people, and create community »[42].

À en croire les déclarations publiques, ces compagnies sont désintéressées. Comme le répète Zuckerberg : « we don’t build services to make money; we make money to build better services[43] ». Mais comme toujours, l’objectif réel est étroitement utilitariste et même mercantile, politiquement libertarien et même cynique, comme le montrent certaines publications plus discrètes, destinées, non pas au grand public, mais aux investisseurs. Chez Meta : « we generate substantially all of our revenue from selling advertising placements to marketers. Ads on our platforms enable marketers to reach people based on a variety of factors including age, gender, location, interests, and behavior[44] ». « Looking for a way to appeal to a diverse demographic that is highly engaged, demande Niantic. Learn how Niantic’s marketing platform offers brands a new way to attract customers to real world locations at scale[45] ».

Les deux entreprises, comme toutes les grandes entreprises du genre, ont des ambitions monopolistiques : chaque plateforme cherche à devenir non seulement une plateforme universelle, mais la seule plateforme universelle. Et les raisons sont claires. Il faut maximiser les profits et les profits reposent sur l’extraction et la vente de données hautement prédictives (de données personnelles : données personnelles d’identification, données physiques, physiologiques et psychologiques, économiques, culturelles et sociales, données de localisation, de navigation, et de mobilité, données biométriques, génétiques, etc.), pour la publicité ciblée bien sûr (targeted marketing), mais aussi pour bien d’autres usages, car elles permettent non seulement de connaître les gens et de mieux les servir, mais aussi de modifier leur comportement et de mieux les asservir, à des fins commerciales ou politiques. Et la valeur des données dépend de leur quantité et de leur qualité, c’est-à-dire du nombre d’utilisateur·rice·s et de l’extension de la plateforme. Chaque compagnie veut ainsi que sa plateforme soit utilisée par le plus grand nombre de gens possible, de tout âge, partout, tout le temps, 7 jours sur 7, 24 heures sur 24, jour et nuit, à la maison, au bureau et dans les transports, pendant le travail, les loisirs et les temps morts, dans l’espace public et dans l’espace privé, pendant la veille et même pendant le sommeil.

Il n’est pas étonnant que toutes les compagnies du genre cultivent partout cette image amicale, inclusive et civique, et offrent tous leurs services gratuitement aux gens « ordinaires » : malgré les apparences, les consommateur·rice·s ne sont pas vraiment les client·e·s des plateformes, mais leur matière première, le produit qu’elles vendent à d’autres client·e·s plus nanti·e·s et plus payant·e·s[46]. Et il n’est pas étonnant que ces compagnies développent des algorithmes dont le principal objectif est de maximiser le temps passé sur la plateforme, le temps de connexion : elles veulent créer une dépendance maximale (sans vraiment se soucier des conséquences qu’elles pourraient avoir sur les gens, les communautés, la société dans son ensemble et notamment la vie publique[47]). Nous assistons actuellement à une guerre des plateformes, qui se livrent une lutte sans merci pour l’attention (arbitrée, très timidement il faut le dire, par les lois et les états, par les gouvernements et les institutions nationales, régionales et internationales)[48].

Rideau : la scène et l’espace public

Dans ce mouvement, l’espace public est transformé. Lui aussi devient mixte : il se déploie à la fois dans l’espace physique et dans l’espace médiatique, dans le réel et dans le virtuel, en ligne et hors ligne, dans la ville et sur le web, dans les communautés physiques et sur les réseaux sociaux. Mais il est aussi privatisé : s’il est public dans son usage (il paraît accessible, égalitaire, libre et ouvert, à tous les échanges communicationnels), il reste privé dans son statut juridique (il appartient à une entreprise et il est soumis à ses intérêts économiques et au principe de la maximisation des profits).

La scène est aussi un espace public et, parce qu’elle est technologique, elle est elle-même une plateforme, intimement liée à ces grandes plateformes commerciales et monopolistiques. Souvent, elle utilise leurs logiciels et leurs matériels, leurs systèmes d’opération et leurs appareils, et parfois, elle peut même sembler épouser leur programme et leurs idéaux : une certaine philosophie déterministe et téléologique de l’histoire des technologies, un « solutionnisme technologique » (Morozov 2013), un fétichisme à l’égard des machines, etc.

Mais comme tous les outils, ces technologies sont dialectiques : elles ne sont pas intrinsèquement progressistes ou réactionnaires, démocratiques ou totalitaires. Certes, elles produisent de nouvelles formes de privatisation, de publicité et de propagande, de surveillance et de contrôle, plus efficaces que jamais. Mais elles peuvent aussi produire de nouvelles formes de résistance, de connaissance, de politique et d’esthétique – à condition d’être détournées de leur programme initial. C’est ainsi que la scène – la scène de l’opéra exemplairement – peut être un lieu d’invention et d’alternatives.