Corps de l’article

Il aura fallu attendre la fin de la première décennie du XXIe siècle pour que de grands chantiers interdisciplinaires, et parfois internationaux, se mettent en place et commencent à scruter, sous ses multiples aspects et dans toute sa complexité, la réalité sonore de la représentation théâtrale. Certains de ces aspects avaient déjà été abordés ici et là dans des études qui ne manquaient pas d’intérêt, mais qui restaient éparses et limitées, qu’on pense à certains travaux sur la voix ou la diction d’acteurs et d’actrices ayant marqué la mémoire du public, à d’autres sur la prosodie, à d’autres encore sur l’acoustique ou l’architecture de théâtres particuliers, sur des techniques de bruitage, sur la musique ou sur certaines créations sonores marquantes pour la période contemporaine. Dans l’ensemble, on peut dire que le son au théâtre a été négligé. Cela étonne vu son omniprésence et son importance dans la production et la réception du spectacle car, si le théâtre est bien « le lieu où l’on voit », il est aussi celui où l’on entend. Les ouvrages phares de l’historiographie et de la théorie théâtrales semblent l’avoir oublié. À leur lecture, on aurait presque l’impression que le théâtre est essentiellement un art de la vue et du texte.

Nous proposons ici quelques hypothèses sur les causes de cet « oubli », sur ce qu’il faut en comprendre et sur ce qui explique l’émergence récente et déterminante des études sonores en théâtre. Mais aussi, à travers des spectacles marquants produits au cours des quarante dernières années, nous voulons souligner la part fondamentale du son et de l’ouïe dans la genèse de la scène moderne, dont les bases se sont élaborées il y a plus d’un siècle et sont toujours valides.

Les études sur le son : une genèse récente

L’« oubli » de la réalité sonore de la représentation théâtrale n’est pas vraiment surprenant. D’une part parce que, comme les intermédialistes le diraient, le son est si « naturalisé », si lié au dispositif de médiation théâtrale, si « transparent » (Bolter et Grusin, 2000 : 21 et suivantes), qu’il est difficilement « discrétisable ». Son « inséparabilité » de la conjoncture physique, esthétique, sensible où il est émis en rend l’analyse singulièrement ardue. D’autre part parce que, jusqu’à récemment, on ne disposait pas d’assez d’outils adéquats pour le dire : ni des mots, ni des concepts, ni des modèles. L’appel lancé par Daniel Deshays, dans son essai Pour une écriture du son, garde toute son actualité : « [Les] données qui définissent le son sont infinies, tant en terme de diversité d’existence, de relations que de formes en devenir. S’il est une urgente nécessité, c’est de désigner les variables avec lesquelles il est possible d’effectuer sa mise en jeu » (Deshays, 2006 : 30). « Relations », « variables », « devenir », « mise en jeu », ce pourrait bien être là les fondements d’une isotopie du sonore théâtral, toujours en construction.

À vrai dire, les deux causes dont nous parlons sont inter-reliées : notre incapacité historique à isoler le son explique en partie la pauvreté de l’outillage dont nous disposions; et la pauvreté de nos outils ne nous permettait pas d’isoler le son et d’en faire un objet d’étude scientifique, au sens traditionnel du terme. Mais il y a des raisons, plus profondes et plus lointaines encore, qui expliquent l’impasse historique de la recherche et son récent déblocage. Nous pensons qu’elles sont d’ordre idéologique et c’est ce que nous allons tenter d’éclaircir dans les pages qui suivent. Nous proposons certaines pistes pour mieux comprendre les facteurs qui ont historiquement condamné le son au silence et ceux qui, depuis quelques années, en font, au contraire, un objet de recherche de première importance.

Le défi conceptuel et la spécificité de l’approche

Les premières grandes recherches issues du nouveau champ des Sound Studies – qui n’a pas vingt ans illustrent bien les carences méthodologiques et théoriques évoquées plus haut puisque, faute de posséder un appareillage conceptuel propre, les Sound Studies se sont d’abord contentées de puiser dans d’autres domaines les outils qui leur faisaient défaut. Leur premier pourvoyeur a été le champ des études visuelles. Dans cette phase initiale des études sonores, les chercheurs ont effectué des transpositions qui nous apparaissent aujourd’hui non seulement simplistes, mais erronées. Citons, à titre d’exemple, le concept de « point de vue » qui est tout simplement devenu le « point d’écoute », comme si le son se déplaçait en ligne droite vers un point donné qui pourrait être « l’auditeur idéal ». C’est d’ailleurs ainsi qu’a été conçue la stéréophonie, qu’on peut comprendre comme une application des règles de la perspective visuelle à l’univers du son[1]. Parfois, encore, et c’était le cas le plus fréquent, on définissait les qualités du son en les opposant systématiquement à celles associées à la vue. C’est ce que Jonathan Sterne, figure de proue des Sound Studies, qualifiait avec ironie de « litanie audiovisuelle ». La liste des aphorismes qui la composent est infinie. Citons-en quelques-uns : l’audition serait sphérique, la vision serait directionnelle; l’audition immergerait son sujet, la vision offrirait une perspective; l’audition viendrait à nous, la vision se dirigerait vers des objets; l’audition concernerait l’affect, la vision serait associée à l’intellect (Sterne, 2015b : 26-27)[2].

L’urgence, pour les études sonores, a donc rapidement été et reste toujours double : d’abord, s’autonomiser par rapport aux études visuelles, ce qui implique une attitude plus critique à l’égard des concepts et approches qui en sont issus; ensuite, développer un vocabulaire spécifique au son qui rend mieux compte de sa nature indisciplinaire. Cela exige la collaboration étroite de spécialistes des disciplines les plus variées : acoustique, histoire, linguistique, médias, musicologie, neurosciences, philosophie, phonétique, physiologie, physique, etc. Cette nécessité explique l’envergure des équipes qui s’intéressent à présent au son, y compris au sein des études théâtrales.

Si nous sommes encore loin de comprendre la réalité sonore de la représentation théâtrale dans toute sa complexité dynamique, il est indéniable que d’importants progrès ont été réalisés à ce propos, à commencer par ces « variables » que réclamait Deshays et que nous commençons à réunir. Il en résulte une meilleure précision terminologique[3] qui reste la condition sine qua non de toute démarche scientifique. Mais un problème demeure, celui de la transparence de l’objet et de la difficulté que nous avons à le concevoir autrement que comme une composante détachable, « séparable » de l’ensemble auquel il participe.

Des techniciens du Festival TransAmériques (FTA) de Montréal affirmaient, lors d’échanges suivant le bilan de l’édition de 2011, que tous les spectacles présentés au cours des six éditions précédentes avaient comporté, d’une façon ou d’une autre, des projections visuelles. Ils insistaient, avec beaucoup de détails, sur la variété des moyens utilisés : écrans blancs, surfaces non conventionnelles, corps-écrans, effets fumigènes, cinquième mur, etc. Quand on a demandé à ces mêmes techniciens ce qu’il en était des projections sonores, ils sont tombés des nues. Il a donc fallu préciser : à quand remontait la dernière production qui n’avait pas utilisé de système de sonorisation – donc des projections sonores – au FTA? Bien entendu, aucun technicien ne le savait. À vrai dire, plus personne n’imagine aujourd’hui un spectacle théâtral qui ne recourrait pas, d’une façon ou d’une autre, aux technologies de reproduction du son, ce qui inclut l’usage de la trame sonore – ou bande-son[4] – ou de micros. Cette anecdote montre bien l’écart qui existe entre notre perception du sonore et notre perception du visuel; elle illustre aussi cet « oubli » persistant du son théâtral. L’intégration du son au spectacle semble d’emblée si organique que le fait de l’en extirper, même à des fins de recherche scientifique, paraît contre-nature. Et ça l’est!

Les travaux que nous menons depuis 2008, et dont relève le présent dossier, nous en ont rapidement convaincus. Ils ont démontré les limites des approches scientifiques traditionnelles fondées sur la notion d’objet. L’étude des phénomènes sonores n’exige pas seulement un nouveau vocabulaire, elle nécessite un changement radical d’attitude heuristique : troquer l’objet pour le flux; rejeter la tentation de fixer le mouvement. En somme, l’étude du son demande qu’on suive une dynamique dans et par son interrelation avec d’autres dynamiques. Très rapidement, nous sommes arrivés à cette conclusion duelle : le son n’est pas un objet traditionnel, il est irréifiable et on ne peut l’approcher qu’en mouvement, un mouvement qui, lui-même, est inséparable d’une conjoncture en constante mutation.

Les ruptures aurales comme variables

Notre intuition était que, pour mieux comprendre cette dynamique complexe, il fallait trouver des moments de grande perturbation où la réalité sonore se trouvait bouleversée par l’intrusion d’éléments étrangers, en l’occurrence de nouveaux sons. Les réactions en chaîne provoquées par cette intrusion d’une extranéité pouvaient servir de révélateurs à cette dynamique sonore du spectacle difficilement saisissable autrement. La fin du XIXe siècle, grâce à l’électricité, et la fin du XXe siècle, grâce aux technologies numériques, nous ont semblé particulièrement propices à l’analyse de ces phénomènes puisqu’on y observe l’arrivée de sons résolument neufs dans une auralité qui avait globalement peu évolué – depuis des décennies, voire des siècles. Il nous semblait plus que probable que l’intrusion de ces sons « reproduits » par les nouvelles technologies et les modalités de leur cohabitation avec les sons historiques du théâtre – les sons « produits » – créeraient un effet opacifiant, au moins pour un temps, sur le flux sonore, le mettraient en saillie. À défaut d’être saisissable, le son serait au moins observable dans la brève durée de son existence.

Cela appelle quelques précisions. Outre les instruments de musique, une multitude de « machines à bruit » – parfois reléguées au rang « d’accessoires » utilisés dans les coulisses (Brachart, 1911) – ont permis, depuis l’Antiquité, de « produire » des sons au théâtre. Nous connaissons plusieurs de ces appareils divers puisque nous en possédons des descriptions détaillées; certains d’entre eux ont d’ailleurs subsisté et se retrouvent à présent dans les musées. Nous nous émerveillons parfois de leur efficacité et de l’ingéniosité de leurs inventeurs. Mais ces « machines » imitatrices du vent, du tonnerre, des vagues ou du galop de cheval n’étaient pas des technologies de reproduction du son, puisque la reproduction nécessite qu’il y ait encodage, puis décodage du signal avant qu’il se rende à l’oreille de l’auditeur par l’intermédiaire d’un haut-parleur, d’un cornet acoustique ou d’écouteurs[5]. Bien que l’une des premières et des plus illustres technologies de reproduction du son – le phonographe (1877) de Thomas Edison – ait été purement mécanique et que les producteurs de théâtre aient eu très tôt recours aux phonographes et gramophones (mécaniques) – tant pour les effets sonores que pour la musique utilisés lors des spectacles –, c’est vraiment l’électricité qui assura la percée des sons reproduits sur scène grâce aux possibilités d’amplification et de transport du son – sous forme d’ondes électriques – qu’elle permettait.

Une recherche menée très récemment par une équipe multidisciplinaire sur les relevés de mise en scène du fonds de l’ART (Association de la régie théâtrale) à Paris montre bien que le théâtre a, dès le début du XXe siècle et selon les modalités les plus variées, intégré ce son reproduit à son arsenal spectaculaire. Cela est particulièrement vrai pour le théâtre de boulevard[6]. Pour la première fois dans l’histoire du théâtre, des sons produits en direct – par les acteurs, les musiciens, la machinerie, le public, par le bâtiment (qui craque, etc.) et par son environnement (le métro qui passe sous la salle, les bruits de la rue) – ont coexisté avec des sons reproduits : musiques, voix, bruitages. Le plus souvent, il s’agissait d’enregistrements, mais certains d’entre eux pouvaient être créés en direct à l’aide de microphones, parfois à la vue du public, parfois non (à partir des coulisses ou des dessous).

Le son reproduit comme révélateur des enjeux ontologiques du théâtre

Dans son essai Écoute : une histoire de nos oreilles, Peter Szendy se remémore le moment où, baignant depuis toujours dans un espace où jouait de la musique, il a soudainement commencé à « écouter de la musique comme musique. Avec la conscience vive qu’elle était à entendre, à déchiffrer, à percer plutôt qu’à percevoir » (Szendy, 2001 : 17). Cette double opération, percer / percevoir, est précisément ce qui définit l’auralité; elle combine ce que nous entendons et la façon de l’entendre.

Découlant du latin auris, qui signifie « oreille », le terme auralité fait partie des néologismes qu’ont produits les études sonores ces dernières années pour mieux approcher les phénomènes du son et de l’écoute. Dans The Audible Past, Jonathan Sterne souligne que « we can sometimes experience an audible past, but we can do no more than presume the existence of an auditory past[7] » (Sterne, 2003 : 19). Sterne fait ici allusion aux enregistrements sonores réalisés dans le passé que nous pouvons aujourd’hui encore entendre avec le même équipement que celui qu’utilisaient nos aïeux (quand les disques ou cylindres sont bien préservés et quand on dispose des appareils d’écoute de l’époque). Dans ce cas, le son reproduit qui arrive à nos oreilles est à peu près le même que celui qu’entendaient, autrefois, les auditeurs du même enregistrement reproduit par le même appareil. C’est ce que Sterne appelle le passé audible. Mais nous n’entendons plus comme eux et l’un des défis des études sonores est précisément de mieux comprendre de quelle façon les gens entendaient, c’est-à-dire de mieux comprendre le passé auditif. Par exemple, nous savons que les /R/ roulés étaient la norme et passaient à peu près inaperçus alors que, aujourd’hui, ce son n’est plus ni neutre ni banal. Il a pris une connotation : vieillot, paysan, ridicule, attaché à une région particulière, etc. La distinction entre « audible » – ce qu’on entend – et « auditif » – comment on l’entend – recoupe les « quatre écoutes[8] » définies par Pierre Schaeffer (2002 [1966] : 104). L’auralité, telle que nous la définissons, est la combinaison de l’audible et de l’auditif, de ce qu’il y a à entendre et des protocoles (ce qui inclut les valeurs) à suivre pour entendre de façon optimale. On peut ainsi parler de l’auralité d’une pratique (le théâtre), d’une époque, d’une région ou d’une région à une époque[9], etc.

Au quotidien, ce que nos oreilles perçoivent est cacophonique, mais cette cacophonie, qui est acceptable dans la rue, serait inacceptable ailleurs. Ceci est particulièrement vrai dans tous les espaces régis par une médiation, comme l’espace théâtral, où la grande majorité des sons sont construits pour le spectacle[10]. Ces espaces imposent que nous tenions compte et participions du protocole de médiation en fonction duquel des sons ou des combinaisons de sons sont acceptables et d’autres moins. Nous avons affirmé plus tôt qu’une des causes de « l’oubli » du son était d’ordre idéologique. C’est en effet à un repositionnement idéologique qu’ont mené les révolutions électrique et numérique. L’ajout de sons reproduits aux sons historiques du théâtre marque non seulement un tournant majeur dans l’histoire du son au théâtre, il change aussi le cours du théâtre lui-même. Ce tournant ne s’est pas fait sans heurt, il a déclenché de violentes et durables querelles de nature esthétique et ontologique qui ont dépassé le strict cadre théâtral, ainsi qu’en témoigne l’essai de Walter Benjamin (2000 [1939]) sur le statut de l’oeuvre d’art à l’époque où se développent les technologies de reproduction de l’image et du son.

On a surtout retenu de ce texte emblématique de la modernité que l’aura diminuait avec la reproductibilité. Cette idée de perte, qui a fait l’objet d’innombrables discussions[11], a eu un profond écho dans le monde du théâtre, ce qui témoigne de la prégnance du sentiment anti-mécaniste dans ce milieu, sentiment qui n’a cessé de croître tout au cours du XIXe siècle parallèlement et en réaction aux progrès des technologies. Le credo de ce mouvement se résumait à un axiome désarmant de simplicité : rien ne peut surpasser la nature. Tous ceux qui s’opposaient à l’invasion des technologies dans la vie quotidienne n’étaient pas nécessairement de fervents croyants, mais il y avait indéniablement un vieux fonds religieux à tout cela : malgré leurs progrès indiscutables et souvent fulgurants, les technologies reproductrices du son et de l’image (qui sont des créations humaines) ne pourraient jamais égaler la nature (qui est une création divine). L’argument de la fidélité (puis de la haute-fidélité, puis de la haute-définition, etc.), que l’industrie du son a rapidement mis de l’avant pour légitimer son action, allait dans le même sens. Le meilleur son reproduit était le son le plus fidèle au son original, sans qu’on sache très bien ni qu’on s’attarde à ce que cela signifiait. Ce qui est clair, en tout cas, c’est que ce principe de fidélité s’inscrivait dans une logique référentielle à l’heure où les avant-gardes se battaient pour assurer l’autonomie de l’oeuvre d’art. Il y avait là un décalage inquiétant.

La conviction selon laquelle le naturel est supérieur au médiatisé reste encore bien ancrée en ce début de XXIe siècle. On en veut pour preuve cette idée très courante selon laquelle une discussion en tête-à-tête serait nécessairement supérieure à une discussion médiatisée – à distance – alors que la réalité dément cela tous les jours. On se trompe et on trompe aussi efficacement en face-à-face que par Skype ou au téléphone. Ironiquement, c’est même à une technologie qu’on s’en remet, le polygraphe, pour déceler avec le moins d’incertitude possible si une personne ment lors d’une discussion en tête-à-tête!

Quand on sait l’importance sociale du théâtre, qui demeure l’une des principales activités de divertissement pour les populations des grandes villes d’Occident jusqu’aux années 1930, et quand on considère le succès fulgurant des médias électriques fondés partiellement ou totalement sur la reproduction du son – le disque, le cinéma parlant, la radio – qui le concurrençaient, on comprend mieux sa valeur symbolique dans le conflit qui s’est alors amorcé entre défenseurs et détracteurs de la technologie et de la reproductibilité qu’elle permettait. Rapidement, le théâtre a été investi par ces derniers qui n’ont pas hésité à mettre en évidence sa « naturalité », son caractère prétendument atechnologique, le présentant comme l’ultime refuge « of real and authentic culture in a world of mass media and television daftness[12] », ainsi que le rappelle Peter Boenisch (2006 : 103; souligné dans le texte), non sans ironie. Le théâtre est ainsi devenu, davantage dans ce qu’on en disait que dans ce qu’on y faisait – nous allons y revenir –, la pratique emblématique des discours anti-mécaniste et anti-technologique qui s’y confondaient. La scène soi-disant dépouillée, « naturelle », du théâtre devenait l’antithèse du bric-à-brac technologique et créateur d’artifice des studios de cinéma et de radio.

Le son s’est alors retrouvé au coeur d’un long débat durant lequel s’est développé et imposé le concept cardinal de présence. On a tendance à penser aujourd’hui que ce concept est aussi vieux que le théâtre; il semble en effet si lié à l’épistémè théâtrale qu’on a peine à l’en distinguer. Mais c’est, en fait, un concept relativement récent, né en réaction aux succès du disque, du cinéma et de la radio. Dès que le cinéma muet s’est constitué en pratique autonome et qu’il a commencé à attirer les foules, des voix illustres se sont élevées pour souligner son caractère factice et ses limites. Daniel Frohman, qui était, au début du XXe siècle, l’une des personnalités les plus en vue de Broadway, est de celles-là :

The moving picture is now at the zenith of its power. […] [T]he problem of the cinema is not to increase its public, but to hold it. This it will do by perfecting still further its already marvelous art. The synchronization of sound with motion on the screen, a device by which the explanatory matter now printed on the film will not be interrupted, the reproduction of color, and the giving of a stereoscopic quality to the pictures are improvements on which many men are at work. But the moving picture raised to the nth degree of perfection can never completely supplant the spoken drama. This is because, while sound and motion may be synchronized eventually so the figures of the screen will give every appearance of speaking, that human quality we call personality can never be translated by the lens and transmitted to the audience through the medium of screen. Only the presence of the living player can communicate the player’s magnetism to the audience[13]

Frohman, 1915 : X6

L’affirmation de Frohman, où l’on décèle les germes de l’idée benjaminienne d’aura – qu’elle précède de près de vingt-cinq ans –, pouvait d’autant plus rassurer que ce magnat du théâtre connaissait très bien aussi le monde du cinéma, ayant été, pendant quelques années, directeur de la Famous Players Film. L’argument de la suprématie de la présence « en chair et en os » (« of flesh and blood », Frohman, 1915 : X6) sur la présence « reproduite » sur écran vaut aussi pour les sons produits et reproduits. Cet argument est à la base du discours essentialiste qui allait dominer le discours théâtral pendant les décennies à venir et qui allait limiter les progrès du son reproduit sur scène, en particulier, celui de la voix humaine.

Henri Gouhier fut le premier grand propagateur de l’argument essentialiste. Son livre culte, L’essence du théâtre, parut pour la première fois en 1936[14], alors que le monde des arts et des médias se trouvait en pleine tourmente. La radio était désormais présente dans de très nombreux foyers et le cinéma parlant triomphait. C’est dans ce contexte de rapide changement que Gouhier partit, tel un archéologue, à la quête des qualités immuables et historiques qui caractérisaient le théâtre d’aujourd’hui comme d’hier par-delà les modes technologiques, esthétiques et morales. Cette quête était celle de l’essence, élément définitoire fondamental de la pratique théâtrale. Qu’est-ce que le théâtre, demande-t-il? C’est « l’art de représenter ». Mais qu’est-ce que « représenter »? « [C]’est rendre présent par des présences » (Gouhier, 2002 [1936] : 16). L’essai de Gouhier est une longue variation sur ce thème unique : le théâtre est l’art de la présence (et du présent)[15].

Qu’on défende ou non la réflexion essentialiste, cette affirmation possède un indéniable potentiel rassembleur; elle aurait même pu faire consensus si les penseurs de la présence au théâtre, à commencer par Gouhier, n’en avaient pas rapidement détourné le sens. En effet, personne ne remet en question, même aujourd’hui, que le théâtre, de façon générale, met l’acteur et le spectateur en présence physique l’un de l’autre. Mais ce n’est pas toujours vrai ni nécessaire et rien n’empêcherait, comme cela s’est fait au cabaret, qu’un micro soit utilisé dans cet échange. Or, très rapidement prise dans une logique d’opposition binaire, la présence est devenue l’antonyme du médiatisé et du reproduit.

Et cette idée s’imposa durablement. Peggy Phelan la défendait encore avec véhémence dans son retentissant essai Unmarked: The Politics of Performance, publié en 1993, alors que les études théâtrales prenaient le virage performatif et que le raz-de-marée numérique balayait la scène. Pour Phelan, toute reproduction était une menace à l’« intégrité » de la scène traditionnelle et profanait le « refuge de l’authentique » (Boenisch, 2006 : 103) par l’introduction de projections vidéo, de sons reproduits ou, pire encore, en saisissant l’éphémère de la scène avec une caméra et un micro de façon à pouvoir la pérenniser et la reproduire :

[O]nly life is in the present. Performance cannot be saved, recorded, documented, or otherwise participate in the circulation of representations of representations: once it does so, it becomes something other than performance. […] To the degree that performance attempts to enter the economy of reproduction, it betrays and lessens the promise of its own ontology[16]

Phelan, 1993 : 146

Près de trois quarts de siècle après la déclaration fracassante de Frohman, l’argument ontologique de la naturalité théâtrale n’avait rien perdu de sa vigueur.

Il aura ainsi fallu attendre la toute fin du XXe siècle pour que le discours théâtral se libère de l’hégémonie essentialiste. L’approche intermédiale, qui se développe à partir de la fin des années 1980[17] et qui a bouleversé notre conception de la dynamique des médias – et des arts –, a centré son attention sur l’entremêlement – entanglement[18] – des pratiques et des technologies. De cela ont découlé des études qui offrent du théâtre une image radicalement renouvelée. Elles montrent précisément l’importance qu’y tient le son et prouvent que les technologies de reproduction sonore y ont été omniprésentes tout au cours du Long Siècle (1880 à aujourd’hui) en dépit du discours dominant qui les avait sinon occultées du moins minorisées.

Du sonore pré-numérique, qui reste terriblement sous-étudié malgré l’abondance et la précision des archives – ce qui illustre encore le conditionnement idéologique des chercheurs –, nous commençons à dégager un tableau riche et nuancé marqué par un moment charnière : l’usage du magnétophone et l’amplification sonore des salles qui débutent dans les années 1950 et se généralisent rapidement. Cette double avancée a permis d’accélérer et de développer ce qui faisait déjà partie des pratiques courantes. En effet, dès les années 1930, le recours au son reproduit ne relevait plus de l’exception, ne jouait plus non plus sur sa seule valeur d’attraction, et son usage ne se limitait pas à quelques modalités précises. Bien au contraire, du son d’accompagnement – bruitage et musique – au son dit « diégétique », les créateurs sonores du Long Siècle ont exploité tout le potentiel des technologies dont ils disposaient. Les appareils de son – radio et tourne-disque – figuraient dans de nombreuses scénographies; il s’agissait d’accessoires familiers[19]. On note cependant que, autant avant qu’après l’introduction du magnétophone, la voix humaine était rarement reproduite sur les scènes traditionnelles de théâtre et que, quand cela arrivait, la médiatisation de la voix était toujours soulignée, sa production était opacifiée et était justifiée par la diégèse. C’était le cas quand une voix provenait (ou semblait provenir) du poste de radio qui se trouvait sur scène ou quand un personnage parlait à un micro ou dans un porte-voix électrique.

On pourrait penser que cette réticence à médiatiser la voix des acteurs était causée par les insuffisances de la technologie. Mais comment alors expliquer le succès de la radio, du parlant, du disque, du cabaret, de la comédie musicale qui ont tous recouru à ces mêmes technologies avec le succès que l’on sait? Et comment expliquer que, les avancées technologiques étant ce qu’elles sont, on sente encore aujourd’hui une réticence à utiliser les micros sur scène alors que, plus souvent qu’autrement, le public ordinaire ne se rend même pas compte que la voix des acteurs lui parvient des haut-parleurs? Du moins, il n’en fait pas de cas. Et des créateurs comme Denis Marleau, Yves Pommerat, Robert Lepage ou Romeo Castellucci, pour ne citer qu’eux, en font un usage systématique et sophistiqué qui ne diminue en rien la légitimité de leur démarche et la valeur artistique de leurs créations.

Ces réticences sont probablement des relents, au théâtre, du vieux sentiment anti-mécaniste hérité du XIXe siècle. Les intermédialistes diraient que ce sentiment relève d’un réflexe de « résistance médiatique », désignant par là ce qui se passe lorsqu’un média – ou un art – freine ou empêche l’intrusion d’une technologie ou d’une façon de faire qui, généralement, provient d’un autre média, lorsque cela met en jeu sa propre médiation. Mais il n’y a pas d’essentialisme médiatique. Un média n’est pas un organisme vivant qui développe des anticorps pour se protéger d’un intrus. La résistance médiatique est toujours due à l’action de ces hommes et femmes qui sont les usagers du média. Ce n’est donc pas le média qui lutte pour préserver une quelconque intégrité de ses processus de médiation, ce sont les usagers qui défendent leurs valeurs. La lente mais inexorable pénétration des sons reproduits sur scène, y compris la reproduction de la voix, s’explique d’abord par le changement de ces valeurs.

L’année 1999 marque un moment charnière à ce propos puisque c’est en cette ultime année du XXe siècle que Philip Auslander a décidé de se lancer dans un débat décisif avec Peggy Phelan et les essentialistes. Son essai Liveness: Performance in a Mediatized Culture, paru cette année-là, eut l’effet d’une bombe. Il précédait de quelques mois cet autre essai phare de la période, celui de Bolter et Grusin sur la remédiation, dont il partageait les valeurs intermédiales. Auslander défendait deux idées majeures, en opposition radicale à celles de Phelan. D’une part, la présence – qui correspond sensiblement au liveness[20] n’est pas l’apanage exclusif du théâtre : de nombreuses pratiques médiatiques, artistiques ou non – comme les cours de justice aux États-Unis –, intègrent la présence à leur dispositif de médiation. Il s’agit là d’une première attaque frontale contre l’unicité prétendue, presque sacralisée de la scène théâtrale (« ultime refuge ») que défendaient les essentialistes. D’autre part, et ceci est plus important encore, la présence n’est pas, n’a jamais été, le contraire du médiatisé et elle n’est pas incompatible avec le médiatisé, comme l’illustrent la radio et, plus tard, la télévision qui se réclament d’elle. Contrairement au cinéma, mais comme le théâtre, elles agissent en temps réel et font valoir que le rapport intime, individualisé qu’elles instaurent avec l’auditeur ou le téléspectateur compense largement les prétendus avantages d’une coprésence physique où le spectateur de théâtre est noyé dans l’indifférence d’une masse.

La démonstration d’Auslander est difficilement attaquable : il peut y avoir de la présence – et de l’aura[21] – dans les médias les plus technologiques et la scène en apparence la moins technologisée, comme celle de Jerzy Grotowski ou celle de Peter Brook, n’en est pas moins un dispositif médiatique. Tout dénudé qu’il soit, le corps de l’acteur « possédé » communiant avec son public en fait partie. La présence, au théâtre, est toujours le produit d’une médiation, un effet.

Les technologies numériques, par leur puissance, leur accessibilité et leur souplesse, ont bouleversé les pratiques théâtrales actuelles, ouvrant la scène à d’infinies possibilités visuelles comme sonores. Elles ont, du même coup, accéléré et amplifié les transferts intermédiatiques, brouillant encore davantage les frontières disciplinaires ou, plus justement, faisant éclater au grand jour leur artificialité (ce qui est une autre façon de rompre avec la pensée essentialiste). Cette réalité incontestable donne raison à Auslander. En même temps, libérés de la contrainte de l’illusion référentielle, les concepteurs de son créent des univers originaux et complexes qui commencent à s’entremêler à l’action scénique, y participent de plus en plus pleinement, contribuant vraiment à faire du théâtre actuel l’hypermédia proclamé par Kattenbelt (2006 : 29).

Recomposer l’histoire de la modernité scénique : prendre en compte et penser le tournant acoustique (fin XIXe - début XXe siècle)

Si les études théâtrales[22], comme nous venons de le voir, d’une façon plus ou moins marquée selon les pays, ont globalement négligé la dimension auditive de l’art qui était leur objet, elles ont assez clairement défini la modernité scénique, dont on situe la naissance à la toute fin du XIXe siècle, comme un mouvement valorisant la dimension visuelle de la scène. La métamorphose du spectacle théâtral a été communément mise en rapport avec les technologies émergentes d’enregistrement et de diffusion d’images du réel, en particulier la photographie et le cinématographe. Ce qui a fondé ce rapprochement n’était pas l’usage scénique de la photographie et du film (ce serait pour un peu plus tard), mais l’idée d’un changement du regard lui-même et des formes de la vision[23]. Or, comme il a été dit plus haut et comme de récents travaux l’ont montré, le développement des technologies de reproduction du son, exactement contemporain, phénomène lui-même inscrit dans une transformation des représentations de l’ouïe et du sonore[24], a été tout aussi remarquable dans ses effets sur les pratiques humaines, personnelles et sociales. Pourtant, la question d’une éventuelle relation entre la métamorphose esthétique du théâtre et la transformation de l’écoute n’a pas fait l’objet d’études similaires à celles consacrées au rapport à l’image. Notre conviction est que cette relation existe et qu’elle a été déterminante. Après avoir traité de la dimension technologique et intermédiale du « tournant acoustique[25] », nous souhaitons maintenant montrer que celui-ci comporte une réflexion plus large sur l’auralité, en l’occurrence sur ses profondes mutations à cette période, en amont et en dehors des usages des nouveaux appareils. Au-delà d’un simple soulignement de l’importance, de la variété et de la nouveauté des éléments sonores dans le premier théâtre d’art, puis dans les propositions des avant-gardes, au-delà du rappel des modes purement auditifs de l’expérience théâtrale apparus en même temps que le téléphone et le phonographe – à commencer par le théâtrophone –, nous souhaitons faire apparaître l’impact sur la création dramatique et scénique de la transformation des représentations (mentales et scientifiques) de l’ouïe et de l’espace aural. Notons dès à présent que cet impact ne concerne pas une branche particulière (« théâtre d’écoute » ou « théâtre de voix ») de cette création. L’auralité moderne, interagissant avec les nouvelles pratiques de consommation des images, aura même probablement trouvé ses modes d’expression les plus puissants dans des productions où la vision a pu paraître dominer, comme elle le ferait plus tard dans les formes réunies sous la dénomination de « theatre of images », de « théâtre d’images[26] ».

Le basculement d’un sens à un autre?

Revenons à la naissance de l’art du théâtre proprement dit, identifiée à l’apparition du metteur en scène[27]. La fonction de cette figure a généralement été décrite comme une intervention dramaturgique, traduite en termes principalement scénographiques et plastiques, la musique et les sons assumant, lorsqu’ils sont mis en oeuvre, une fonction interne à cette perspective. Il s’agit d’abord et avant tout que le public voie. La perception et l’attention auditives en tant que telles sont peu évoquées, renvoyées au passé désuet du règne des auteurs, de la diction et des « voix d’or », tout ce avec quoi on veut rompre. Le récit aujourd’hui admis, récit qui semble s’être élaboré et imposé dans les années 1970, du moins dans la francophonie, raconte comment un théâtre « plutôt fondé sur l’écoute » – comme l’écrivent les auteurs de La mise en scène théâtrale de 1800 à nos jours – laisse place à un théâtre où « la part visuelle […] acquiert de plus en plus d’importance » (Boisson, Folco et Martinez [dir.], 2010 : 55). Ce basculement d’un sens à un autre se serait amplifié et radicalisé avec les générations suivantes, suscitant en réaction un théâtre du corps et de la présence. À partir de cette proposition, qui fait consensus sans jamais être explicitée, c’est une négligence quasi totale de tout ce qui relève de l’auralité qui s’installe. L’usage des nouveaux appareils de reproduction ou de médiatisation du son, sur scène ou autour de la scène, nous l’avons vu, n’a pas fait l’objet de reconstitutions précises. Mais l’indifférence est plus générale. Alors qu’il existe des histoires de l’acoustique des salles de concert et des lieux de musique au XXe siècle, on ne trouve pas de travaux similaires pour les salles et les lieux de théâtre. Alors que la modernité scénique coïncide avec les débuts de l’enregistrement audio et que nous disposons, par conséquent, dès l’orée du XXe siècle, de phonogrammes de théâtre, ceux-ci n’ont pas donné lieu à des recherches poussées, comme si la dimension sonore ne méritait pas quelques efforts[28]. L’image de la scène moderne – si l’on excepte le champ du théâtre radiophonique et quelques initiatives touchant explicitement l’écoute – a été construite sur l’idée selon laquelle la représentation se déroule dans un espace organisé par et pour la vue.

Il y a à cela plusieurs explications. D’abord, chez les chercheurs en études théâtrales comme chez tous les autres chercheurs en sciences humaines et sociales, existe l’idée générale d’un lien entre la modernité et une « hégémonie » de la vision, pour reprendre le titre de l’ouvrage qu’a dirigé David Michael Levin (1993). Ensuite, il y a le désir légitime de ces mêmes chercheurs de ne pas limiter l’étude de leur art aux approches littéraires ou aux théories attribuant un rôle de premier plan au texte dramatique. Ainsi, Jacques Nichet, universitaire et metteur en scène, a-t-il consacré le cours qu’il a donné en 2010 au Collège de France aux expériences artistiques qui ont participé à la recherche d’« un langage purement scénique ». Bien que cette démarche ne l’impliquât pas a priori, les éléments sonores de ce nouveau « langage », verbaux ou non verbaux, ont été inscrits par la théorie, en particulier la sémiologie, parmi les composantes d’une « lecture » globale, le concept de « lecture » renvoyant au visuel. Le discours militant de la jeune théâtrologie, soucieuse d’autonomisation par rapport aux études de lettres, a engendré, dès les années 1980, un schéma binaire : « le texte et la scène », dont les plus grands essayistes ont eu bien du mal à se débarrasser[29]. Mais le récit « ocularocentriste » de l’histoire de la scène moderne repose aussi, il faut bien le dire, sur l’inscription effective de la part la plus brillante de l’art du théâtre naissant dans la « passion du voir » – puissamment décrite par Roberto Calasso dans La folie Baudelaire (2011) –, telle qu’elle était en train de se redéfinir avec le développement des panoramas, des projections lumineuses, de la photographie, et puis du cinéma, pensé comme le concurrent et le double, fascinant, de la scène contemporaine, un cinéma dont on a longtemps oublié la dimension sonore. De cette passion témoignent, dans des styles différents, les deux grands penseurs de la scène moderne : Arthur Gordon Craig et Antonin Artaud. Elle est encore vive aujourd’hui.

Sans remettre en question la dynamique de cette passion, nous avons entrepris de retravailler cette histoire. À propos de ce qui s’est passé à la fin du XIXe siècle, nous parlerons non du passage d’un théâtre de l’écoute à un théâtre du voir, mais d’une invention de l’écoute comme pratique sensorielle autonome et de la réorganisation profonde de l’ensemble acoustique permanent du théâtre occidental, comportant quatre éléments de base : la voix, le bruit, la musique, le silence, dont deux au moins, le bruit et le silence, sont structurellement communs à la scène et à la salle. Cette réorganisation s’est amorcée dans plusieurs lieux en même temps : dans le champ de l’acoustique, définie comme la science du son, incluant sa production, sa transmission et ses effets; dans le champ de la poésie et de l’écriture dramatique; et dans le champ de la mise en scène – phénomène rarement décrit, mais qui n’en existe pas moins. Bref, la réorganisation s’est amorcée dans trois univers autonomes possédant leurs propres chronologies et dont les interrelations demandent encore à être étudiées.

Un nouvel espace auditif

Au XIXe siècle, explique Jonathan Sterne dans Une histoire de la modernité sonore, du fait des recherches et des expériences effectuées sur l’oreille et sur le son, ainsi que du développement des gestes techniques comme l’auscultation médicale, « l’écoute se distingue des autres activités sensorielles […]. Une fois isolée de la sorte, [la faculté d’audition] peut être intensifiée, ciblée et reconstruite ». « Le son, continue-t-il, est construit en tant qu’objet en physique, en acoustique et en physiologie » (Sterne, 2015b : 138). Le son, tous sons confondus, quels qu’ils soient et d’où qu’ils viennent. Quels ont pu être les effets d’une telle transformation de l’ouïe, le sens majeur du théâtre avec la vue, sur la pensée, la pratique et l’expérience théâtrales? Nous en soulignerons deux : d’une part, le brouillage des frontières entre les composantes traditionnelles de la représentation : la voix (parlée), le bruit (le bruitage) et la musique, frontières jusque-là assez claires, même si musique et voix entretenaient des relations séculaires; d’autre part, le brouillage de la limite entre le lieu du jeu et le lieu de l’écoute par la mise en évidence objective de leur unité acoustique. Nous suggérerons, en nous appuyant sur l’analyse d’archives sonores de quelques spectacles, que cette redéfinition radicale des matériaux et de l’espace du théâtre, qui a marqué la genèse de la scène moderne, fonde encore les créations d’aujourd’hui, au-delà de la séparation entre théâtre du verbe et théâtre de l’image. Revenons aux dernières décennies du XIXe siècle et aux trois lieux de remuement de la pensée acoustique. Nous commencerons par l’écriture poétique, parce que les poètes révèlent les mouvements de fond qui se traduisent aussi, parfois, en découvertes scientifiques et en trouvailles technologiques.

Un petit texte de Rilke s’intitule Notes sur la mélodie des choses (Rilke, 2012 [1898])[30]. Il se compose de quarante notes brèves. On peut y percevoir des échos à La naissance de la tragédie de Nietzsche paru en 1872. La note XVI introduit la notion générale de « mélodie des choses » (Melodie der Dinge), que Rilke appelle aussi mélodie « de l’arrière-fond » (Hintergrund) ou encore « atmosphère » (Stimmung) – le mot joue avec la voix (Stimme) : « Que ce soit le chant d’une lampe ou bien la voix de la tempête, […] toujours veille derrière toi une ample mélodie, tissée de mille voix, dans laquelle ton solo n’a sa place que de temps à autre. Savoir à quel moment c’est à toi d’attaquer, voilà le secret de ta solitude » (souligné dans le texte). Dans la note XX, Rilke décrit un groupe en deuil : « Sur eux bruit comme une forêt ». À partir de la note XXV, Rilke parle concrètement de théâtre :

[C]et ample choeur de l’arrière-fond […] ne peut sur scène, pour le moment, se faire comprendre par les mêmes moyens

note XXVI

Renforcer techniquement tel bruit, tel éclairage, produit un effet ridicule, parce que de mille voix on en monte une seule en épingle, si bien que toute l’action reste suspendue à cette unique arête

note XXVII

Ce qui apparaît dans ce texte est bien un nouvel imaginaire acoustique scénique, prêtant voix aux bruits, à la musique et au silence, proche de celui qu’on trouve à la même époque chez l’auteur dramatique Maurice Maeterlinck. Melissa Van Drie a étudié, dans sa thèse, le nombre et la précision des bruits (cris d’oiseaux, cri du vent, bruissements des arbres) dans Les aveugles, en 1890, ou dans L’intruse, en 1891; elle note l’amplification des perceptions, l’élaboration d’un silence si grand qu’il permet d’entendre le moindre froissement. Elle établit un lien entre cette audition inédite, étrangéisée, du monde, les conceptions scientifiques du son et l’invention d’appareils (le théâtrophone, le téléphone, le phonographe) permettant d’entendre ce dont le spectateur ne perçoit, ni ne connaît la source (Van Drie, 2010a)[31]. Notons que Nancy Tobin, préparant la création de Denis Marleau, dit avoir « beaucoup écouté les sons mentionnés par Maeterlinck » : « J’ai écouté beaucoup de sons de mer, de sons de vent, pour m’apercevoir… que tous ces sons pouvaient se confondre dans le registre des hautes fréquences surtout » (Tobin, 2011 : 64). Quant à la voix humaine, la voix parlée, parfois méthodiquement, curieusement isolée, elle se détache, d’autres fois, sur une rumeur qui la trouble. Certains événements phoniques peuvent s’avérer ambigus, comme dans la célèbre séquence du quatrième acte de La cerisaie (1904), où un bruit étrange retentit au loin, dont les personnages ne savent pas s’il s’agit du claquement d’une corde rompue, du cri d’un animal ou – ils ne le disent pas, mais le public peut y penser – d’un appel au secours humain.

Considérons maintenant ce qui se passe à la même période dans le champ de l’acoustique générale. De la fin du XIXe siècle à aujourd’hui, cette discipline, sous ses différentes formes (acoustique physique, vocale, auditive, et surtout architecturale), a entretenu des liens étroits avec le théâtre. Pour l’évoquer, nous nous appuierons sur l’étude de Claire Pillot-Loiseau, consacrée à la « [p]lace de l’acoustique dans la revue La voix parlée et chantée » (Pillot-Loiseau, 2011 : 33). Ce périodique, qui a paru de 1890 à 1903, avait pour objectif de faire dialoguer la science et l’art. Selon le calcul effectué par l’auteure, un peu plus du quart de ses numéros a été consacré à l’acoustique, toutes catégories confondues, ce qui correspond à 98 articles. Nous avons là une indication indirecte de la large diffusion de la discipline et de l’intérêt que pouvaient lui accorder les milieux cultivés et artistiques. De ce riche ensemble, retenons que l’acoustique mécanique intègre la voix humaine dans l’étude des principaux corps sonores, résonateurs, sons et bruits. Auguste Guillemin, agrégé de sciences physiques, qui rédige la quasi-totalité des articles proposés en ce domaine, considère la voix « comme un instrument à vent et non un instrument à cordes » (Pillot-Loiseau, 2011 : 36). Retenons de l’acoustique vocale cette simple proposition, dont on peut imaginer les effets sur l’oralité théâtrale : « La parole[,] étant un son, doit être également soumise aux lois des sons » (Pillot-Loiseau, 2011 : 33). Comme les autres sons, et même davantage, la parole est visualisée, matérialisée. Parmi les techniques suggérées, on retrouve la chronophotographie des lèvres prononçant clairement une phrase.

Dans le champ de l’acoustique des salles, peu présent dans La voix parlée et chantée, le nom le plus important est celui de l’Américain Wallace Clement Sabine (1868-1919), assez vite lu en France (un des articles le mentionne). Les travaux récents de Viktoria Tkaczyk (2014)[32] soulignent que Sabine a confirmé expérimentalement, au début du XXe siècle, une proposition datant de la fin du XVIIIe siècle selon laquelle ce n’est pas seulement de la structure primaire d’une salle (sa taille et sa forme), mais aussi de la structure secondaire (les matériaux utilisés pour construire et recouvrir les surfaces), que dépend l’acoustique de cette salle. Travaillant dans cette perspective, Sabine a calculé l’importance objective de l’auditeur et montré qu’il constitue lui-même un élément absorbant. Dans cette représentation radicalement nouvelle du lieu théâtral, les acteurs du phénomène sont pris en compte dans la transmission du son, et pas seulement l’architecture du bâtiment.

Intéressons-nous pour finir à la création théâtrale. Contrairement à ce que suggère Rilke, le rêve d’un « arrière-fond » vocalisé d’où surgiraient des voix humaines s’est concrètement réalisé dans quelques mises en scène dès le début du XXe siècle. Plutôt que les expériences légendaires et volontaristes des symbolistes, c’est un spectacle d’André Antoine que nous choisirons comme exemple. Dans LeRoi Lear monté en 1904, toutes les voix sont travaillées en un « mouvement rythmique puissant, ininterrompu » (Massiac, 1904 : 568), et le fameux orage est tellement bruyant qu’il couvre par moments le texte. Pour résumer, la modernité acoustique se caractérise, en amont des créations scéniques, par les traits suivants :

  • l’écoute est construite comme une pratique spécifique, technique, objet d’une nouvelle culture;

  • la voix parlée, qui devient un élément majeur des expérimentations acoustiques (pour Sabine, l’amphithéâtre universitaire est un modèle plus proche de la salle de théâtre que la salle de concert), est dans le même temps rapprochée du bruit;

  • les auditeurs (résonants ou absorbants) interviennent directement dans l’événement aural qui se déroule dans la salle où celui-ci a lieu.

Un espace phonique, dans les deux sens du terme[33]

Notre hypothèse est que ces traits, qui ont en grande partie défini l’espace-temps et l’univers sonore de la scène moderne, constituent désormais – pour combien de temps encore? – des composantes stables de l’art du théâtre occidental. Si, depuis le début du XXe siècle, chaque grande période technologique a fait se réinventer les pratiques et les dramaturgies touchant à la voix, aux sons et aux modes d’écoute, le modèle reste fondamentalement le même. Les transferts techniques et esthétiques qui ont eu lieu entre le cinéma des premiers temps et le théâtre dans le domaine du son ont été précisément décrits[34]. Si la salle de cinéma telle qu’elle s’est ensuite organisée a constitué assez rapidement un anti-modèle pour les architectes de théâtre (« il ne peut être question de remplacer la sonorité propre d’une salle par la distribution, dans l’oreille de chaque spectateur, des sons pris en un point seulement de cette salle » [Sonrel, 1945 : 38]), le film, lui, s’avère inspirant, lorsqu’il s’agit de pousser le deuxième trait de l’approche acoustique moderne, c’est-à-dire l’appréhension des divers sons comme sons, jusqu’à la réalisation d’une « trame sonore » : usage du magnétophone, création de « bandes-son », installation dans les théâtres d’équipement en conséquence, puis sonorisation des salles, jusqu’aux acoustiques modulables selon les usages et les spectacles, et la réalisation d’univers sonores totalement artificiels. La radio, qui naît comme média dans les années 1920, a marqué elle aussi les pratiques théâtrales. L’ethnologue suisse-allemand Oskar Eberle, pour qui le Hörspiel (jeu pour l’oreille) est un Urtheater (théâtre originel) plus important encore que le Schauspiel (jeu pour le regard), explique dans les années 1950 que la radio a réinventé le Hörspiel et prévoit que cette forme revivra, en dehors du média radiophonique (Eberle, 1954). La suite lui a donné raison, et la voix parlée occupe dans ce processus une place essentielle – voir, par exemple, les oeuvres de Heiner Goebbels. Cependant, d’une génération technologique à une autre, le théâtre semble maintenir et retravailler d’une façon qui n’appartient qu’à lui la double porosité de l’acoustique moderne : celle qui concerne les différents sons du spectacle, d’une part (voix, bruits, musiques et silences de la scène), et celle qui fait du lieu théâtral un lieu d’écoute unique (ces voix, bruits, musiques et silences se mêlent avec tous ceux que produit l’assistance). Il croise ces deux phénomènes, il les fait jouer ensemble dramaturgiquement[35].

Notre premier exemple d’un tel croisement appartient aux années 1970. La façon dont Patrice Chéreau a mis en scène la pièce en un acte de Marivaux, La dispute, en 1973, à Paris, au Théâtre de la Musique (aujourd’hui La Gaîté lyrique), nous est apparue caractéristique d’une période fascinée par l’image, hantée par le non-verbal et pourtant, ou de ce fait même, inventive sur le plan oral et aural. C’est ce que révèle l’audition des archives sonores de ce spectacle, devenu, avec le temps, une oeuvre de référence à l’intérieur d’une mémoire principalement visuelle et corporelle de la modernité scénique.

La dispute [la discussion], une des dernières pièces écrites par Marivaux, renvoie aux histoires d’enfants sauvages et aux recherches de ses contemporains sur la nature et l’éducation. Dans le programme, Patrice Chéreau en proposait un bref résumé :

En plein coeur du XVIIIe siècle, un couple de souverains éclairés, princes d’un État idéal, tente, pour clore une dispute anodine, de remonter aux sources du comportement amoureux. Ils se donnent alors le spectacle d’une expérience menée avec quatre sujets des deux sexes, séquestrés à cette seule fin depuis leur plus jeune âge et élevés dans l’isolement le plus complet par des serviteurs noirs

Chéreau, 1973 : n.p.

À sa création, le spectacle suscite deux grandes réactions : de nombreux critiques l’inscrivent dans le courant du « théâtre d’images » et y retrouvent même des traces du Regard du sourd de Bob Wilson, présenté trois ans auparavant dans la même salle du Théâtre de la Musique. On répète la boutade de Roger Blin à propos de la production précédente de Chéreau (Massacre à Paris, 1972) : « Le regard du sourd n’est pas tombé dans l’oreille d’un aveugle ». D’autre part, plusieurs spécialistes de théâtre, dont Bernard Dort, qui parlera assez vite du « piège des images », reprochent au metteur en scène d’avoir « désarticulé le langage[36] ». Le langage, explique Dort, était absent de ce spectacle. Entre la référence à la vision et la référence au texte, le sonore avait disparu. Ou presque.

« Le son », comme on commençait à le dire, était d’André Serré, qui travaillait depuis quelques années avec Patrice Chéreau mais amorçait avec lui, à l’occasion de ce spectacle, une collaboration inventive. Les chercheurs du Laboratoire des arts et des spectacles du CNRS s’intéresseront au « décor sonore » de La dispute dont les différents éléments, expliquait Odette Aslan, étaient mélangés chaque soir en direct et diffusés par une dizaine de haut-parleurs (Aslan, 1986 : 66). Cependant, « le son » était identifié à ce qu’on a appelé la « bande-son », la musique, même enregistrée, étant traitée à part. Ce n’est que récemment que l’écoute a changé. Le fonds Roger Planchon de la Bibliothèque nationale de France, conservé au Département des arts du spectacle, comporte de précieuses archives de La dispute : l’ensemble des matériaux sonores enregistrés (bruits et voix) ou réenregistrés (oeuvres musicales, intégrales et fragments) par André Serré, la « bande-son » du spectacle (le montage de ces éléments dans l’ordre de leur diffusion) et les captations audio de deux représentations en public. On peut étudier, grâce à ces dernières, le tressage savant des différentes catégories de sons, fixés ou produits en direct : souffles de vent, musique, voix parlées, cris humains et cris d’animaux, beaucoup de chants d’oiseaux, des paroles bruitées par le jazz (les deux serviteurs sont des chanteurs noirs américains). Écouter l’archive fait comprendre que, pour Chéreau, les bruits ne devaient pas composer un équivalent ou un complément auditif du « décor » à l’ancienne. Ils devaient s’insérer dans une construction sonore et visuelle – le premier terme ayant autant d’importance, sinon plus, que le deuxième – assez proche du « paysage commun » dont parle Rilke, ici très violemment dramatisé : sur le plateau, la forêt sombre, avec les « silences habités » que Serré dit avoir inventés pour cette création. La musique, elle, émane de la salle du théâtre; elle sort du gouffre vide qui bée entre le public et la scène. « La fosse d’orchestre, écrit Patrice Chéreau dans le programme, cette crevasse grinçante des instruments qui s’accordent, qui profère des oracles et d’où sortiront des sons, des concerts et des vapeurs sulfureuses » (1973 : n.p.). À la fin du long prologue – un « centon » composé par François Regnault à partir d’autres oeuvres de Marivaux –, au moment où le Prince (Roland Bertin), Hermiane (Norma Bengell en 1973) et ses servantes franchissent la fosse, progressant sur une planche étroite pour rejoindre le plateau, la musique assourdit l’acteur et les actrices, les assaille comme une tempête, les fragilise. Les mots ne sont parfois plus distinctement perceptibles, l’Ode funèbre maçonnique de Mozart les couvre[37]. Durant toute l’action qui suit, organisée en sept nuitées – et « sept fois le coq va chanter » (Chéreau, 1973 : n.p.) –, les coassements de grenouilles, les croassements de corbeaux, les grésillements de grillons, les hurlements de loups interviendront en arrière-fond selon une partition réglée sur des critères dramaturgiques. Quant aux paroles des enfants, elles témoignent de leur difficulté à se réapproprier une langue acquise hors d’un contexte humanisant[38]. Le spectacle ramassait ainsi, dans sa forme visible et audible, la vive dispute, contemporaine de la gestation du spectacle, sur la validité du langage, ses limites, et l’attraction du non-verbal.

Le deuxième exemple, qui représentera la décennie suivante, est la Bérénice de Racine montée par Klaus Michael Grüber en 1985 dans la salle Richelieu de la Comédie-Française. On peut percevoir en écoutant les enregistrements disponibles et en lisant les textes rédigés par ceux qui en ont été les spectateurs à quel point cette création, qui a souvent été interprétée comme un retour mélancolique et inspiré à l’ancien « théâtre d’écoute », celui qui aurait précédé l’ère de la mise en scène, se fonde au contraire sur une représentation moderne de l’acoustique et tient sa force saisissante de la double porosité évoquée plus haut. Si, en effet, la salle Richelieu date de la fin du XIXe siècle, la conception dramatique du milieu résonnant mise en oeuvre par Grüber relève de la modernité. Celle de Rilke et celle de Sabine. Comme dans les Notes sur la mélodie des choses, la voix, qui n’est exactement ni « parlée » ni « chantée » – c’est toute la question de l’alexandrin –, se détache à peine du silence qui semble de la même matière. Grüber veut « quelque chose de chuchotant » (Grüber, 1993 : 15). Une phrase surtout, dans les notes de répétitions, vient éclairer sa dramaturgie phonique : « Le vers, extrême élégance pour éviter le silence » (Grüber, 1993 : 15). Mais au théâtre, le silence ne peut réellement exister que si les spectateurs se tiennent silencieux. La porosité acoustique devient, dans Bérénice, un matériau crucial du jeu. Le metteur en scène Stéphane Braunschweig, qui a assisté au spectacle, parle des « gens qui toussaient, sans discontinuer », de la « bande-son » des toux; il y avait, dit-il, « une tragédie de l’écoute » : « Ce qui était formidable, mais aussi douloureux, c’était cette absence de coupure avec le plateau. On se sentait de la même chair que les acteurs […], mais aussi de la même chair que ceux qui toussaient sans pudeur » (Braunschweig, 1993 : 175-176). Un autre metteur en scène, Jean-Pierre Vincent, remarque à la même période que, après avoir abandonné les théâtres pour des lieux réels, « on s’aperçoit que le théâtre est aussi un lieu réel » (Vincent, 1989 : 22).

Le dernier exemple, qui illustrera l’ère numérique, est le son de Paradiso, troisième composante de la trilogie inspirée de Dante (avec Inferno et Purgatorio) créée par Romeo Castellucci en 2008 à Avignon. Ce son, dû à Scott Gibbons, compositeur de musique électro-acoustique et collaborateur de longue date de Castellucci, met en oeuvre la première porosité de façon inédite et participe à un dispositif perceptif qui joue d’une façon paradoxale, à contre-courant, avec la seconde[39]. Durant moins de cinq minutes, ce qui n’était ni un spectacle, ni une installation, mais une « image », selon son créateur, proposait à un public restreint de cinq ou six spectateurs une expérience simple que beaucoup disent inoubliable. On entrait dans une quasi-obscurité et l’on devait se pencher, s’accroupir ou s’agenouiller – il y avait quelque chose d’enfantin dans ce geste – pour voir ensemble, par un grand oculus, l’intérieur de l’église des Célestins, église désaffectée, vide de part en part, et dont le sol était recouvert d’une pellicule d’eau miroitante. En haut de la nef, au loin, était situé un piano à queue vieilli ou brûlé, d’où suintait une sorte de pluie. On le distinguait mal, on regardait l’ensemble de l’espace, les miroitements de la lumière, l’absence de toute trace de vie. Un son continu venait d’on ne sait où. De temps en temps, le drap lourd d’un grand drapeau noir surgissait en claquant violemment devant l’oculus, comme un battement d’aile, empêchait de voir, disparaissait. Il ne se passait rien de plus :

J’étais inspiré par l’idée que ce royaume devrait être empli du bruit des ailes et du langage incompréhensible des anges. Cela me faisait penser à l’invasion des sauterelles dans la Bible. […] Dante peut passer à travers l’Enfer et le Purgatoire sous sa forme humaine, mais au Paradis il a besoin de protection. Et même alors, ses sens humains peuvent à peine percevoir; son esprit ne peut pas complètement comprendre; et ses mots ne peuvent pas exprimer de façon satisfaisante ce qu’il en est. […] Pendant que je travaillais sur La divine comédie, il y a eu [à Chicago] l’invasion de milliards de cigales. Dans mon quartier, c’était d’une intensité incroyable. Impossible d’avoir une conversation avec ce vacarme, et on ne pouvait éviter de marcher sur ces énormes insectes. Cela m’a rappelé cette idée du Paradis. J’ai donc fait beaucoup d’enregistrements et ensuite[,] j’ai sculpté les sons pour en faire la musique de Paradiso

Gibbons, cité dans Silber, 2008

Scott Gibbons évoque d’autres sources comme le schofar (un instrument de musique à vent utilisé dans le rituel juif depuis l’Antiquité), l’instrument de l’Apocalypse, la friture radio « qui, de façon inexplicable, ressemble à des voix humaines » et des décharges électriques. 

Ici, plus de récit, plus d’action, comme dans les autres épisodes. Plus de paroles ni de dialogues. Plus de musique humaine. Cependant, la musicalisation des bruits a pour effet de créer un silence où l’on croit entendre des voix. Paradiso peut ainsi être décrit comme un travail sur ce que Peter Sloterdijk appelle « les enveloppes sonosphériques », les « sphères » que les hommes ont besoin d’élaborer pour vivre (Sloterdijk, 2002 [1998] : 31). Rien d’immersif, pourtant, dans la proposition, dans « l’image » construite par Castellucci : le spectateur n’entre pas dans la sphère acoustique. « Le dispositif, écrit Éric Vautrin, insiste sur sa position de témoin » (Vautrin, 2009).

Nous pouvons parler, à propos de ces trois productions des années 1970, 1980 et 2000, d’une exploration, à chaque fois différente, de l’espace théâtral comme espace acoustique unique, et d’un mélange, à chaque fois renouvelé, de la voix humaine avec le bruit, avec le silence, avec la musique. Cependant – nous souhaitons insister sur ce point –, il ne s’agit dans aucun des cas d’une disparition de la vocalité verbale. L’expérience du spectateur, à chaque génération, est celle de réentendre, au contraire, des mots, d’en être touché, captivé. Dans La dispute, selon Chéreau, le texte, la plupart du temps distinctement audible (contrairement à la légende), s’insère dans les autres sons et ne coule pas selon les codes marivaudiens convenus. Heurté ou artificiel dans la bouche des adolescents, bruité et rythmé par les chanteurs noirs, il n’en est que plus écouté, du fond de la difficulté alors ressentie à le faire. Dans la Bérénice montée par Grüber, le spectateur-auditeur, partenaire, proche, malgré lui, du dialogue entre les figures, est astreint à vivre une expérience exceptionnelle en suivant, un mot après l’autre, une oeuvre dramatique que sa célébrité pouvait avoir édulcorée. Dans Paradiso, c’est l’absence de paroles, ou leur caractère incompréhensible, qui ajoute au sentiment vif d’apercevoir un monde inouï – et crée le besoin, le désir, de lire le poème de Dante.

Les résultats des recherches intermédiales et interdisciplinaires effectuées depuis 2008 sur l’histoire de la dimension sonore du spectacle, de l’acoustique des lieux, de la sonorisation, de la création sonore proprement dite ainsi que sur les archives audio rendent encore plus incompréhensible la surdité des études théâtrales à l’auralité du théâtre – surdité, il faut le rappeler, que nous avons tous partagée. Mais en même temps, ces résultats l’éclairent. Ils suggèrent que les phénomènes invoqués (l’ocularocentrisme généralisé, la représentation plutôt visuelle, puis plutôt corporelle, de la mise en scène) ne suffisent pas à expliquer ce phénomène collectif. Ce que nous entrevoyons désormais au coeur de l’oubli spécifique du sonore théâtral moderne par la théorie, telle qu’elle s’est organisée dans les années 1970, c’est un intense rejet du « texte », du « dire », de la « voix parlée » et, à travers elle, du verbal lui-même, comme si celui-ci était définitivement dépassé, comme si le corps non linguistique pouvait totalement se substituer au langage et s’avérer l’acteur structurel du théâtre. Ce courant séducteur, inspiré, dont on peut comprendre la force, oublie que les grands créateurs visuels et les grands performeurs se sont précisément affrontés et s’affrontent encore aujourd’hui à la question vitale (comique et tragique) du langage, que leurs productions témoignent de son importance. Ils oublient que, souvent, des textes les nourrissent et que seuls ou presque les mots peuvent les décrire[40]. S’étant fermement bouché les oreilles devant les sirènes parlantes, le chercheur a perdu le lien avec tout l’univers sonore et toute chance de rendre compte de ce qui, du son, agit dans l’image, dans le regard, dans l’événement.

Comment échapper à un modèle, à un jeu de concepts et à une méthodologie qui ont tant marqué les représentations mentales du théâtre? Notre imaginaire théorique est si atrophié concernant le monde aural, notre prétention à le connaître si forte, malgré les avertissements conjugués des preneurs de son et des historiens[41], que seules des recherches précises sur les traces enregistrées des créations, sur l’histoire acoustique des salles et sur les univers auditifs contextuels, peuvent nous permettre de reconstituer, dans son évolution encore largement inconnue, l’oscillation permanente de l’écoute au théâtre entre l’« imaginement[42] » et l’« entendement[43] » – pour utiliser des termes susceptibles d’échapper au modèle trop simple de l’audio-vision.

Le recentrement affirmé de nos recherches sur la vocalité, et en particulier sur la vocalité verbale (le parler, le chanter, le rapport théâtral et scénique à la langue), qui caractérise le programme ECHO[44], ne signifie pas un abandon du bruit, du son, de la musique, un rétrécissement de l’auralité, mais le désir de s’approcher de ce qui semble toujours constituer l’aimant inouï du théâtre, dans son volet occidental auquel nous nous sommes limités : entendre, malgré tout, quelque chose se dire. Ou rien, mais dans un lieu implicitement textualisé.