Corps de l’article

Avant d’être un acte de connaissance, l’écoute est une attention en mouvement, une poursuite d’événements sonores qui surgissent, coulent, se mêlent, évoluent, s’évanouissent. Une séquence sonore ne s’apprécie que dans son flux et, même fixée par l’enregistrement, ne s’étudie qu’en passant et repassant encore. Par ailleurs, les techniques de reproduction ont permis de déplacer le son et, sous la forme de disque ou de fichier numérique, le mélomane peut l’écouter où et quand il le veut. Aujourd’hui, enfin muni d’appareils portables, l’auditeur emporte non seulement le son, mais il l’écoute en chemin pour l’associer, au rythme de la marche, à des paysages et des situations pluriels. Processuelle et nomade, l’écoute est une forme éminente de la mobilité.

L’histoire des prothèses sensorielles que sont le casque audio ou les écouteurs intra-auriculaires[1], qui désormais nous accompagnent partout, pourrait constituer le soubassement archéologique d’une pratique culturelle qui va bien au-delà de l’intérêt cognitif et du seul plaisir pris à écouter. L’écoute au casque induit des habitus comportementaux, professionnels ou sociaux, mais, inscrite dans un corps en mouvement, elle invite aussi à constamment remettre en cause ces habitus pour les adapter à des contextes divers. Selon la manière dont on paramètre son iPhone ou dont on règle ses écouteurs, le donné sonore change, modulant le rapport à l’espace suggéré de façon auditive comme à l’espace dans lequel on se déplace. Cette forme d’écoute peut être envisagée comme le paradigme d’une dynamique relationnelle dans l’exercice de laquelle l’auditeur et son appareil, mais aussi l’auditeur et son environnement – sonore, spatial, temporel et humain – se modèlent mutuellement.

En récusant tout déterminisme, qu’il soit technologique, physiologique ou socioculturel, on essaiera de cerner le geste d’écoute de l’auditeur-baladeur[2], conçu comme ce mouvement créateur qui vient déplacer les conditionnements pour réinventer un rapport au monde que l’on pourrait nommer résonance. La résonance naît lorsqu’une vibration se communique d’un corps à l’autre et transforme l’un par l’autre. Le concept ne relève pas du seul domaine de l’acoustique, mais permet aussi de décrire une relation particulière au monde. « La résonance, écrit Jean-Luc Nancy, est à la fois celle d’un corps sonore pour lui-même et celle de la sonorité dans un corps écoutant qui, lui-même, sonne en écoutant. […] Ce corps sonore, sonorisé, se met à l’écoute simultanée d’un “soi” et d’un “monde” qui sont l’un à l’autre en résonance » (2002). Le son, parce qu’il résonne, mobilise l’attention, requiert les sens, infuse le corps tout entier et se trouve déplacé en retour par l’écoute mouvante qui le retient en l’effaçant. Dans le rythme de la marche qui apparie, d’instant en instant, la personne de l’auditeur au milieu changeant qu’elle traverse, cette résonance gagne l’environnement tout entier, estompant les limites entre l’intériorité et l’extériorité et créant les conditions d’une ouverture de l’être et du monde, ensemble, adonnés à l’écoute. Mais comment celui qui écoute des sons audibles pour lui seul, dans l’espace privé circonscrit par le casque, peut-il entrer en résonance avec le monde qui l’entoure ? Il semblerait plutôt que l’écoute ainsi appareillée manifeste un désir de retrait, d’isolement, et soit l’équivalent d’une « addiction » (Rouzé 2010, 34), voire d’une « pathologie narcissique » (Bull 2000, 128), témoignant d’une pratique solipsiste. Toutefois, les enquêtes menées par les chercheurs du CRESSON[3], dans une perspective « écologique » héritée de Merleau-Ponty et de Gibson, replacent au centre de l’attention le devenir commun du sujet percevant et de son environnement, et révèlent que l’auditeur-baladeur développe une acuité sensorielle inédite et évolue avec les milieux qu’il traverse (Thibaud 1992 ; Pecqueux 2008, 2012). C’est alors qu’apparaît la dimension à la fois esthétique, éthique et politique d’un geste d’écoute situé et impliqué, susceptible de façonner un sensible dont participent à la fois le sentant et le senti.

Pour étayer l’analyse d’un tel geste, le cinéma s’offre en exemple parce qu’il suppose, comme conditions mêmes de son fonctionnement technique, un déroulé audiovisuel au cours de la projection et la disjonction a priori de sons et d’images enregistrés séparément avant d’être réarticulés[4]. Le spectateur fait une expérience d’écoute comparable à celle que produit le « montage » de sons entendus au casque sur les scènes qui se succèdent au fur et à mesure d’un déplacement. L’écoute filmique met en jeu les relations singulières et changeantes qui forment le « milieu » auquel participent, ensemble, le spectateur et le film. Emprunté à Simondon, relu par Deleuze et Guattari, le terme désigne ici le réseau de vibrations communes, soit la résonance qui anime à la fois le sujet écoutant et l’objet écouté[5]. Il est aujourd’hui au centre des études d’écologie sonore[6].

Pour illustrer le passage du solipsisme à la résonance, nous nous appuierons sur le film de Gus Van Sant, Paranoid Park (2007), dont la bande-son inclut des extraits de balades sonores (« soundwalks [7]») qui recréent les conditions d’une écoute construite dans le mouvement de la marche (Walk Through a Resonant Landscape No. 2, Francis White, 1992). Le protagoniste du film, Alex Tremain, est un jeune skateur qui évolue tout enveloppé de nappes sonores, comme s’il portait en permanence un casque audio diffusant un mélange hétérogène et discontinu de bruits, de fragments musicaux et de bribes de paroles savamment mixés. En écoutant avec lui, on essaiera de déceler les conditions dans lesquelles le voyage immobile du spectateur peut, en écho à celui d’un personnage, s’ouvrir à la résonance.

De l’écoute relayée à l’écoute mobile

Si l’on en croit Jonathan Sterne (2015 ; 2018), il y aurait, dans l’histoire de l’écoute au casque, trois moments où l’on retrouve certains traits dans l’emploi contemporain de cette prothèse auditive. Le premier moment est celui de l’auscultation médicale : il est caractérisé par une concentration et une amplification de l’écoute. Le second moment est celui du développement parallèle de la transmission de sons par le télégraphe, la radio ou le téléphone, et de la reproduction de sons enregistrés pour être ultérieurement diffusés par le phonographe et le lecteur CD : il signe une perception relayée et différée. Le troisième est celui de l’écoute avec baladeur – Walkman, MP3 ou iPhone –, doublement mobilisée par la marche et par le phénomène sonore qui l’emporte dans son incidence.

Le tube monaural puis le casque binaural – à partir du milieu du xixe siècle –, ajustés au stéthoscope inventé par Laennec en 1816, permettent le développement d’une expertise médicale fondée sur l’isolation, la discrimination et l’analyse des sons émanant de l’intérieur du corps. Leur emploi, quoique spécialisé, présente quelques analogies avec la technique et la pratique auditives qu’occasionnent aujourd’hui les appareils d’écoute portables. L’écoute est médiatisée, séparée des autres sens et intensifiée. Elle concurrence la vue et contribue activement au diagnostic permettant de discerner des symptômes jusque-là imperceptibles. Elle exige, pour ce faire, une virtuosité technique : le médecin doit apprendre non seulement à aiguiser son sens de l’ouïe, mais aussi à nommer et à différencier entre eux des signes acoustiques inédits, indices de pathologies variées, comme plus tard le télégraphiste apprendra à distinguer les impulsions sonores chiffrées en morse pour les traduire en mots. L’auditeur-baladeur contemporain développe lui aussi une attention accrue aux détails perçus à travers les écouteurs, et isolés du monde extérieur, il s’exerce à les identifier et à les organiser, et voit ses gestes se plier au rythme de musiques entendues à l’intérieur même de son crâne. Un autre des effets de l’auscultation médiatisée est de faire du corps inerte de la science anatomique un champ dynamique qui vit et se meut de l’intérieur. Chaque son, dans sa texture, son attaque, son évolution, traduit un devenir organique et s’inscrit dans un réseau d’influences réciproques. Le stéthoscope différentiel, qui provoque un léger effet stéréo et permet d’écouter simultanément deux zones distinctes du corps puis d’en comparer les sons, accroît le phénomène. L’écoute aiguisée et savante décompose le son et le corps en éléments expressifs pour les reconfigurer dans un espace relationnel mouvant, comme le fait l’auditeur-baladeur à l’affût de rencontres éphémères entre les sensations visuelles et sonores. Par ailleurs, la technique d’auscultation médiatisée est révélatrice d’une pratique sociale fondée sur une recherche de distinction. Elle dénote une faculté auditive supérieure, analogue à celle d’un mélomane capable de différencier deux versions discographiques d’un même morceau en comparant les détails de leur rendu acoustique. En outre, le médecin qui devait poser son oreille directement sur la poitrine du malade peut désormais s’en tenir écarté. Il limite ainsi les risques de contagion, mais aussi les attouchements malséants et plus, généralement, le contact avec un patient dont son éducation, ses compétences et ses aspirations à la respectabilité le distinguent. L’intervalle physique maintenu durant l’examen devient une marque de différence sociale. La prise de distance, qui double l’isolement sensoriel, est aussi l’une des conséquences négatives que l’on attribue généralement à l’écoute au casque : dans la rue, dans les transports en commun, l’auditeur cherche à se couper d’un environnement vécu comme désagréable en s’enfermant dans une bulle sonore privée. L’écoute médicale d’autrefois comme l’écoute musicale d’aujourd’hui, lorsqu’elles font appel au casque, s’accompagnent d’une « pratique de la médiation sociale » (Sterne 2015, 166) qui contribue à redéfinir les rapports entre l’auditeur et son entourage.

Le deuxième moment de la « brève histoire du casque audio » est celui de l’écoute relayée et différée. L’opérateur du télégraphe sonore, chargé de transcrire des signaux envoyés à distance, est rapidement affublé d’un casque qui facilite sa concentration en l’isolant d’un environnement souvent bruyant. L’expérience d’écoute individualisée devient un échange intime lorsque le casque est associé au téléphone, puis un divertissement personnalisé quand il s’adapte au phonographe. L’espace acoustique privé, source de plaisirs solitaires, est bientôt considéré comme un « bien culturel » : il peut être possédé, et son contenu, acheté et vendu. « La construction privative de l’espace acoustique est une condition préalable à la marchandisation du son » (Sterne 2015, 226). Désormais associé à un loisir de plus en plus populaire, et non plus seulement à l’exercice d’une profession, le casque audio empêche le phonographe et le téléphone de devenir les « machines sérieuses » vouées à l’éducation, à l’archivage ou aux relations commerciales que l’industrie et les institutions avaient imaginées, et c’est avant tout dans un contexte domestique que se développe leur usage[8]. Cependant, le port du casque et le repli sur soi qu’il implique facilitent l’adoption d’une discipline qui s’instaure, à la même époque, dans d’autres domaines de la vie sociale, coïncidant avec l’essor de la bourgeoisie ; elle conduit, par exemple le spectateur du music-hall ou du cinéma à faire silence pour ne pas empiéter sur le champ auditif de son voisin, rendant ainsi possible une expérience d’écoute à la fois solitaire et partagée. Si Sterne, comme avant lui Adorno et Horkheimer (1947), s’attarde à décrire le compartimentage et le consumérisme que la diffusion élargie des sons promeut, on peut aussi constater que les sons acousmatiques et intériorisés, tenus à l’écart de leur source comme de l’environnement immédiat, sont disponibles pour les nouvelles relations, médiates, qu’il plaira à chacun de leurs auditeurs de tisser. Un « tube » peut ainsi devenir le leitmotiv d’un événement intime et colorer d’une tonalité affective singulière les contextes dans lesquels on le donnera à entendre. Ce phénomène peut être compris à la fois comme une façon commode et « kitsch » de s’approprier à peu de frais un bien culturel, mais il peut être aussi au fondement d’un geste individuel de recréation dont témoignent nombre d’usages contemporains, allant du remix aux propositions plus sophistiquées de certains artistes sonores. La possibilité d’inscrire les sons dans un contexte d’occurrence strictement privé se conjugue à celles d’en différer et d’en relayer la diffusion pour produire un effet redoublé de ce que nous nommerons, après Murray Schafer, schizophonie.

La schizophonie est la séparation d’un son original de sa transmission ou de sa reproduction électro-acoustique […] J’ai voulu suggérer, en forgeant ce terme, le caractère pathologique du phénomène. Voisin de schizophrénie, il est chargé du même sens d’aberration et de coupure de la réalité. Le massacre opéré par les gadgets hi-fi […] crée un paysage sonore synthétique dans lequel les sons naturels sont de plus en plus remplacés par des sons artificiels, et où les signaux qui ponctuent la vie moderne ne sont plus que des substituts fabriqués par les machines.

Murray Schafer 1979, 133

La schizophonie s’accroît lorsque « la portabilité du son devient totale : à un environnement sonore peut alors être substitué n’importe quel autre environnement sonore[9] » (Murray Schafer 1979, 135). L’auteur forge le terme pour dénoncer les effets délétères de la transmission et de la reproduction sonores, sans qu’il soit question encore d’une privatisation de l’écoute à travers le casque. Toutefois, en ouvrant un espace intérieur d’écoute, le port du casque accentue encore l’écart entre les sons qui émanent de l’environnement immédiat et les sons relayés, et si l’appareil est hermétique, les seconds remplacent les premiers, créant une désorientation spatiale et temporelle qui ébranle le sentiment d’appartenance. Le dernier moment de notre rapide survol de l’histoire de l’écoute au casque, celui d’une écoute individualisée et mobile, porterait donc à son comble l’effet de schizophonie. Les présupposés « écologiques » d’un tel réquisitoire sont évidemment contestables : aucun son entendu n’est « naturel », mais toujours d’avance reconfiguré par la perception, sélectionné et filtré en fonction de notre aptitude – physiologique, cognitive et culturelle – à l’« entendre ». On peut également récuser le caractère aliénant des médiations technologiques qui, si l’on en croit Murray Schafer, nous rendraient, à terme, inaptes à distinguer un paysage sonore réel d’un paysage artificiellement composé.

L’usage d’un téléphone ou d’un iPod muni d’écouteurs permet non seulement de transporter un enregistrement sonore d’un lieu à un autre, mais aussi de l’écouter en marchant. La mobilité du corps régit celle de la perception, et les perspectives visuelles et sonores se déploient et se réorganisent dans la mise en branle simultanée de tous les paramètres qui régulent ensemble, mais séparément, le déplacement et l’écoute. Les positions et mouvements successifs du marcheur, son allure, la façon dont il règle son baladeur, les accidents rencontrés sur son parcours, les parasites qui brouillent par moments le signal acoustique interfèrent et modifient à la fois le fonctionnement de la machine, la qualité de l’attention et l’appréhension de l’espace traversé comme de l’espace suggéré. Les balades sonores d’Hildegard Westerkamp[10] en témoignent : celles-ci reposent, comme l’explique la compositrice, sur la mise en oeuvre réglée d’une opération de schizophonie. Lors de la phase initiale d’enregistrement sur le terrain, Westerkamp déambule avec micro et casque dans un lieu choisi, glane et fixe des sons concrets pour les refaçonner ensuite en studio. Son intention est de traduire l’expérience subjective d’écoute faite au moment de la balade pour la faire ensuite entrer, à l’occasion des présentations publiques, en « résonance[11] » avec celle des auditeurs. Par exemple, dans la composition intitulée Kits Beach Soundwalk (1989), elle propose successivement plusieurs versions sonores d’une promenade en bord de mer. En focalisant notre attention sur les menues variations des bruits qu’elle perçoit et émet au gré de son avancée, elle nous rend d’abord sensibles à l’entretien mouvant qui se noue, dans l’écoute, entre le corps, l’appareil et le monde. Puis, mimant les déplacements de l’attention, le mixage accentue le relief de tel ou tel détail, faisant passer au premier plan tantôt le bruit des vagues, tantôt celui du trafic automobile. Soudain, l’oreille s’arrête sur les bernicles tintinnabulant à marée basse et Westerkamp nous dit, en voix hors champ, que ce bruit ténu lui rappelle une oeuvre de Xenakis[12], elle-même née de la transformation électroacoustique des craquements de morceaux de charbon incandescent. La musique de Xenakis se substitue alors, dans la composition, aux bruits amplifiés des bernicles. L’écoute s’est enrichie des évocations mémorielles de l’artiste et s’ouvre aux associations plurielles dont chacun pourra ultérieurement l’enrichir.

L’auditeur mobile, sous le casque, oscille entre deux niveaux de réalité, présent à la fois au monde qui l’entoure, et à celui, imaginaire, que dessinent les sons que lui seul perçoit. Mais il fait en outre l’épreuve d’un dérèglement démultiplié des sens et de l’interaction sociale : le rapport au monde et aux autres, qui change au fur et à mesure du déplacement, doit, d’instant en instant, être réinventé[13]. Sensibilité, milieu et appareil deviennent des variables dont l’ajustement se renégocie en permanence, dans un engagement réciproque et intense qui est, aux dires des usagers, l’un des plus grands plaisirs que l’on puisse prendre à l’écoute mobile[14]. Il semble que la séparation d’avec l’environnement accroisse la conscience que l’on a des relations potentielles qui se nouent avec lui et permette d’en jouer, la dextérité acquise à ce jeu devenant une forme nouvelle de distinction sociale. Les utilisateurs d’iPod comparent cette expérience au fait de voir un film : en mettant la ville en musique, ils « se font leur cinéma ». Les penseurs de l’École de Francfort, puis les situationnistes, ont décrit ce comportement « esthète » qui fait de chaque lieu une scène et de chaque moment un spectacle (Lipovetsky et Serroy 2013). La mise en musique de l’environnement dans lequel on circule est l’un des éléments qui lui confèrent cette dimension « cinématographique ». Le son écouté au casque s’épand sur les êtres et les choses, ponctue les événements offerts à la vue, modifie la perception du temps et de l’espace et invite même à élaborer des scénarios dans lesquels les passants anonymes deviennent acteurs, tandis que le comportement de l’auditeur, répondant physiquement aux impulsions sonores qu’il est le seul à entendre, paraît étrange et décalé. Ce jeu crée une « interaction sociale » qu’Hosokawa (1989) a le premier qualifiée de « théâtre secret », l’auditeur et celui qu’il croise se donnant à une représentation dans laquelle chacun ignore le rôle que l’autre lui fait jouer. Cette manière de se réapproprier l’espace public, de combler l’ennui, de briser la routine et d’éviter le stress peut être interprétée comme une activité compensatoire révélant le besoin de maîtrise d’un sujet dont l’existence est asservie et le cadre de vie, colonisé. Par l’intermédiaire du baladeur s’exerce un processus d’esthétisation qui serait, selon Michael Bull, une dialectique par nature, donnant à celui qui s’y livre un sentiment de contrôle, tout en confirmant son assujettissement à une machine (2007, 167).

La comparaison avec le cinéma est éclairante ; le dispositif cinématographique qui, d’une part, sépare le son de sa source et, d’autre part, disjoint l’enregistrement du son de celui de l’image instaure une expérience doublement schizophonique. Lorsque ces conventions sont mises à mal, le spectateur éprouve un monde qui n’est plus donné, mais qui doit être construit pas à pas, dans l’articulation d’éléments visuels et sonores dont le rendu sensible et la spatialisation varient[15]. Le terme « schizophonie », débarrassé de sa dimension pathologique, demeure donc précieux pour qualifier l’expérience paradoxale que fait un « promeneur écoutant » (Chion 1993) tenu, dans la rue comme au cinéma, d’assumer la coupure entre les sons et leur contexte d’origine pour pouvoir les associer librement à des éléments toujours différents. Lorsque le casque est branché à un objet connecté, le champ relationnel fluide auquel l’écoute participe ne connaît plus de limites précises. L’auditeur-baladeur peut simultanément se déplacer dans une rue, suivre le rythme de la musique qu’il écoute et échanger avec un correspondant lointain. L’espace privé d’écoute que circonscrit le casque communique avec l’espace physique comme avec l’espace virtuel, et le promeneur évolue dans un milieu dont il est le centre, mais dont la périphérie échappe. Cet espace flou a toutes les caractéristiques de l’espace sonore tel que les recherches en éthologie permettent de décrire : un champ de force modulable – et non un espace circonscrit peuplé d’objets – défini par la portée des émissions et perceptions sonores centrées autour d’un sujet percevant (Augoyard 1987). Dès lors, les attentes ou réticences à l’égard de l’appareil se transforment : on n’exige plus de lui la « haute-fidélité » des anciens lecteurs, on ne stigmatise plus sa capacité de simulation, mais on apprécie son « agentivité » croissante, sa faculté de faire faire et de rendre possibles des gestes inventifs. Accolé à notre corps telle une prothèse, le casque audio nous donne l’impression d’« être joué » par une musique intérieure. Il se plie à nos manipulations comme nous nous adaptons à son mode opératoire, dans une relation de développement réciproque et continu : le casque, emblème de l’écoute « secrète » qui pouvait être aussi bien un plaisir solitaire qu’une forme de surveillance, devient l’instrument d’une création ludique.

L’utilisateur d’un baladeur MP3 ou d’un iPod joue de la machine comme d’un instrument : ajustant ou désajustant le casque pour en modifier le degré d’étanchéité aux bruits extérieurs, accueillant pour un temps les sons géolocalisés sur lesquels une application le branche, composant à loisir la « playlist » qui accompagnera ses déplacements, atomisant un morceau pour le mixer avec un autre, échangeant ou partageant en un clic un fichier musical avec un correspondant via le réseau. Mais il est simultanément « oeuvré » par l’appareil qui diffuse, en lui, des sons qui parcourent ses muscles, rythment ses déplacements et éveillent les échos sensibles d’anciennes expériences.

De l’écoute solipsiste à la résonance

Le casque audio fait aujourd’hui partie des accessoires de notre vie quotidienne, accompagnant nos transports, activités sportives, temps morts et expériences artistiques et ludiques. Customisé et adapté aux mouvements de la glisse, il est un élément indispensable de la panoplie du skateur, comme en témoignent les publicités sur les sites dédiés et les « skatelist » qui se multiplient sur les plateformes de téléchargement telles qu’iTunes ou Deezer. C’est sans doute l’une des raisons pour laquelle Alex Tremain, apprenti skateur dans Paranoid Park, évolue en permanence dans un cocon sonore personnalisé où se succèdent, sans solution de continuité, diverses chansons pops, fragments de musiques de film et compositions environnementales. Ce principe immersif, déjà présent dans les autres films de la « Tétralogie de la mort[16] », prend ici des formes inédites pour traduire le mode de vie d’une communauté urbaine et la manière d’être singulière d’un adolescent qui se sent exclu pour avoir provoqué accidentellement la mort d’un agent de sécurité. Tout l’intérêt du film est de nous faire partager le mode d’appréhension d’Alex : la mise en scène reproduit et transforme les conditions de sa perception pour en faire une expérience solitaire à plusieurs. Il nous est donné d’écouter avec lui, sans pour autant écouter comme lui : dans ce rapport et cet écart, nous pouvons à la fois éprouver et penser les formes de l’écoute. La schizophonie qui affecte le personnage accentue sa marginalisation, tout en développant une sensibilité accrue aux résonances qui s’instaurent entre lui et le monde. Le geste qui en résulte révèle les paradoxes de l’écoute appareillée et mobile.

Illustrant l’attitude de repli de l’auditeur casqué, l’immersion dans une bulle sonore protectrice vient d’abord en réaction, dans le film, aux multiples agressions que constituent les ordres, confessions, sollicitations ou questions indiscrètes, le tumulte des couloirs du lycée ou du centre commercial, les bruits fortement réverbérés de la planche à roulettes sur le bitume dans l’enceinte close de Paranoid Park. Quand son ami Jared demande à Alex pourquoi il a fait l’acquisition d’un « skate de pédé » – sans savoir que l’objet a été choisi de façon aussi dissemblable que possible de celui ayant causé la mort accidentelle du vigile –, ce dernier se sent menacé : explose alors la chanson tonitruante We will revolt du groupe de streetpunk The Revolts. Le son saturé simule l’écoute à fort volume qui se pratique sous le casque lorsque l’on veut se couper du monde extérieur. Un très gros plan fixe, décadré et ralenti de Jared dardant son regard dans l’objectif déforme les perspectives et vient illustrer l’effet narcotique de la musique qui atténue le sentiment de danger que nous partageons avec l’adolescent.

Durant les deux premiers tiers du film, rares sont les scènes accompagnées par les bruits d’ambiance attendus. Ceux-ci sont en effet relégués en arrière-plan, doublés, voire supplantés par la voix narrative d’Alex ou par des compositions mêlant musiques préexistantes et effets spécialement conçus pour le film par Leslie Schatz, designer sonore attitré de Gus Van Sant depuis 1997. L’impression schizophonique est d’autant plus forte : les déambulations filmées au ralenti et en travelling se multiplient, et il manque les points de synchronisation qui ancrent d’ordinaire les sons filmiques à l’image. Sons et images défilent ainsi en parallèle, reflétant l’expérience que pourrait vivre un auditeur-baladeur qui « se ferait son cinéma » et mettrait le monde en musique pour estomper sa brutalité. Conduisant à s’oublier soi-même comme à nier l’autre, à se retirer du monde comme à éviter les aléas du présent, cette attitude « autiste » semble correspondre à l’état dans lequel le bain sonore continu plonge Alex dans Paranoid Park. Elle tend de même à l’isoler et à le maintenir dans une forme de socialité appauvrie. Par exemple, les appels étouffés de sa petite amie dans un couloir du lycée lui demeurent indifférents tandis que l’accompagne l’Arcobaleno per Giulietta (Arc-en-ciel pour Juliette), morceau tendre et gai composé par Nino Rota pour Juliette des esprits (Frederico Fellini, 1965). Le retour à la réalité et à la voix criarde de Jennifer se double d’un passage du flou au net qui durcit les traits de la jeune fille. Ce sont de pareils moments qui justifient l’accusation de formalisme souvent faite à Van Sant, qui dessinerait des « bulles esthétisantes » où la caméra et les corps semblent flotter, ne livrant, des personnages, qu’une surface sans profondeur.

Tandis que l’adolescent roule en voiture vers le skatepark, on entend un rap (I heard that de Cool Nutz), puis un extrait du 3e mouvement de la 9e symphonie de Beethoven, un blues (Tunnelmouth Blues de Henry Davies) et enfin un fragment de country (Outlaw de Cast King) qui sera repris sur le générique de fin. Chacune des ambiances musicales qui envahissent successivement l’habitacle modifie ses gestes et ses postures, comme s’il réagissait aux signaux sonores par des réflexes conditionnés. Le contraste entre les divagations musicales et la rectitude de l’image, qui enferme le personnage dans le double cadre, fixe, de l’écran et du pare-brise, souligne le besoin d’évasion. Pourtant la disparité des morceaux, leur montage cut et le caractère allusif, voire prémonitoire, des paroles et des motifs musicaux qui renvoient à des moments antérieurs ou ultérieurs du film, favorisent les errances d’une composition rhapsodique. L’écoute n’est plus, ou pas seulement, un symptôme d’aliénation ; elle devient l’espace fécond où s’agrègent, pour le personnage comme pour le spectateur, des sensations plurielles, souvenirs et intuitions vagues.

Si la distorsion, la désynchronisation ou la suppression des sons diégétiques s’ajoutent par moments à la présence de musiques au volume délibérément amplifié pour confirmer l’effet d’isolement sonore, d’autres séquences rendent au contraire sensible un rapport intense, pluriel et souple au réel qui s’éloigne de toute forme de « régression narcissique ». La scène nocturne remémorée, qui culmine avec l’accident mortel du vigile écrasé par le train qu’Alex a pris en marche, donne lieu à une violente déréalisation visuelle et sonore. Les accents lyriques du 4e mouvement de la 9e symphonie de Beethoven sont entrelacés aux tintements, crissements et souffles artificiellement composés par Schatz. L’ensemble forme une musique concrète environnementale faite de sons enregistrés, puis numériquement remodelés, qui baignent l’oreille dans un halo mouvant. La confusion sonore de cette scène vécue dans l’excitation, l’urgence puis l’effroi ne se veut pas le simple reflet des « climats intérieurs » traversés par Alex (Droin 2016). Bien différente d’une musique « empathique » censée correspondre à la couleur émotionnelle des images, elle traduit, pour le personnage comme pour le spectateur, le devenir réciproque et continu de l’être et de son environnement. Sculptés par l’ombre, les éclats brusques de lumière et les décadrages qui empêchent que l’on puisse nettement les distinguer, les lignes de fuite des rails et le contour des corps et des objets, tour à tour, s’esquissent et s’effacent ; la musique comme les bruits, concrets, mais sans ancrage défini, tantôt formant un accord, tantôt égrenés en arpège, connaissent des variations sérielles d’intensité, de texture, d’allure. Sons et images traduisent les différences de pression et de portée de forces qui modifient le rapport de l’être sensible aux phénomènes qui l’entourent, tout proches – le mouvement du train, la sensation du vent –, ou plus lointains –  l’ébranlement de l’air qui précède l’orage, la venue du gardien. Maurice Merleau-Ponty observe qu’un hurlement « ne fait pas penser à la colère, il est la colère elle-même » (Merleau-Ponty 1996, 215). Tim Ingold, commentant cette phrase, ajoute : « Le son n’est pas dissociable de votre état mental, il n’en est pas détaché comme un message […]. Les échos du hurlement sont les répercussions de votre être à mesure qu’il se déverse dans l’environnement » (Ingold 2013, 36). L’écoute, dans cette perspective écologique renouvelée, se fait résonance : elle noue des liens diffus pour prolonger en écho chaque émission sonore. Un cri errant traverse à deux reprises le film sans que l’on puisse en connaître la source : trace sonore de l’accident, il en déporte la blessure en provoquant des associations plurielles. Tour à tour, on lui cherche – sans les trouver toujours – une cause, une valeur symbolique, un lien sémantique ou rythmique avec l’image, un rapport affectif à la situation du personnage. L’emploi de musiques préexistantes qui souvent se superposent – les morceaux de musique concrète d’Ethan Rose (Song one), Robert Normandeau (La Chambre blanche) et Francis White (Walk Through a Resonant Landscape No. 2), les fragments de bandes originales de films de Fellini, les airs populaires ou symphoniques – décuple le vagabondage mémoriel. L’extranéité même de ces musiques les empêche de trouver, dans le film, la justification qui en clorait le sens, et permet à chacun de greffer ses propres réminiscences cinéphiliques ou mélomanes sur les effets d’échos internes au film, augmentant encore l’espace de résonance. Les musiques de Nino Rota, par exemple, n’ont pas pour fonction de décorer le vide qui emprisonne Alex, mais renvoient plutôt aux combats fantasques de Juliette contre les « esprits[17] ». Loin de ramener le monde à soi, dans un repli narcissique en projetant sur lui les fantasmes kitsch nés d’une usine à rêves, l’auditeur, dans ces voyages faits de glissements, de liaisons à distance et de rapprochements suspendus, confère à chacun des événements qu’il vit une portée accrue. Lorsqu’Alex se trouve face à face avec le corps sectionné du gardien de nuit, soudain les choeurs de la 9e symphonie évincent tout autre son et conquièrent une vaste profondeur lyrique. L’adolescent perçoit alors, en un instant, la résonance – existentielle, éthique, humaine – d’un événement qui déborde le cadre contingent où il advient. Le chant réverbéré comme dans une cathédrale contribue à faire percevoir ce moment à travers l’écho qu’en donne sa traduction musicale : il frappe l’attention avec une assourdissante distinction et contaminera dès lors toutes les expériences futures vécues par le personnage et tous les moments du film appréhendés par le spectateur.

Seule la médiation d’une machine qui délocalise le son et l’ouvre à des accords sans cesse renouvelés rend possible une telle écoute[18]. Elle résonne parce qu’elle est l’écoute d’une écoute, les sons que l’on perçoit ayant été au préalable « entendus » et restitués par le système d’enregistrement et de reproduction sonore. L’expérience schizophone n’est plus alors synonyme d’appauvrissement sensoriel ou spirituel, mais permet de découvrir les sortilèges de la phonogénie, cette faculté qu’a un appareil, du fait de sa « sensibilité » propre, de faire entendre des sons inouïs[19]. Elle ne contribue pas à l’instauration d’une relation esthétisante au monde, mais participe de son élaboration esthétique au sens littéral du terme, modifiant la manière sensible dont on appréhende la réalité. Lorsque la bande-son perçue au travers du casque ou dans la salle de cinéma prend l’aspect d’une balade sonore, le travail du compositeur vient doubler les opérations techniques et enrichit encore le rapport au réel. Une scène de Paranoid Park porte l’effet à son comble : la composition de Francis White, Walk Through a Resonant Landscape No. 2, qui met au premier plan les réverbérations métalliques de bruits d’oiseaux, d’eau et de vent, déjà entendue sur deux scènes de marche en extérieur, est reprise lorsqu’Alex, sous la douche, se laisse progressivement envahir par la résonance infinie de la catastrophe qu’il a causée. Elle est intimement tissée au son de la chute d’un corps évoquant celle de Marion Crane dans Psychose (Alfred Hitchcock, 1960) et aux distorsions électroniques que Bernard Parmigiani fait subir à des sons concrets – variations liquides, cris d’animaux – dans certains extraits de Métamorphoses et de Dedans-Dehors (1977). Toutes les lignes sonores se nouent, pour finir, en un larsen tenu et strident qui envahit la totalité de l’espace sonore, mêlant inextricablement l’intérieur et l’extérieur, le présent et le passé. L’entrelacs créé reflète les multiples écoutes possibles d’un événement dont la répercussion est sans limites. Hildegard Westerkamp explique que le processus créatif d’une balade sonore consiste en une altération progressive et potentiellement infinie des sons initialement perçus dans un lieu donné, l’enregistrement, le mixage, le montage, la diffusion et les réceptions successives du morceau constituant chacun une « écoute » destinée à être écoutée à son tour (Westerkamp 2002, 54). La mise en résonance réciproque instaure une relation étroite entre un lieu, un événement, des machines, un musicien et des auditeurs qui participent ensemble d’une création en devenir, chacun contribuant par sa sensibilité, ses rêveries, ses souvenirs, ses attentes, à modeler une expérience qui n’acquiert jamais de forme définitive. Le lien entre soi et l’environnement, soi et l’appareil, soi et les autres, suppose un engagement intense et fait de l’écoute partagée un geste qui révèle la dimension politique de l’écologie sonore. Il ne va pas de l’un à l’autre, mais s’établit toujours entre l’un et l’autre, sur la ligne de devenir qui les apparie et les emporte. L’écoute ainsi mobilisée permet de se « mettre au diapason » :

On se lance, on risque une improvisation. Mais improviser, c’est rejoindre le Monde, ou se confondre avec lui. On sort de chez soi au fil d’une chansonnette. Sur les lignes motrices, gestuelles, sonores qui marquent le parcours […], se greffent ou se mettent à bourgeonner des « lignes d’err », avec des boucles, des noeuds, des vitesses, des mouvements, des gestes et des sonorités différents.

Deleuze et Guattari 1980, 383

L’écoute s’affirme comme un processus dynamique, faisant naître au fur et à mesure les sons en réponse aux moindres variations de l’environnement comme aux plus fines sollicitations de l’auditeur-baladeur. Ainsi se développent les promesses d’une écologie sonore dont les enjeux n’ont plus rien à voir avec la vocation conservatoire de préservation d’un patrimoine acoustique que Murray Schafer lui avait assignée.