Corps de l’article

Introduction

Une exposition fréquente et prolongée à des niveaux sonores potentiellement dommageables, entraînée par la pratique quotidienne d’un instrument ou par des performances scéniques répétées, rend les musiciens particulièrement à risque de développer des acouphènes (Burns O’Connell et al. 2021 ; Schmidt, Paarup et Baelum 2019 ; Jansen et al. 2009). Sensation auditive fantôme à laquelle ne correspond aucune source sonore externe, l’acouphène est difficilement mesurable au niveau de ses propriétés psychoacoustiques. On considère pourtant sa caractérisation par un audiologiste[1] comme utile, et celle-ci représente souvent une première étape d’un diagnostic qui précède l’élaboration d’une stratégie thérapeutique (Henry 2016). Ayant pour but premier de donner une tangibilité au percept (Hébert 2020), l’appariement clinique, qui consiste en la mise en correspondance entre l’acouphène et un son de référence, est cependant empreint de l’hétérogénéité de la caractérisation d’un individu à l’autre (Vajsakovic, Maslin et Searchfield 2021). En effet, si nous pouvons décrire la sonorité d’un acouphène par des termes comme un sifflement, grésillement, bourdonnement, bruit de pression, criquets et cigales, bruit de statique électrique, pulsation ou clics, etc., cette description par le langage comporte une subjectivité et une variabilité certaine (Szibor et al. 2021). La quantification clinique se restreint typiquement à deux mesures principales quant à la perception, les propriétés psychoacoustiques de la fréquence et de l’intensité (Evered 1981 ; Switalski et Sanchez 2014), faisant abstraction d’autres propriétés psychoacoustiques relatives à une caractérisation qualitative de l’acouphène, tels que le contenu spectral (Kostek et Poremski 2013), les modulations de hauteur et d’amplitude, des enveloppes temporelles et spectrales (Lentz et He 2020), et la localisation (Searchfield et al. 2015).

Méthodes classiques d’appariement clinique

Pour l’appariement en hauteur, on présente une série de sons sinusoïdaux ou de bandes de bruit blanc dont on fait varier la fréquence ; le patient doit déterminer la hauteur la plus ressemblante. Les qualificatifs tonal et atonal évoquent respectivement la perception d’une note dont la hauteur est bien déterminée et le caractère bruité d’un acouphène ; ces attributs sont représentés dans l’appariement de l’acouphène du patient par l’utilisation des sons purs (sinusoïdaux) et des bandes de bruit blanc filtré de largeur variable.

Plusieurs variantes de la technique de mesure de fréquence existent. La méthode par ajustement (la méthode utilisée dans cette étude) consiste à laisser le patient ajuster lui-même la fréquence du signal d’appariement à la fréquence la plus ressemblante, en tournant un bouton par exemple. C’est une technique rapide, qui produit une ressemblance satisfaisante pour le patient (Henry 2016 ; Neff et al. 2019). La technique du choix forcé par alternative (2afc) est la technique la plus utilisée par les audiologistes. On présente une première paire de fréquences au patient et ce dernier doit décider de la fréquence la plus proche de son acouphène. Successivement, des paires de hauteurs de plus en plus rapprochées lui sont présentées, jusqu’à ce que la hauteur exacte soit trouvée. C’est une méthode plus longue et laborieuse, mais qui présente un meilleur taux de ressemblance test/retest (Neff et al. 2019 ; Switalski et Sanchez 2014). Une autre méthode, la méthode de type likeness rating consiste en la présentation d’une série de fréquences couvrant l’ensemble du spectre sonore audible. Le patient doit, à chaque fréquence, ajuster l’intensité du signal au niveau de son acouphène et juger de la ressemblance en hauteur sur une échelle de 1 à 10. Ce procédé permet l’obtention de plusieurs (typiquement deux ou trois) fréquences dominantes de l’acouphène, rapprochant l’appariement à un spectre de fréquences qui est jugé souvent plus ressemblant que la fréquence dominante seule (most troublesome tinnitus) par le patient (Hébert 2018 ; Neff et al. 2019).

Le choix de l’oreille test peut influencer les résultats de l’appariement et il peut être fait en considérant divers facteurs : dans l’oreille ipsilatérale (l’oreille présentant l’acouphène), le signal comparatif peut interagir avec l’acouphène et fausser sa perception ; dans l’oreille contralatérale (l’oreille opposée), la diplacousie (asymétrie entre les deux oreilles dans la perception de la fréquence d’un même son) peut fausser les résultats. C’est généralement le choix de l’oreille ipsilatérale qui est le plus accepté, mais il n’est pas rare de laisser le patient choisir l’oreille qui lui semble la plus apte à faire le test (ce qui fut le cas pour cette étude). Dans le cas d’un acouphène bilatéral, il est indiqué de favoriser l’oreille présentant la meilleure audition (Vajsakovic, Maslin et Searchfield 2021).

Une corrélation claire entre pertes auditives et acouphènes a été abondamment documentée, et une forte tendance vers les hautes fréquences (> 3000 Hz) est généralement mesurée dans l’appariement de hauteur (Henry 2016 ; Reed 1960 ; Vajsakovic, Maslin et Searchfield 2021).

Appariement et pertes auditives

L’acouphène est en effet bien souvent calqué sur des pertes auditives (Nicolas-Puel et al. 2002), qui elles peuvent être engendrées par le vieillissement de l’appareil auditif (presbyacousie), la prise de médicaments ototoxiques ou encore des traumatismes auditifs liés à l’exposition aux sons forts. Bien qu’elle ne soit pas toujours observable, une corrélation claire peut fréquemment être établie entre les courbes de seuil d’audition et l’évaluation de ressemblance d’un acouphène à une fréquence. Par exemple, une personne ayant des pertes auditives importantes dans la région de 10 kHz déclarera lors de l’évaluation clinique de hauteur du percept de son acouphène une similitude avec le son sinusoïdal de 10 kHz (Hébert 2020). Peut-on obtenir un appariement fiable de l’acouphène en synthétisant un spectre de fréquences symétrique au seuil d’audition, comme un miroir des pertes auditives ? Une méthode d’appariement semi-automatique suivant cette hypothèse a été mise au point et testée dans le cadre d’une recherche sur la création d’avatars acouphéniques (Bertet et al. 2013). Les conclusions de l’étude démontrent qu’une méthode classique par ajustement utilisant sons sinusoïdaux et bandes de bruit blanc s’est avérée largement préférée par les participants, et donnait des avatars jugés plus ressemblants.

Intensité perçue et réaction à l’acouphène

L’autre propriété psychoacoustique typiquement mesurée dans l’appariement clinique est l’intensité perçue ou la sonie (loudness matching). Elle est effectuée en dB SL (sensation level) et elle représente l’intensité perçue moins le seuil d’audition à la fréquence cible, prenant ainsi en compte les pertes auditives (Switalski etSanchez 2014). Le patient doit ajuster l’intensité d’un signal comparatif (ajusté en hauteur précédemment) à l’intensité perçue de son acouphène. On ne peut cependant pas quantifier objectivement l’intensité perçue des acouphènes et la mesure obtenue n’a d’autre réelle utilité clinique qu’une certaine validation de la perception du patient d’un point de vue d’un acouphène fort ou faible (Henry 2016). En effet, la dimension psychologique doit invariablement être prise en compte dans un processus d’évaluation du percept puisqu’elle peut influer sur certaines propriétés psychoacoustiques de l’acouphène, notamment celle de l’intensité perçue. Des questionnaires tels que le tinnitus functional index (tfi) et le tinnitus handicap inventory (thi) quantifient d’une certaine manière les niveaux de gêne et de détresse provoquées par l’acouphène (Basile 2013). Mais comment expliquer la subjectivité si marquée de la réaction émotive ?

Le modèle de Jastreboff, du nom du neurophysicien polonais qui l’a élaboré, illustre bien les dynamiques entre attention, hypervigilance, stress, intensité perçue et détresse émotive. Il place le système limbique au centre d’un cercle d’accroissement où l’acouphène associé à une émotion négative, à travers l’activation des systèmes nerveux autonome et limbique, devient synonyme de danger et d’inconfort, ce qui contribue à faciliter la détection de l’acouphène, à augmenter sa perception, une sensation générale d’anxiété ainsi que les réactions comportementales qui lui sont associées (voir figure 1) ( sae Institute France 2011  ; Jastreboff 2011).

Le déclenchement de la succession d’événements conduisant à la perception de l’acouphène ne dépend donc pas nécessairement de l’intensité de la perception. C’est ce qu’on appelle le paradoxe de l’intensité. Il existe une certaine contradiction dans le fait que les niveaux d’intensité acouphénique perçus lors d’évaluations cliniques sont typiquement légèrement au-dessus du seuil d’audition (de 5 à 10 dB). Comment expliquer qu’un son si faible puisse causer de la gêne par cette « illusion de grande intensité » (Fowler 1942, p. 275, notre trad.) ? Cliniquement, une différence est faite entre la mesure de réaction (loudness rating) et la mesure de perception (loudness matching), un acouphène perçu à une intensité importante par deux personnes différentes pourra causer de la détresse chez l’une et de l’indifférence chez l’autre (Henry 2016).

Figure 1

Le modèle neurophysiologique de Jastreboff

adapté à partir de Jastreboff 2011, p. 579

-> Voir la liste des figures

Synthétiseur d’acouphènes

La hauteur, à travers l’utilisation de sons sinusoïdaux (dont la hauteur est bien définie) et de bandes de bruit blanc filtré (dont la hauteur est indéfinie), et l’intensité perçue (en dB SL) sont donc systématiquement mesurées dans une procédure d’évaluation audiologique. D’autres méthodes d’appariement prennent en compte davantage de propriétés psychoacoustiques de l’acouphène.

Dans ses études audiométriques sur les acouphènes, George F. Reed avait établi en 1959 un procédé d’appariement, assez élaboré pour l’époque, qui utilisait oscillateurs, générateurs de bruit, filtres et modulation en anneau dans le but d’obtenir un acouphène synthétisé jugé le plus ressemblant possible (Reed 1960). Plus récemment, le synthétiseur d’acouphènes (tinnitus synthesizer) mis au point par Kostek et Poremski (2013) se veut une alternative améliorée à l’audiomètre classique utilisé par les audiologistes (ibid.). Son interface graphique intuitive (voir figure 2) permet au participant de synthétiser son acouphène de façon autonome. Il s’agit de placer sur un axe horizontal (fréquence) et vertical (intensité) des sources sonores (sinus ou bruit blanc filtré), et d’y ajouter filtres et/ou modulation d’amplitude. Le participant peut ajouter autant de sources qu’il le désire créant des sons complexes s’étendant sur un large spectre de fréquences. Dans l’éventualité où plusieurs sons sont entendus, il n’a plus à prioriser le most troublesome tinnitus, c’est-à-dire le son le plus gênant, et peut arriver à un portrait acouphénique complexe et aussi proche que possible de la perception (ibid.).

Figure 2

L’interface graphique du synthétiseur d’acouphènes

Kostek et al. 2013, p. 6

-> Voir la liste des figures

Puisque le but premier de l’appariement clinique est de donner forme à l’acouphène, lui donner une tangibilité (Henry 2016 ; Hébert 2020), nous pouvons émettre l’hypothèse que de s’attarder à des propriétés qualitatives comme le contenu spectral, la modulation temporelle, l’enveloppe dynamique et la localisation spatiale du percept, en plus de la hauteur et l’intensité, viendrait assurément enrichir cette caractérisation. La considération de l’ensemble de ces propriétés psychoacoustiques dans un appariement utilisant des outils de synthèse plus élaborés que l’audiomètre classique, couplée à la recherche auprès des musiciens, catégorie de participants qui, de par leurs connaissances en acoustique et formation musicale sont aptes à décrire leurs acouphènes et à discuter de leurs propriétés psychoacoustiques, permettra d’aboutir à la synthèse sonore de portraits acouphéniques détaillés, aussi proches que possible du ressenti, et possiblement plus complets que ceux obtenus lors d’une évaluation clinique typique.

Méthodologie

Recrutement des participants et déroulement des entrevues

Pour cette étude, nous avons recruté huit participants (sept hommes et une femme), âgés de 30 à 70 ans, qui possèdent tous une certaine connaissance de l’acoustique, ont une pratique musicale depuis plus de 10 ans et jouent d’un instrument. Les entrevues comportent deux volets : l’évaluation de la réaction à l’acouphène et la mesure de perception. Un questionnaire comprenant trois sections a été élaboré : historique et narrativité, description verbale du portrait acouphénique, émotions et réactions. La première section se penche sur l’origine et l’évolution des acouphènes des participants : les événements déclencheurs et les changements qu’ils ont pu observer avec le temps (apparitions de nouveaux bruits, changements dans la localisation, augmentation ou baisse en intensité, etc.). L’apparition des acouphènes est souvent associée au récit d’un ou plusieurs événements très précis. Par exemple, P5 a souffert d’un traumatisme auditif pendant un test de son avant un concert qui a marqué le début de sa condition ; P7 associe une session d’enregistrement sous écouteurs à l’apparition de son acouphène bruité à gauche et P8 raconte avec émotion une période de dépression et la prise prolongée d’ibuprofène sur ordonnance qu’il croit être directement liées à l’apparition de ses premiers acouphènes. La section « émotions et réactions » s’intéresse à la gestion quotidienne de la condition par les participants, les facteurs aggravants et atténuants, les moments de réactivité et d’acceptation, et s’interroge également sur l’identification du participant à sa réalité auditive. P5 mentionne, par exemple, qu’il associe son acouphène principal à un « animal de compagnie qui l’accompagne tous les jours et qui fait partie de [lui] ». P8 raconte qu’il écoute ses acouphènes avec attention pendant de longues périodes, pour en déceler les subtilités et variations, « un processus d’acceptation teinté d’une approche holistique, si on veut ». Enfin, la section de la description verbale est liée aux mesures de perception et à la synthèse des portraits acouphéniques, à l’identification des différents sons perçus et de leurs propriétés psychoacoustiques.

Le questionnaire a été envoyé en amont de l’entrevue et d’une procédure de synthèse du portrait acouphénique, le participant pouvant prendre le temps de répondre aux questions individuellement et la discussion se poursuivant en personne (P1, P2, P3, P5, P7) ou à distance par Zoom avec le plugiciel de transmission audio hdAudiomovers Listento (P4, P6, P8). L’ajout du plugiciel permet d’outrepasser l’audio de piètre qualité de Zoom pour transmettre un signal 24 bits et 48 kHz du logiciel de synthèse (Ableton Live) de l’intervieweur vers le navigateur web (Chrome ou Firefox) du participant.

Contrairement au processus clinique habituel d’appariement décrit plus haut, la méthodologie adoptée permet de consacrer plus de temps à chacun des participants et d’entrer dans les détails, les entrevues pouvant s’étirer jusqu’à une heure et demie. Il est aussi important de souligner que les participants sont tous des musiciens, initiés jusqu’à un certain point aux concepts de l’acoustique (timbre, hauteur, intensité, enveloppe, etc.). Les échanges avec les participants visaient donc à mettre en lumière la particularité et le caractère unique de leurs réalités auditives.

Synthèse des portraits acouphéniques

La synthèse des portraits acouphéniques que nous avons réalisée est basée sur une méthode et des outils de synthèse s’inspirant des travaux de Kostek et Poremski (2013) et veut rendre compte des propriétés psychoacoustiques de l’acouphène : la fréquence, l’intensité, le contenu spectral, les enveloppes dynamiques et spectrales, la modulation et la localisation. Elle veut aussi rendre compte d’une possible multiplicité des sources sonores (de multiples acouphènes) qui créent une scène auditive complexe. Notre processus de synthèse a été effectué dans un studio, au casque d’écoute, dans une pièce insonorisée et environnement sonore contrôlé, avec le logiciel Ableton Live, le synthétiseur de tables d’ondes virtuel Serum et filtres et égalisateurs Fabfilter (voir figure 3). Dans certains cas, des effets de distorsion par quantification (bit crusher), de saturation, de réverbération, de flanger et de phaser sont utilisés. La modulation d’amplitude et de hauteur est possible par l’utilisation de LFOs.

Figure 3

La synthèse dans Ableton Live du portrait acouphénique de P1 est ici représentée. Le synthétiseur Serum génère une des sources sonores, une bande de bruit avec résonance filtrée par un filtre passe-bande étroit Fabfilter centré sur 4300 Hz, qui module en fréquence (oscillation à vitesse aléatoire entre B6 et C7 générée par automation du lfo). Les trois autres sources sonores du portrait acouphénique et leur piste correspondante sont aussi présentes.

-> Voir la liste des figures

Le processus débute par la description verbale des différents acouphènes entendus ; chez tous les participants, la présence de plusieurs sons a été rapportée. Chaque participant doit énumérer les différents acouphènes entendus et donner pour chacun le plus d’informations possible susceptibles d’être utiles à la synthèse. Cette description verbale précède l’appariement spectral : sons sinusoïdaux, bandes de bruit ou échantillons sonores ; pour chaque acouphène entendu, une source doit être choisie. De manière à pouvoir proposer des exemples sonores aux participants, une banque d’échantillons sonores acouphènes types, classés par catégories (voir figure 4), a été constituée. Cette banque d’échantillons sonores est similaire à celle d’une étude récente sur les dimensions psychoacoustiques de l’acouphène où les chercheurs ont mis sur pied une liste de 60 sons acouphènes types : 37 sons de l’environnement (bouilloire, lignes électriques, machine à écrire, etc.), 4 sons différents de criquets et 19 sons de sinus et bandes de bruit blanc à diverses fréquences (Lentz et He 2020). Ainsi, si le participant indique que son acouphène ressemble à une « cigale », ou encore au « bruit électrique d’une ligne de haute tension », des exemples sonores lui sont présentés pour validation ou comme point de départ à une discussion sur les propriétés psychoacoustiques de l’acouphène. Ces échantillons peuvent alors être utilisés tels quels ou être modifiés par différents modules de traitement comme des égalisateurs Fabfilter (filtre passe-haut, passe-bas et passe-bande de largeurs variables) ou des effets (réverbération, distorsion ou effets de modulation). Selon le contenu spectral de l’acouphène, d’autres sources sonores ont été utilisées : différents types de bruit (blanc, rose, bruits filtrés, etc.) et formes d’onde, le sinus ayant été cependant presque systématiquement choisi dans le cas de l’utilisation d’une onde sonore.

L’appariement en fréquence a ensuite été effectué par ajustement, dans l’oreille choisie par le participant. Une fréquence de 1000 Hz était initialement proposée au participant qui pouvait ajuster lui-même, ou avec l’aide de l’intervieweur, la hauteur et de la source sonore directement sur le synthétiseur Serum dans Ableton Live. Le choix de l’oreille test peut influencer les résultats de l’appariement, comme nous l’avons mentionné précédemment. Cependant, pour l’acouphène unilatéral comme pour le bilatéral, nous avons laissé le participant choisir puisque les courbes de seuils auditifs n’étaient pas connues. L’intensité n’a pas été mesurée de façon absolue en dB SL pour la même raison. L’évaluation de l’intensité des divers sons les uns par rapport aux autres, plus pertinente dans le contexte des portraits acouphéniques, a cependant été considérée, et un équilibrage en volume des sources sonores jugée satisfaisante par le participant a été effectuée. Les modulations de hauteur et/ou d’amplitude ont été obtenues par l’utilisation de lfos du synthétiseur plugiciel Serum. La vitesse des modulations, régulière ou souvent variant aléatoirement autour d’une vitesse médiane (généralement moins de 1 Hz), résulte d’automations des paramètres du lfo dans Ableton Live. Des effets de flanger et phaser pouvaient aussi créer de la modulation. La localisation des percepts a été évaluée (gauche/droite/centre) et une certaine perspective de proximité/distance pour quelques acouphènes a pu être obtenue par l’utilisation d’un plugiciel de réverbération.

Figure 4

Banque d’échantillons sonores acouphènes-types, inspirée par l’étude sur les dimensions perceptuelles de l’acouphène de Lentz et He (2020), et constituée d’échantillons classés par catégories (« électrique low freq » contient des grondements de basses fréquences d’appareils électriques, « static high freq » des grésillements électriques de hautes fréquences, « insectes » divers bruits de cigales ou grillons et « vapeur » des bruits de pression de vapeur).

-> Voir la liste des figures

Résultats

Le tableau ci-dessous présente les caractéristiques des portraits acouphéniques des huit musiciens. La première colonne comprend les différentes informations évocatrices de la description qualitative fournies par le participant par écrit (questionnaire) ou oralement (entrevue). Les mots clés principaux apparaissent en caractères gras. La deuxième colonne comprend les sources sonores utilisées pour la synthèse, chaque source (en caractères gras) représentant un acouphène différent : onde sonore (sinusoïdale ou carrée), échantillon sonore, bande de bruit. Les différents filtres et effets appliqués aux sources y sont aussi décrits. La colonne suivante traite des modulations d’amplitude et de hauteur et la dernière de la spatialisation des divers acouphènes, leur localisation perçue. L’écoute des portraits acouphéniques est possible en cliquant sur les fichiers mp3 sous la désignation P1 à P8 de chacun des participants. Nous suggérons aux lecteurs d’écouter les extraits sonores dans leur entièreté, au casque d’écoute, et de lancer les fichiers audio à bas volume.

Tableau 1

Tableau 1 (suite)

Résultats.

-> Voir la liste des tableaux

Extraits audio : Portraits acouphéniques des participant 1 (P1), participant 2 (P2), participant 3 (P3), participant 4 (P4), participant 5 (P5), participant 6 (P6), participant 7 (P7) et participant 8 (P8).

Discussion

Description verbale et caractérisation du percept de l’acouphène par le langage

Paysages sonores complexes et variés, les portraits acouphéniques traduisent bien la subjectivité de l’expérience des acouphènes. On peut remarquer d’emblée que par leur formation musicale, leur expérience avec les outils de synthèse et de traitement des sons et leur connaissance (à différents degrés) de la nature physique des sons, les participants sont capables de décrire leur acouphène avec beaucoup de précision. Les analogies (ex. : « son de cigale », « grondement d’un vieux réfrigérateur », etc.) sont complétées par des indications très précises, notamment à propos des composantes sinusoïdales (ex. : « sinus assez fort et constant à droite à 4000 Hz »), puisque certains participants (P4, P6, P8) avaient auparavant déjà mesuré les fréquences de leurs acouphènes.

La description verbale que fait le participant de son acouphène, une première étape dans la synthèse des portraits acouphéniques, comporte une part importante d’information qualitative. Cette description est cependant empreinte d’une subjectivité certaine et témoigne de la familiarité individuelle avec certains sons. Une récente étude sur la description de sons acouphènes types par le langage a confirmé l’importante variabilité dans l’utilisation de mots spécifiques pour la caractérisation d’un acouphène (Szibor et al. 2021). Les auteurs de cette étude ont présenté à 26 personnes acouphéniques une série de 17 sons synthétisés d’acouphènes typiques : huit sinus à des fréquences couvrant le spectre audible, huit bandes d’un tiers d’octave de bruit blanc centrées aux mêmes fréquences que les sinus, et du bruit rose. Les participants devaient juger de la correspondance (échelle de 0 à 100) de ces sons à 18 mots couramment utilisés comme descripteurs d’acouphènes. La sémantique des mots pouvant décrire un acouphène s’avère plutôt imprévisible et changeante d’un individu à l’autre, la variabilité du jugement d’un son-acouphène n’est pas nécessairement preuve d’une différence dans le percept de l’acouphène. Les auteurs concluent l’étude par le constat suivant : « Therefore, if verbal descriptions of the tinnitus percept are used […] the inter-individual reliability of the approach should first be established using a variety of acoustic reference stimuli » (ibid., p. 110).

Utilisation d’échantillons sonores

Une description objective d’un acouphène nécessite une « référence acoustique » : si nous parlons d’un « bourdonnement », nous devons pouvoir entendre ce que peut être le bourdonnement et dégager les propriétés psychoacoustiques que sous-tend ce son. C’est ce qui a motivé l’utilisation des échantillons sonores dans notre synthèse des portraits acouphéniques. Notre banque d’échantillons sonores, similaire à celle de l’étude de Lentz et He (2020) mentionnée précédemment, a pu servir de point de départ dans la discussion des propriétés psychoacoustiques des acouphènes des participants.

En continuité avec les travaux de Grey (1977) sur le timbre des instruments de musique ou encore de Gigy et Kidd (2007) sur la similarité et catégorisation des sons environnementaux, Lentz et He (2020), dans leur étude sur l’analyse de la perception des sons acouphènes types, ont tenté d’établir certaines dimensions psychoacoustiques de l’acouphène par positionnement multidimensionnel. Ils ont sélectionné 60 sons acouphènes-types qu’ils ont fait entendre à des participants à l’audition normale qui ont posé des jugements de similarité (similarity ratings) sur des paires de sons choisies au hasard. Ces mesures de distance ont été évaluées en fonction de 48 paramètres acoustiques qui ont été identifiés par Gigy et Kidd (2007) dans leur étude sur les sons environnementaux comme étant les plus susceptibles de représenter les dimensions perceptuelles : des mesures spectrales (intensité, hauteur, etc.), des mesures temporelles (durée, modulation – intensité et vitesse à diverses bandes de fréquences, attaques et pics, etc.) et des mesures spectrotemporelles (mouvement spectral). Après positionnement multidimensionnel, les dimensions suivantes ont été dégagées, dont les deux premières sont présentées sur la figure 5 :

  • Dimension 1 : corrélée principalement à la hauteur, avec un certain degré de séparation entre aigu et tonal à droite et bas et bruité à gauche ;

  • Dimension 2 : corrélée au degré de modulation/fluctuation et influencée par des éléments relatifs aux enveloppes spectrales et temporelles (les clics et pulsations en bas et les enveloppes plus linéaires en haut de l’axe) ;

  • Dimension 3 : corrélée à la vitesse de modulation.

Figure 5

Analyse par positionnement multidimensionnel de sons acouphènes types

Lentz et He 2020, p. 3563

-> Voir la liste des figures

Nous avons constaté que l’écoute d’échantillons sonores qui s’apparentent à la description verbale de l’acouphène permet d’orienter rapidement et efficacement le processus de synthèse vers une dimension psychoacoustique précise du percept analysé, que ce soit pour une modulation ressemblante, un timbre ou une enveloppe temporelle similaire.

Hauteur

Certaines observations au niveau des caractéristiques psychoacoustiques des acouphènes de nos participants nous permettent de catégoriser leurs acouphènes. Au niveau de la hauteur, notamment, on remarque que la plupart des participants suivent une tendance qui est généralement mesurée dans l’appariement de hauteur avec des acouphènes dans les aigus (plus de 3000 Hz) (Henry 2016 ; Reed 1960 ; Vajsakovic, Maslin et Searchfield 2021), ce qui indique probablement des acouphènes subjectifs (qui ne peuvent être entendus que par la personne acouphénique). Ces participants rapportant tous une forme de perte auditive due à l’exposition aux sons forts, la corrélation entre aigus et perte auditive est donc ici marquée. Les deux participants qui déclarent avoir des acouphènes de basse fréquence (P4 à 50 Hz et P6 à 60 Hz) n’ont quant à eux pas de perte auditive connue. Il aurait été intéressant de connaître les niveaux de surdité des participants pour pouvoir établir des corrélations spécifiques entre fréquences des acouphènes et seuils d’audition. Mentionnons tout de même que sans connaître les courbes d’audition, nous avons pu observer cette corrélation pour certains participants (P2 et P3). Lors de l’ajustement progressif de hauteur, lorsque la source sonore rejoignait une zone autour de la fréquence du percept (5587 Hz pour P2 et 7791 Hz pour P3), elle perdait en intensité et disparaissait derrière l’acouphène. Les deux participants ont même cru que le signal avait été coupé dans leur casque d’écoute.

P6 est le participant qui possède le portrait acouphénique au plus large spectre fréquentiel. Nous pouvons émettre l’hypothèse que ses acouphènes sont de nature somatosensorielle parce qu’ils ont été grandement atténués par des manipulations de son ostéopathe au niveau du dos et du cou. L’acouphène somatosensoriel, ou objectif, provient d’un son réel et interne qui peut être entendu par un audiologiste. Moins fréquent que l’acouphène subjectif, il peut être d’origine musculaire, respiratoire, relatif aux os et squelette, vasculaire, et souvent lié aux régions du cou, dos et à la mâchoire (Henry 2016). C’est aussi le cas du participant P1 qui a déclaré souffrir de bruxisme (grincement des dents pendant le sommeil) et qui associe cette condition aux « clics » qu’il entend dans l’oreille droite lorsqu’il bouge la mâchoire. Ici, l’enveloppe temporelle du « clic » nous guide vers l’hypothèse de l’acouphène objectif.

Pour P4, qui est en attente d’un diagnostic, l’acouphène somatosensoriel est aussi suspecté par son médecin. Il est intéressant de noter que l’apparition de l’acouphène bas de P4 a entraîné des acouphènes aigus excessivement changeants et imprévisibles. L’hypothèse que ces derniers sont en relation directe avec son état émotionnel (le cercle vicieux de l’hypervigilance acouphénique illustré par Jastreboff) est plausible. Nous pouvons affirmer, sur la base de son entrevue et de ses réponses à la section « émotions et réactions » du questionnaire, que P4 est le participant le plus affecté émotivement. C’est aussi le participant pour qui l’apparition de l’acouphène est la plus récente et la période d’habituation la plus courte. C’est enfin la seule personne qui a déclaré entendre ses acouphènes 100 % du temps, à chaque instant. Autre fait intéressant à noter concernant le phénomène d’attention à l’acouphène, la réalisation de l’entrevue a eu pour P1 un effet déclencheur sur la conscience de sa dégénérescence auditive. Le participant a rapporté entendre beaucoup plus ses acouphènes, dans toute leur complexité. Après plus de 20 années de pratique de la guitare, il s’est décidé à porter des bouchons.

Modulation

Presque tous les participants ont une forme de modulation constante, mais à vitesse aléatoire, au niveau de la hauteur ou de l’intensité sur un ou des acouphènes. Des modulations spontanées sont spécifiques à certains participants : P2 et la montée d’intensité suivie d’une surdité passagère dans l’oreille droite, P4 et la pulsation occasionnelle de son acouphène bas. La lente modulation d’amplitude régulière mesurée à 1 Hz dans le cas de P4 pourrait être causée par une contraction des muscles de l’oreille moyenne. Une étude de cas récente (Londero et al. 2017) fait état d’un patient avec des symptômes d’oreille moyenne similaires à P4 (sensation de plénitude de l’oreille et vibration du tympan) accompagnés d’un acouphène modulant en d’amplitude à une vitesse de 32 Hz. La modulation en amplitude de l’acouphène de P4 nous indique un probable acouphène pulsatile causé par des troubles de l’oreille moyenne.

Les épisodes de distorsion décrits par P5 et P8 sont probablement reliés à l’hyperacousie, une sensibilité excessive aux sons forts souvent présente chez les personnes acouphéniques. Ces deux participants ont déclaré en souffrir, et puisqu’ils rapportent aussi tous deux des pertes auditives, un parallèle intéressant peut être fait avec la théorie du gain central augmentée (Norena 2011). Le système auditif central du cerveau, par un phénomène de plasticité homéostatique, produit un ajustement à la présence de la perte auditive en raison d’une diminution de l’entrée nerveuse auditive créée par la surdité. Cette compensation amplifie le flux auditif en créant une réponse nerveuse augmentée. En amplifiant un signal, il y a apparition de bruits parasites. On y trouverait une cause plausible des acouphènes et de l’hyperacousie (Møller 2016 ; Norena 2011).

Localisation

Le sujet de la localisation de l’acouphène est un point qui mérite d’être approfondi dans des entrevues futures – c’est une dimension psychoacoustique de l’acouphène qui a très peu été étudiée. Comment la personne acouphénique localise-t-elle un objet auditif qui n’a pas de source extérieure ? Partant du fait que l’acouphène peut être ressenti autour de la tête, dans l’oreille ou encore dans la tête (Hébert 2020 ; Searchfield et al. 2015), les auteurs d’une recherche sur la localisation acouphénique ont émis l’hypothèse que la perception spatiale de l’acouphène devait tout de même impliquer une certaine forme de répartition binaurale provenant des structures cérébrales impliquées dans la localisation (Searchfield et al. 2015). La position latérale de l’acouphène (gauche-droite ou bilatérale) mesurée par le processus d’appariement audiologique pourrait donc être poussée plus loin dans une perspective tridimensionnelle. Par l’implémentation d’un logiciel de spatialisation sonore 3D intégrant des différences de niveau interauriculaires (dni), des différences de temps interauriculaires (dti) et des filtres anatomiques hrtf dans l’appariement de l’acouphène, les auteurs ont prouvé que les participants étaient aptes à définir une localisation acouphénique plus précise qu’avec le processus de latéralisation standard, rendant l’appariement plus près de la réalité (voir figure 6).

Est-ce que la latéralisation du signal suffit à rendre la complexité des informations recueillies chez certains participants de notre étude ? Par exemple, P4 mentionne que lorsque son acouphène bas module lentement en amplitude, il ressent un mouvement vers l’intérieur de la tête. Une sensation en apparence similaire a été rapportée par P5 et la distorsion « comme une pression qui veut entrer dans sa tête ». Mentionnons aussi P3, qui entend certains sons semblant provenir « loin à l’extérieur de la tête », et P1, qui entend ses claquements somatosensoriels « au creux de l’oreille » et ses acouphènes aigus probablement subjectifs « autour de la tête ». L’ajout d’écouteurs audiométriques (les hda 300 de Sennheiser, par exemple) et d’un plugiciel de spatialisation 3D dans l’appareillage de synthèse permettrait sans doute de dégager plus de subtilités dans la localisation. Il serait aussi intéressant d’établir une corrélation entre localisation et gêne. Dans le cas de P1, les claquements ressentis « au creux de l’oreille » étaient beaucoup plus dérangeants pour lui.

Figure 6

Localisation tridimensionnelle de l’acouphène

Searchfield et al. 2015, p. 5

-> Voir la liste des figures

Intensité

Quels participants ressentent leurs acouphènes le plus fort en intensité ? Comme l’intensité n’a pas été mesurée, il est difficile de tirer des conclusions. On peut cependant affirmer que P4 et P8 sont les deux participants qui perçoivent les acouphènes les plus changeants et qui sont engagés dans une gestion quotidienne de leur condition et des stratégies proactives d’amélioration plus élaborées. L’importance du processus d’habituation à un portrait acouphénique semble ici se confirmer.

Conclusion

L’appariement audiologique typique du percept, centré sur l’acouphène dominant, le most troublesome tinnitus, ne peut pas rendre compte de la complexité des portraits acouphéniques à plusieurs sons qui sont présentés dans cette recherche. L’utilisation de l’audiomètre classique possède aussi de fortes limitations quant à la capacité de synthèse de l’acouphène (Kostek et Poremski 2013). À l’aide d’une méthode de synthèse qui inclut l’utilisation d’échantillons sonores, de filtres, modulateurs, ondes sonores, bruits multiples, effets et spatialisation 3D, et aussi en choisissant de travailler avec des participants musiciens aptes à décrire leurs acouphènes puisque possédant des notions musicales et des connaissances en acoustique, il est possible de créer des instantanés de réalités acouphéniques subjectives plus détaillés au niveau des attributs perceptifs qui sont reliés au contenu spectral, à l’enveloppe temporelle, à la modulation d‘amplitude, à la modulation de hauteur et à la localisation. Tous ces attributs, en plus de la hauteur et de l’intensité, sont des propriétés psychoacoustiques qui donnent forme à l’acouphène et représentent des indicateurs pouvant s’avérer révélateurs dans sa catégorisation.

Quelle autre utilité ces acouphènes synthétisés pourraient-ils trouver ? L’approche proposée pour la synthèse de portraits acouphéniques pourrait être appliquée, par exemple dans le cadre de certaines thérapies expérimentales qui utilisent les avatars d’acouphènes. La thérapie par la réalité virtuelle propose de contrôler et d’interagir avec l’avatar dans un environnement visuel et sonore immersif ; elle prend origine dans la similitude entre acouphènes et douleurs post-amputation. L’acouphène étant fortement associé à une perte auditive comme nous l’avons mentionné précédemment, un parallèle avec la douleur attribuée au phénomène du membre fantôme est plausible (sae Institute France 2011). À travers la manipulation et l’interaction d’un acouphène virtuel, par « agentivisation » sur le signal fantôme, on veut agir sur l’effet de plasticité cérébrale (ibid.). L’identification à l’avatar pour le participant requiert une certaine importance dans cette thérapie ; le processus d’appariement y est d’autant plus important (Bertet et al. 2013). La thérapie de recatégorisation sonore (recategorisation sound therapy) tente aussi une transformation progressive de l’acouphène au niveau perceptuel, un changement graduel, par entraînement (morphing), d’une perception d’un son-fantôme et virtuel à l’association de l’acouphène à un son du réel (Durai et al. 2021). Un avatar de l’acouphène du participant est créé et ensuite associé à un son environnemental du réel (cigales, vagues, pluie ou oiseaux, etc.). Ici aussi, l’appariement de l’avatar de l’acouphène se doit d’être crédible (ibid.).

D’éventuelles applications thérapeutiques d’une synthèse de portraits acouphéniques résident aussi possiblement dans la prise de conscience d’une réalité auditive dégénérescente que le processus de synthèse peut engendrer. Certains des participants à l’étude ont souligné l’aspect paradoxal de cette prise de conscience : en donnant une attention accrue à un acouphène dans le but de lui donner une forme tangible, ne risque-t-on pas d’augmenter la réactivité émotive face à l’acouphène ? Une amélioration des habitudes de protection auditive résultant d’une conscience accrue d’une condition acouphénique est cependant une conséquence positive et souhaitable. De plus, dans le cas spécifique des musiciens qui peuvent être hésitants à parler d’un problème d’acouphène pour diverses raisons, dont la gêne et l’embarras d’une condition qui pourrait faire douter de leur capacité à effectuer leur métier (Burns O’Connell et al. 2021 ; Jansen et al. 2009), la mise en forme dans le réel et le partage de portraits acouphéniques associés à des sentiments d’individualité et d’unicité pourraient faciliter un cheminement vers l’acceptation de la condition, et ultimement l’ouverture d’un dialogue sur la problématique des acouphènes chez les musiciens.