Corps de l’article

[…] l’univers visible était une illusion […] Les miroirs et la paternité sont abominables, parce qu’ils le multiplient et le divulguent.

Jorge Luis Borges (1941, p. 36)

Je n’ai pas envie de trimbaler mes caméras pour aller photographier le monde qui est déjà assez absurde en soi. Je ne vois pas pourquoi j’irais le multiplier.

Jean-Christophe Averty [1]

Le travail vidéographique de Jean-Christophe Averty peut être examiné à travers deux aspects : une dimension performative, où l’écriture se joue dans l’improvisation du direct, et une autre de l’ordre de la pré-vision, où l’écriture se fonde sur la planification. Ce texte limite son champ d’investigation à cette dernière dimension, qu’Averty (1976, p. 45) affirme être « la seule vocation réelle, profonde, de la télévision ». Il réunit un corpus [2] qui traverse l’oeuvre d’Averty — depuis ses débuts, d’abord avec l’émission jeunesse Martin et Martine (1953-1954), puis l’émission de variétés Les raisins verts (1963-1964), dont le scandale fit sa réputation, jusqu’à l’une de ses dernières créations, un documentaire sur l’auteur qui infuse toute son oeuvre, Alfred Jarry (1995). Ce corpus se fonde sur ses influences artistiques majeures : le théâtre avec Les verts pâturages (1964) et Ubu roi (1965), le roman avec Alice au pays des merveilles (1970) et la musique avec Fragson, un roi du caf’conc’ (1969), Melody Nelson (1971) et Dalida idéale (1984).

Pour comprendre les recherches novatrices d’Averty, il nous faudra d’abord esquisser quelques explications sur le fonctionnement de la technologie vidéo électronique [3]. La conception moderniste de l’art fait provenir de son matériau la signification et l’esthétique d’une oeuvre ; une telle perspective nous paraît essentielle pour saisir la démarche d’Averty. Examiner l’aspect formel et technique d’un médium permet de rendre compte des possibilités plastiques et des potentialités d’expression qui lui sont propres. Nous pensons qu’un outil fait plus qu’imposer des conditions pratiques ou des biais dans la création : son fonctionnement infiltre l’idée, infuse l’imagination, imprègne le geste, en un mot engendre un processus de pensée qui se matérialise en principe créatif. Ce postulat permettra de comprendre en quoi cette nouvelle technologie d’image a permis à des artistes comme Averty et Nam June Paik, ainsi qu’à leurs contemporains de l’âge électronique, d’élaborer une nouvelle forme audiovisuelle ; de comprendre, ainsi, en quoi cette forme audiovisuelle n’a que peu de chose à voir avec celle du cinéma. Averty (1976, p. 45) ne cesse de promouvoir la spécificité de son médium pour revendiquer l’exploration d’une écriture inédite et s’écarter radicalement du cinéma : « La télévision, c’est l’électronique. La création est là. Cela permet de faire de la poésie pure, d’inventer un monde ». Il n’y a en effet qu’un rapport d’apparence entre le cinéma et la vidéo : la réaction chimique de la lumière sur la pellicule est une trace, un dépôt conservatoire, et à ce titre le cinéma est un outil de fixation du réel ; tandis que la transformation de la lumière en impulsions électriques de l’image électronique est un flux : à ce titre la vidéo est un outil de transmission d’une visibilité. Pendant le demi-siècle qui a suivi la naissance de la vidéo, aucune technologie électronique n’a pu l’enregistrer [4].

Ainsi, le cinéma est une technique de représentation, la vidéo est une technologie de visualisation. L’émergence de la pensée cinématographique du montage est la conséquence d’une technique de fixation : l’enregistrement induit l’archive, qui impose une logique de sélection, d’amputation et de suture, de réagencement. La fixation du réel découpe l’espace-temps : le cinéma a dû inventer une écriture de la recomposition, construction d’un autre espace-temps — une représentation. En tant que technologie de transmission, la vidéo impose une autre écriture de l’espace-temps : le flux, dont la linéarité temporelle s’actualise indéfiniment, constitue un continuum.

Alors que le cinéma hérite de la chimie, la vidéo découle des caractéristiques de l’électricité et d’objets techniques de transmission comme le téléphone. Elle a muté en multiples procédés, utilisés à des fins diverses, dont l’usage se définit par l’accroissement de visibilité : de l’espace (vision à distance) et du temps (vision instantanée). Par exemple, dans les années 1940, la vidéo servit de système de guidage de missiles V2 (Bruch 1986) et, dès 1947, on anticipe son utilisation comme système de surveillance urbaine du crime [5]. Cette technologie n’impose aucune forme de réalisme : c’est la visibilité qui prime.

La télévision utilise la technologie vidéo pour transmettre ses émissions, mais à ses débuts elle emploie la pellicule pour les monter. Elle est encore entre cinéma et radio ; il faut attendre des artistes comme Averty pour que s’invente une véritable écriture télévisuelle, c’est-à-dire fondamentalement électronique.

L’image-machine

La technologie de l’image électronique fonctionne intégralement par le tube à rayonnement cathodique, dont le canon à électrons stimule l’écran, qui est une plaque de verre enduite d’une substance électroluminescente, le phosphore. Dans la caméra vidéo, un tube analyse la lumière captée sur une surface photosensible. Son rayon balaye cette surface par une analyse séquentielle, point par point, traçant des lignes dont l’ensemble est nommé trame par référence au tissage. Ce maillage est un processus de transduction : chaque point de lumière est converti en impulsion électrique, constituant le signal vidéo, dont la tension varie en adéquation avec le phénomène source lumineux, de noir (0,3 V) à blanc (1 V). Pour commander le balayage, le signal comporte aussi des informations codées de synchronisation (de 0 à 0,3 V). Il est transmis (par câble ou onde) au tube du moniteur récepteur qui, pour restituer l’image, recommence le balayage. Mais pour atteindre un seuil de fusion dans l’oeil sans scintillement, il divise l’image en deux demi-trames dont le clignotement intermittent crée l’illusion d’une image pleine. Il n’y a donc pas d’image en vidéo, seulement une apparition dans l’oeil — double illusion qui s’ajoute à celle du mouvement initiée par le cinéma.

En résumé, le signal vidéo est un flux électrique modulé entre deux valeurs de luminance (noir/blanc) et codé — d’où sa qualification de « composite [6] » (voir la figure 1).

Ainsi, Dominique Païni (2000, p. 167) définit la vidéo comme « machine à images autant qu’image-machine [7] » ; la machine produit une visibilité qui lui est propre et qui manifeste les caractéristiques de la machine. Également, alors que l’image cinématographique expulsée du projecteur peut s’incarner sur toute surface, en vidéo il n’y a pas de subjectile : l’image est consubstantielle à son support d’apparition. On doit alors penser son écriture à partir des spécificités de la machine. Or, le fonctionnement de celle-ci est dual : analyse (décomposition), puis reconstitution (recomposition par décomposition en deux trames). Ce procédé de construction par déconstruction compris par les artistes pionniers, qui travaillent naturellement la « physicalité » de cette image, devint un principe esthétique [8]. En tant que substance, on peut interférer avec elle (détériorer, parasiter…) ; en tant que processus, on peut intervenir sur ses étapes (dévier, neutraliser…). La machine est génératrice d’une pensée créatrice [9] ; ces artistes ont compris que la substance de la vidéo, c’est l’électricité, qu’on peut manipuler : « tu peux tordre une image de télévision comme si c’était de la matière » (Woody Vasulka, cité dans Mèredieu 2003, p. 56).

Fig. 1

Représentation du signal d’une mire de luminance

© Alexis Legac, Re:voir Vidéo

-> Voir la liste des figures

Au fond, l’oeuvre vidéo ne se résume pas à sa surface visible (l’image), mais englobe le dispositif qui la génère et l’appareillage qui l’incarne. À la fois objet et image, le moniteur constitue donc l’espace d’oeuvres vidéo ou d’émissions télévisuelles (cf. les moniteurs du journal télévisé exaltant un pouvoir panoptique). Le médium induit bien un geste et une écriture spécifiques : les particularités de l’image électronique la dirigent ainsi d’abord vers le champ des arts plastiques. En témoigne l’utilisation, dans des ouvrages techniques comme celui de François Luxereau (1985, p. 26), du terme « pinceau » pour décrire le rayon convergent (opposé au faisceau divergent du cinéma) : « Ce pinceau d’électrons est ensuite dévié horizontalement et verticalement ». Paik lui-même déclare dès 1965 que « de même que la technique du collage a remplacé la peinture à l’huile, le tube cathodique remplacera la toile [10] » ; et Florence de Mèredieu (2003, p. 60) écrit, à propos de la première oeuvre de Paik, réalisée en 1963, que « la vidéo apparaît […] d’emblée comme une nouvelle forme de peinture, électronique, lumineuse, fluide », tandis que Raymond Bellour (1990, p. 44) affirme : « Il y a dans l’image électronique une virtualité immense qui n’est pas sans analogie avec celle que détient depuis toujours la peinture. » L’opérabilité des machines et du signal produisent l’immédiateté de l’image électronique : l’acte vidéo rejoint la liaison geste-image-regard du peintre. Comme le rappelle Françoise Parfait (2001, p. 21), avant même les premières oeuvres d’art vidéo :

[…] des expériences de distorsion du signal ou d’utilisation plastique du medium avaient déjà été tentées par des réalisateurs de télévision comme Ernie Kovacs (dès 1957 aux États-Unis) et Jean-Christophe Averty (en France à la même époque), ou des artistes comme Lucio Fontana en 1952.

Averty travaille en étroite collaboration avec ses techniciens, l’électronicien Jacques Chenard et l’ingénieur Max Debrenne. Il fréquente leur laboratoire, recueille leurs conseils, expérimente avec eux ; ils inventent des techniques et des machines [11] pour réaliser ses « caprices picturaux [12] ». Ensemble, ils explorent la plasticité de l’image électronique, dont nous pouvons dégager trois cas : le trucage (imperceptible), l’effet (ostensible) et le phénomène (tel le bruit, ou le larsen).

Comprenant les particularités techniques de cette image, Averty (2001, p. 57) se réclame d’une démarche picturale : « Je suis peut-être un peintre refoulé. » Toutefois il n’envisage pas ces potentialités à des fins formalistes : imprégné de littérature, il poursuit la tradition du récit, tout en affirmant vouloir en imaginer une forme inédite, propre au médium : qui compose avec les propriétés électroniques autant qu’avec la réception du spectateur (écran petit, espace intime). Il utilise ainsi ces propriétés comme matières sémantiques ou iconographiques au service d’un système énonciatif. La manipulation est visible, revendiquée ; l’artifice adjoint à l’image une double monstration : il la maintient à distance, à sa place d’image (une non-réalité) et tout à la fois l’exalte (une réalité en soi). Ainsi, dans Ubu roi, ces propriétés électroniques sont utilisées avec une littéralité facétieuse : par exemple, le bruit vidéo appelé « neige » figure tout simplement… la neige qui tombe du ciel. Là se situe la spécificité de la démarche d’Averty : tandis que les artistes vidéastes envisagent les propriétés électroniques comme des matières plastiques, il les pense comme des matières d’expression. Il affirme l’invention d’une écriture essentiellement télévisuelle. Exemple d’un usage différencié : le vobulateur — générateur de courant qui permet de régler le téléviseur — peut perturber le signal, conférant un aspect ondulatoire à l’image ; Averty en use dès les années 1960 [13], par exemple pour donner un mouvement oscillant au décor des vagues de la mer des Verts pâturages, littéralement ondoyées. À la même époque (1963), Nam June Paik crée avec un procédé similaire son oeuvre fondatrice, 13 Distorted TV Sets, puis Sound Wave Input on Two TV Sets et Horizontal Egg Roll TV : il incorpore du signal sonore dans le signal vidéo, ce qui génère stries et trémulation de l’image, coulante et onduleuse. L’usage narratif du procédé par Averty diffère de l’usage formel qu’en fait Paik.

Fig. 2

Schéma (daté de 1998) de l’appareillage d’Horizontal Egg Roll TV (Nam June Paik, 1963).

-> Voir la liste des figures

Le signal vidéo est un écart (une tension) entre deux valeurs électriques de luminance. Averty choisit de composer avec cette propriété : il fait du noir et du blanc les deux pôles plastiques de son image, véritable revendication esthétique contre l’image télévisuelle tristement grise — une « bouillie grisâtre » (Averty 1976, p. 47). Le téléfilm Les verts pâturages est le « premier manifeste […] de la télévision électronique » (ibid., p. 81), acteurs noirs sur décors blancs ; Ubu roi parfait le procédé, personnages blancs sur fond noir. Le principe technique qui lui permettra d’achever ce paradigme pictural sera la possibilité de création par le signal même.

L’image-signal (rétroaction/incrustation)

La vidéo peut créer une image au moyen d’un signal, sans caméra. Averty exploite cette possibilité principalement par deux techniques : le larsen et l’incrustation. Le larsen est une boucle du signal entre émetteur et récepteur : soit optique (la caméra filme son propre moniteur), soit électrique (la connexion de sortie d’une machine sur sa propre entrée). Cette technique fut fondatrice des pratiques de Paik et des autres pionniers pour son potentiel esthétique autant que conceptuel (l’autoréflexivité, l’autopoïèse) ; elle est devenue une figure de style [14]. Le larsen n’est pas une perduration (tel l’écho qui évolue en déperdition), mais une rétroaction, qui s’amplifie indéfiniment. Dans ce circuit fermé, tout événement électrique ou optique est démultiplié et intensifié. Seule l’électronique peut produire un larsen, puisque son principe relève à la fois du temps (direct) et d’une phénoménalité. Là où les artistes vidéastes explorent ce phénomène comme forme de peinture électronique, Averty l’utilise à nouveau comme moyen d’expression : il figure ainsi les flammes du buisson ardent des Verts pâturages. D’abord parce que la fluidité de mouvement de ce flux lumineux, proche d’une turbulence liquide, rend sensible l’ignition surnaturelle de ce feu. Ensuite parce que le larsen est une épiphanie, qui intensifie une lueur en un flamboiement absolu : il disloque l’image sans la détruire [15] de la même façon que le feu biblique brûle sans consumer l’arbuste. Cette figure technique permet à Averty de manifester ainsi visuellement et littéralement la théophanie.

L’autre potentialité esthétique de l’électronique est la fusion des signaux, grâce à la régie qui peut synchroniser des balayages différents. Cette fonction est investie comme écriture : mixage, volet, médaillon, incrustation. L’incrustation n’est pas une superposition d’images (comme la surimpression cinématographique), mais la fusion de trois signaux en un seul :

  1. signal de découpe (key) : une image très contrastée, par exemple un stylo noir sur une feuille blanche ; le stylo constitue une « forme-trou » qu’on pourra remplir ;

  2. signal de fond (background) : l’environnement qui complète le cadre autour du signal de découpe ;

  3. signal de remplissage (fill) : le motif qui s’insère dans le « trou » formé par la découpe.

Le signal vidéo est composé de deux pôles noir/blanc : l’incrustation est exactement l’écriture qu’il peut produire, car le contraste extrême est la condition technique de la découpe. La coalescence des signaux est en fait une commande de variation du rayonnement : le pinceau change brutalement de valeur électrique lorsqu’il balaye la forme de découpe. Cette propriété de modulation du rayon (variation de la « dose » d’électrons pour chaque point) définit la muabilité de l’image électronique.

Ce procédé permet à Averty d’achever son écriture vidéographique : d’abord, assumer son approche chromatique faite de noir intense et de blanc ; ensuite, cette dichotomie noir/blanc, en tant que vide/présence, lui permet de penser sa mise en scène comme « mise en page », composition qui doit au graphisme, destituant l’image pleine au profit d’un éclatement visuel. Il réforme l’arrière-plan, qui devient une surface disponible où tout élément est libre de s’intégrer sans contrainte de coordonnée spatiale. L’assimilation d’éléments hétérogènes rompt avec les lois physiques : « ainsi s’élabore un espace-temps relatif où les dimensions, la consistance et les vitesses des choses sont éminemment variables » (Duguet 1991, p. 98). Oeuvre intégralement réalisée par incrustations, Ubu roi marque une révolution dans la réalisation télévisuelle : un espace abstrait, dont le principe compositionnel est l’incrustation dans l’incrustation. Cette imbrication se manifeste par des sauts, des escamotages de personnages, un écran fragmenté (split screen), des changements de dimensions d’objets, une multitude de plans dans le même cadre… comme dans Alice au pays des merveilles, où deux personnages se répondent par des champs/contrechamps incrustés sur un fond immuable. L’incrustation, ici pivot, et qui peut être tour à tour évidage ou remplissage, métamorphose l’image. Cette transgression des règles de perception et des logiques de représentation réarchitecture le regard, en convoquant une lecture autant qu’une vision : cette « mise en page » sollicite le spectateur, qui doit parcourir ces éléments, les lier en un sens totalisant tout en observant leurs autonomies respectives.

Il s’agit moins d’incruster une image dans une autre que d’élaborer une image composite, constituée de parties hétérogènes dont aucune ne peut prétendre à une quelconque prééminence [16]. Chaque cadre a une structure propre, réalisée par la disposition de plusieurs couches : Averty (1976, p. 44) souligne que son écriture véritablement télévisuelle a pu émerger grâce à l’invention de l’enregistreur sur bande magnétique avant lequel, dit-il, « mon instrument n’était pas [encore] créé ». Il découvre en 1961 l’Ampex, qui ne sert alors qu’à conserver les émissions : Averty et Debrenne détournent cet usage pour réaliser des couches d’incrustations en enregistrant, génération après génération, les différentes parties. Averty (cité dans Duguet 1991, p. 93) revendique sa réalisation comme étant du graphisme :

Ce que je fais se rapproche beaucoup plus de l’imprimerie que de toute autre forme d’expression parce que j’imprime des images par plusieurs passages, comme on imprime les couleurs par quadrichromie…

Il s’agit là d’une analogie et non d’une équivalence technique — car l’écran vidéo fonctionne par synthèse additive des couleurs RVB, tandis que la quadrichromie fonctionne par synthèse soustractive des couleurs CMJN. Averty évoque autre chose que le traitement colorimétrique [17], puisque sa technique de passages de couches remonte à l’époque du noir et blanc : « […] mon travail, dit-il en 1977, consiste à imprimer, sur des décors […] ou des maquettes, des personnages vivants, en plusieurs couches [18] ». Il fait ici référence à l’élaboration d’un espace unitaire à partir d’une division des éléments et de leur apposition par opérations successives. La comparaison avec une technique d’impression serait plutôt à chercher du côté de la sérigraphie, qui applique séparément sur le support un passage de peinture pour chaque motif ou couleur (comme un pochoir). L’ensemble est un assemblage de plusieurs passages. Une « écriture-aplats » qu’Averty justifie par la taille réduite de l’écran, laquelle empêche la profusion de détails dans la profondeur — que permet l’écran cinéma — et en impose donc l’étalement à plat comme sur une page. Cette écriture issue de l’impression coïncide avec le médium ; comme le souligne Jacques Aumont (1990, p. 135), « l’image vidéo est à la fois imprimée et projetée » par le pinceau électronique — dont le balayage ressemble à celui de la racle de la sérigraphie : l’un et l’autre construisent l’image par itération d’un mouvement vertical. Même la définition de l’écran — qui évoquait pour Marshall McLuhan (1963) la peinture pointilliste — renvoie au tramage des comic strips (qui ont tant influencé Averty), dont l’impression grossière fait apparaître les points. En outre, le phosphore des tubes des caméras peut imprimer des traînées de rémanence (parfois indélébiles) ; Averty s’en sert comme d’un pinceau dans Melody Nelson, en mixant ces sillages de couleurs avec les images des protagonistes [19]. Ces strates en transparences indiscernables rendent l’image illisible ; l’enjeu n’est plus la figuration, mais la figurabilité : le mixage énonce ici la capacité du médium vidéo à manifester les mouvements du psychisme. La fusion des signaux matérialise la confusion des pensées du narrateur, comme la labilité de la rémanence renvoie à celle de ses émotions. Ce nuage d’images, rouge comme les cheveux de Melody, évoque tour à tour la rêverie, le désir, la mémoire. Ce brouillage-brouillard révèle aussi la possibilité de leur superposition. L’assertion de Chris Marker dans Sans soleil (1985) — « la matière électronique est la seule qui puisse traiter le sentiment, la mémoire et l’imagination » — prend corps.

Fig. 3 et 4

« Deux pages du cahier de travail de J.-C. Averty » reproduites dans l’article de Gérard Blanchard (1969, p. 63-64).

-> Voir la liste des figures

Ce rapport du médium au psychisme, Averty l’a hérité du surréalisme [20], de même que la collection et le recyclage d’images de toutes sortes. Il s’inspire des arts visuels, notamment de l’art cinétique, dont il partage l’idée de dynamiser/déstabiliser le regard. Il n’en conserve que l’effet optique, souvent pour remplir ses fonds de répétitions et d’inversions de motifs (voir la figure 4), comme avec les « tournettes », mécanismes inspirés des chromatropes (disques de lanterne magique qui produisent des vues kaléidoscopiques en faisant tourner deux rosaces inversées — voir la figure 5). L’effet n’est jamais artifice, le fond est un élément qui prévaut parfois : la figure y est insérée pour se voir conférer une densité ou une signification. C’est le cas de Fragson, par exemple, qui déambule incrusté sur des photos d’archives de Paris : ce fond n’a pas pour fonction de décrire un espace, mais plutôt de dépeindre une ambiance ; inversement, le personnage justifie le remploi didactique de pièces d’archives dans un univers fictionnel : « Avec Fragson, j’ai réalisé totalement le décor dessiné, le décor document, l’intégration de personnages vivants à des reliques ou à des restes opimes pour essayer de créer une superréalité » (Averty 1976, p. 143).

Incrustation et mixage relèvent de la capacité de la régie vidéo à synchroniser et à intriquer plusieurs signaux. Dès lors, la logique du cinéma — coupure-alternance des images — est facultative : les images sont toutes unies, on peut imaginer librement la façon de les faire apparaître. Cette technique offre à Averty l’occasion d’une expression graphique fondée sur la « synthèse », comme un montage dans le plan — et non le raccord de divers plans. Cette synthèse est influencée par celle de la bande dessinée, du collage, de l’héraldique ou du « cinéma muet » (Averty 1976, p. 172). On peut aussi supposer que cette pensée d’une image-strates, coïncidant étonnamment avec l’entrelacement des trames du tube, découle — au moins intuitivement — du médium. L’écran ainsi considéré devient un canevas, qui permet à Averty de travailler la planéité, de penser son image comme une tapisserie et ainsi de rompre avec le réalisme — qu’il exècre — et avec le cinéma.

Fig. 5

Chromatrope (collection privée)

-> Voir la liste des figures

Cinématographie/vidéographie

Depuis que la vidéo peut enregistrer son image, elle semble similaire au cinéma ; il n’y a pourtant qu’un rapport d’apparences entre ces techniques. Averty (1976, p. 49) a l’intuition de la dialectique essentielle de l’image électronique, écartée entre deux potentialités : « soit le cinéma de reportage, le cinéma-vérité, soit la caméra électronique » ; c’est-à-dire la saisie du réel contre l’image artificielle — autre que la représentation. Les avant-gardes avaient ouvert des voies demeurées pourtant des cas d’exceptions cinématographiques : l’image électronique, à travers ses propriétés de muabilité, permet de les incarner naturellement. Comme le souligne Raymond Bellour (1990, p. 49) : « La vidéo relance […] une utopie qui a accompagné le cinéma dès sa naissance. L’utopie d’une écriture inouïe, justement, jamais vue ni entendue. »

La télévision délie tout ce que le cinéma instaure comme tabou : faux raccord, regard caméra, micro dans le champ… sont des éléments librement manifestés. Averty, selon Anne-Marie Duguet (2002, p. 101), exhibe ce « refoulé technique » : le sketch « Un jeu bête et méchant » des Raisins verts systématise un téléviseur en abyme maltraité par le Professeur Choron, et présenté comme une boîte qu’on peut remplir ou dont des objets peuvent sortir comme d’un chapeau magique. Averty commence sa carrière en coréalisant l’émission de marionnettes Martin et Martine ; il comprend alors que le téléviseur est exactement cet espace restreint du théâtre de marionnettes (il pensera monter Ubu roi en marionnettes [21]), qui cache des apparitions émergeant et s’immergeant sans fin : une boîte, boîte à images, du fond de laquelle surgissent des événements créant des visions. L’image vidéo est une illusion (de mouvement, et aussi d’unité puisqu’elle est vibration pulsatile de deux trames intermittentes) : la télévision est une boîte à mirages.

Cet écran-boîte fait converger le regard, niant la notion cinématographique de champ qui « appelle toujours son contre-champ » (Parfait 2001, p. 69) : la vidéo, favorisant la visibilité par-dessus tout, ne privilégie pas le rapport champ/contre-champ, mais au contraire une monstration totale et immédiate. Averty compose avec ce principe par la synthèse de plusieurs champs dans le cadre, comme sur une planche de BD : « L’esthétique de la bande dessinée, c’est le découpage, la séparation, en recherchant toujours le moment préférentiel et non la notion crétinisante de raccord [22]. » Or, si on élimine le raccord, c’est toute l’architecture du montage qui est remise en cause : les relations entre champ et hors-champ disparaissent. Cette notion de champ n’est plus valide, puisque tout peut transparaître par mixage, apparaître par incrustation, de l’intérieur même d’une image ou d’une figure : « […] le hors-champ, qu’il vaut mieux appeler le hors-cadre […] n’a plus d’existence, il est partout, aussi bien devant et derrière l’image, dans son épaisseur même » (Duguet 1991, p. 88-89). À travers ce que Jean-Paul Fargier (1984, p. 7) n’hésitera pas à appeler une « image sans hors-champ », Averty conçoit l’écran du téléviseur — qui, parce qu’il n’a pas les dimensions de celui du cinéma, ne permet pas de varier et de confronter les échelles de plans — comme un tableau. L’espace immense flottant dans le néant de la salle obscure déploie le film autour du spectateur (son, hors-champ…), mais le petit carré placé contre le mur d’une pièce resserre la perception vers l’apparition. Ce cadre tableau-palimpseste forme un autre regard, qui concentre l’attention : il serait intéressant de réévaluer, à propos du téléviseur, la formule d’André Bazin (1959, p. 128) opposant le cadre du cinéma « centrifuge » (qui extirpe le regard dans le hors-champ) au cadre de la peinture « centripète » (qui fait converger le regard).

Mais la taille de cet écran invalide aussi la potentialité perspectiviste : « l’écran de télévision n’avait pas […] de profondeur de champ » (Averty 2001, p. 55). Cette contrainte oblige à créer d’autres dimensions de l’image [23], que l’incrustation permet : à propos de la mère Ubu incrustée dans une vignette au bas du cadre, regardant les juges incrustés plus haut (voir la figure 3), Averty [24] dit qu’en réalité elle regarde le spectateur, ce qui confère au dispositif « une troisième dimension d’espace ». Il n’y a pas de champ en vidéo, mais des pans de dimensions (visuelles, spatiales, temporelles) qui émergent, s’immergent et s’interpénètrent — potentiellement dans tout espace du cadre.

Toutes ces conditions font que la télévision ne peut composer une représentation de l’espace comme le cinéma. Elle s’affranchit alors de l’impératif de représentation ; elle vise soit la simulation — par le mixage, en direct —, soit la monstration — par le montage. Ce « montage » ne procède pas comme le montage cinématographique. La notion de plan est parfois invalide (images abstraites, incrustations dissociées…) ; si la télévision utilise le plan inventé par le cinéma, elle n’use pas de la même échelle [25] ni ne lui confère la même valeur. Le montage du film de cinéma est succession : l’ensemble requiert la chronologie des plans qui s’enchaînent — se lient, autrement dit font chaîne — en se succédant — c’est-à-dire lèguent un sens au plan suivant. Ils entrent en interrelation dans l’esprit du spectateur pour produire une signifiance — y compris dans les absences qu’ils créent ou soulignent. Le montage de télévision [26] est accumulation : chaque plan est fabriqué pour célébrer une visibilité ; sans hors-champ, il exalte une présence (à la façon d’un diaporama). À la télévision, les plans sont traités comme des inserts : interchangeables, équivalents — tous aussi importants qu’anecdotiques. Ils n’interagissent pas, ils se remplacent : le lien se fait par le continuum ; sans raccord, les rapports se créent par la commutativité de leur addition. De sorte que la télévision ne s’embarrasse pas non plus de narration :

La télévision obligeait à faire une synthèse dans l’image : on pouvait tout montrer en même temps, oubliant les panoramiques, les travellings, les gros plans, la succession narrative et la dialectique du cinéma qui consiste à faire : plan, gros plan, rantanplan […]

Averty 2001, p. 55 ; c’est moi qui souligne

Averty (1976, p. 98) affirme ainsi travailler contre le cinéma (« j’ai fait de la télévision électronique pour faire échapper la télévision au théâtre et au cinéma ») et contre tout ce dont celui-ci est l’héritier : le réalisme, le paradigme imitatif de la Renaissance fondé sur la géométrie euclidienne, qui oblige au placement du regardeur (centré, éloigné) pour les effets de perspective. Averty voit que la télévision n’y est pas assujettie, dans la mesure où le spectateur « domine » l’écran petit et proche. Il veut composer, dit-il [27], « une espèce de fresque, où tout est résumé, un peu comme les miniatures du Moyen Âge, où tout est en hauteur… de bas en haut, l’histoire se raconte… ». Il revendique sa référence à l’héraldique, éliminant tout relief de l’image et tout rapport à la perspective, s’inspirant librement de l’art linéaire médiéval ou antique, par exemple de l’art égyptien, où tout est construit sur un seul plan : au début de Dalida idéale, il montre la chanteuse dupliquée/incrustée à des échelles différentes dans une fausse profondeur plane, entourée de hiéroglyphes et de peintures de l’Égypte antique. Les Égyptiens (dont les figures se détachaient d’un fond nié) visaient des effets de silhouette et privilégiaient la vision de près — tout comme le téléviseur : « même le relief et la peinture murale sont conçus en fonction de la vision rapprochée ; […] ils doivent eux aussi être regardés de près si l’on veut apprécier à sa juste valeur la réussite de la compétition avec la nature » (Riegl 1899, p. 126). La finalité n’est donc pas de re-produire, d’imiter le monde, mais d’en produire un autre ; en cela Averty est en compétition avec la nature, pour lui surajouter une valeur esthétique — et non la rendre visible ou crédible. Même lorsque la couleur conquiert le médium, il l’utilise selon une conception toute médiévale : non pas pour ses effets de teinte, mais pour obtenir, par ses valeurs de saturation, des rapports de contraste. Son goût pour le blason vient aussi d’un désir de combinatoire : fabriquer un complexe de signes, qu’il faut saisir [28].

Cette « superréalité créée par l’électronique » (Averty 1976, p. 172) traduit une compétition esthétique, en tant qu’insurrection consciente, contre le monde : contre la bêtise humaine autant que l’absurdité de l’existence. À propos des Raisins verts, il confie : « c’était magnifier la bêtise pour mieux la dénoncer » (ibid., p. 62) ; et il ajoute, à propos de la séquence où une moulinette (qui deviendra son blason) hache un bébé : « […] cette moulinette, ce broyage, ce pâté, c’était une attaque contre la condition faite à la vie […] il y a une métaphysique de la moulinette ! » (ibid., p. 64-65.) Ses fantaisies grotesques et ses bricolages optiques sont loin d’être de simples caprices subversifs. L’utilisation de l’artifice chez Averty tient de la rhétorique : faire des « jeux d’images » comme on fait des jeux de mots, pour ouvrir, dit-il [29], « des dimensions nouvelles dans l’expression même, grâce au trucage ». L’humour est avant tout visuel, tout comme chez Tex Avery qui intégra le non-sens paroxysmique au dessin animé. Un trait hérité de Lewis Carroll (qu’Averty admire), avec des mises en abyme potaches (monstration de la pellicule, spectateur en ombre chinoise…) comme Averty les affectionne. Avery et Averty utilisent tous deux un humour visuel absurde et corrosif, qui correspond à leur médium [30].

Mais la réelle spécificité de l’image électronique est le rapport au temps : toute opération vidéo est caractérisée par l’instantanéité. Manipulation et transmission se font par l’immédiateté du flux. En direct, le mixage des images diffère du montage cinéma : nulle possibilité d’ellipse. Le mixage est l’hybridation ou la commutation de sources dans un continuum temporel. Que les images soient montées et incrustées a posteriori ou mixées en direct revient au même : Averty promeut la synthèse pour « tout montrer en même temps ». Il faut en conclure que le direct — principe historiquement fondateur du médium vidéo —, autrement dit la simultanéité, induit une pensée de l’image que Gérard Blanchard (1969, p. 65) appelle « simultanéisme » ; les images fusionnées valent par leur coexistence synchronique dans le même espace-temps. Par là, elles affirment une équivalence, abolissant la hiérarchie des valeurs narratives des plans du cinéma.

L’instantanéité du signal permet une écriture-flux : par exemple, dans Dalida idéale, Averty filme une chanson en flux continu : en un seul plan-séquence, variant l’échelle de plan uniquement grâce au zoom, dont les mouvements sont synchronisés avec la musique. Rien ne rompt l’harmonie de cette image dont les valeurs de taille changent comme par un montage mais imperceptiblement, avec une fluidité inédite et musicale. Aucun rythme-coupure ne brise la perception de cette image unitaire, qui délicatement par l’optique se module, se moule, devient même la fluctuation de l’émotion de la chanteuse. Une écriture fluidité-fluctuation. Dans Ubu roi, les caméras sont traitées en direct pour constituer les couches de chaque plan ; cette approche performative est primordiale chez Averty, qui (lui-même musicien) faisait des captations de concerts de jazz — dans le cadre d’émissions qu’il a toujours considérées, « sur le plan de l’expression et de la mise en scène », comme « tout aussi importantes » que les autres (Averty 1976, p. 68). La correspondance instrument de musique / régie vidéo est techniquement évidente : immédiateté et opérabilité de l’image imposent jouabilité, rythme, modulation, improvisation. La nature du signal permet de voir et de contrôler l’image sans latence. Cette notion de création dans l’instant, d’écriture du flux, n’est pas cinématographique, mais musicale. Comme l’a fait remarquer Bill Viola (cité dans Mèredieu 2003, p. 61), « composer des images en vidéo, c’est la même chose que composer de la musique ; dans les deux cas, on ordonne des événements selon un temps précis ».

Anne-Marie Duguet (1991, p. 94) rappelle que l’autre dimension de l’image vidéo, c’est la dimension temporelle : le découpage peut se faire par la vitesse (de perception, de représentation), qui détermine l’image et crée ce que Paul Virilio appelle une « profondeur de temps ». Virilio (1986) décrit la vidéo comme un présent éternel, une « image sans fin » :

[…] une « forme image » sans autre finalité que l’incessante poursuite du temps réel, d’un temps qui […] s’expose, qui fait surface, ou plutôt interface, à la lumière de la vitesse des particules élémentaires…

La vidéo peut composer le temps avec une virtualité impossible au cinéma ; Gilles Deleuze (1983, p. 47) résume ainsi l’écriture cinématographique : « Le montage, c’est la composition, l’agencement des images-mouvement comme constituant une image indirecte du temps. » Le cinéma construit des rapports de temps, en élabore ainsi une représentation, tandis que la vidéo est du temps. Le temps direct du flux transcrit une sorte de présent-présence qui relève non pas de la représentation, mais de la simulation. Si bien que dans la création vidéo cette propriété devient un principe : l’idée de manier le temps inspire l’acte vidéo.

La singularité de l’image électronique est de penser l’espace en fonction du temps : « Le temps en arrive alors à prendre le pas sur l’espace » (Mèredieu 2003, p. 78). Ainsi, à ce présent infini on peut joindre d’autres temps, différenciés comme au cinéma : c’est ce qu’Averty fait dans Alfred Jarry. Tout le vidéogramme est composé de deux images hybridées ensemble : prises de vues du Rennes contemporain, sur lesquelles viennent se greffer des images du passé (archives textes, photos, gravures…). Une intrication, par une double écriture mixage/incrustation. Strates et simultanéités : des temps présentés, équivalents, comme une superposition quantique [31]. La vidéo est un art du temps : direct, infini, simultané, superposé.

L’esthétique d’Averty est une esthétique de l’intrication (mixage ou insertion), qui traite des espaces et des temps hétérogènes. Cette composition, que Philippe Dubois appelle « montage vertical [32] », est proche de la pratique dadaïste du collage — davantage que de celle du montage. Le montage cinéma est fondé sur l’ellipse (même « inframince »), c’est-à-dire sur la soustraction. Il expose ainsi l’interstice, l’absence. Le collage au contraire est fondé sur l’adjonction, l’assemblage, c’est-à-dire l’addition. Il est exhibition, présence. Chez Averty l’intrication procède aussi d’une monstration expansive de ses éléments : hétérogènes, leur collure est révélée — proclamée. Fond et figure sont parfois indissociés au profit d’un aplat composite. L’incrustation et le collage s’affirment en tant qu’image manipulée : sur les dadaïstes et leurs collages, Marc Dachy (2006, p. 280) écrit qu’ils « ne mettent pas seulement en relief des procédures formelles, mais exaltent la hardiesse de leur attitude dans l’art et dans la vie. L’oeuvre […] n’affirme pas seulement des formes mais également l’énergie transformatrice qu’elle met en jeu ». Chez Averty, l’intrication manifeste l’énergie de son médium et de l’époque [33] : énergie transformatrice de l’électron, de la vitesse, de la métamorphose… utopie d’un nouvel espace-temps. Ainsi, comme le collage, l’intrication exprime tout à la fois l’assomption de l’image, du médium qui la génère et du geste qui l’invente.

L’intrication diffère du collage par le caractère temporel de l’image vidéo : sa genèse est procès. L’agitation continuelle des électrons est certes une « menace constante de désintégration des figures » (Duguet 1991, p. 94), mais elle est surtout un potentiel de changement permanent, une virtualité et une puissance de méta-morphose : la nature de l’image électronique est sa muabilité. Duguet (p. 86-88) décrit ainsi cette faculté : « Dans n’importe quel point d’une image une autre peut apparaître. » Aussi le regardeur n’est-il jamais assuré ni de l’image ni de sa propre vision. Chaque point de l’image peut en féconder un autre, être pivot, masque, cache, trou, d’où émerge une forme qui la remplace, l’entrelace, la complète, la métamorphose ou la détruit. Il n’y a plus d’origine ni de fin ; il y a à la fois la germination d’une figure et son dévorement.

Tout dans cette technique offre à Averty (1976, p. 63-64) une possibilité d’expression de sa révolte métaphysique, contre la condition de la vie :

En faisant cette « moulinette » j’étais conscient de m’attaquer à Dieu. […] je mettais à découvert l’entre-dévorement qui est le fondement même de la vie. […] La vie est absurde.

L’intrication — là où il n’y a ni dessous ni dessus —, ce sont deux images qui à la fois se fécondent, à la fois se détruisent. Une conjonction paradoxale de l’énergie vitale de la copulation et du cannibalisme de l’entre-dévorement.

*

Averty a fait davantage que créer un « langage télévisuel », il a ouvert des dimensions. Son oeuvre prouve que la télévision peut construire un espace de pensée à travers son médium. En cela, Averty réinvente les utopies qui furent celles des cinémas d’avant-garde : tendre au pictural, défaire la représentation (Fernand Léger, Hans Richter), produire des relations osmotiques avec la musique (les symphonies visuelles de Germaine Dulac, Léopold Survage), utiliser la vitesse et le mouvement pour réformer le regard (Henri Chomette, Walter Ruttmann), exhiber des synthèses et des simultanéités (la polyvision d’Abel Gance — qu’il fréquente —, la cinématographie futuriste), des interpénétrations d’images (Dziga Vertov, Len Lye) et des animations colorées (Oskar Fischinger, Norman McLaren), etc. L’image électronique réalise ce que ce cinéma espérait : une refonte de son écriture.

La technologie de visibilité accrue qu’est la vidéo manifeste une utopie, le fantasme de la vision absolue : espace aboli par la vision à distance, temps condensé de visualisation sans latence. Ce fantasme technique (de communication/contrôle/connaissance) est le symptôme d’une société et d’une époque qui fabriquent partout du visible, imposent une vérité du visible — ce « vérisme à tout prix » que dénonce Averty (1976, p. 150) —, en fondant la preuve d’existence de toute chose sur son degré de visibilité. Cette pensée uscopique [34] résonne chez Averty et les pionniers de l’art vidéo : l’électron comme paradigme de modernité, sa vitesse comme instantanéité (transmission/opérabilité), sa nature énergétique comme muabilité, promesse d’une infinie méta-morphose. L’apparition d’un nouvel espace-temps ou, à tout le moins, d’une nouvelle appréhension de l’espace-temps, fondée sur la visualisation simultanée. L’abolition ou, à tout le moins, la réévaluation de la notion de représentation, réformant l’expérience d’un médium visuel. Muabilité, simultanéité, synthèse, Tout fantasmatique de l’apparition ; en un mot : une nouvelle possibilité de création.

La démarche incessamment autoréflexive d’Averty a jeté les bases et posé les jalons d’une véritable vidéographie, traversée par l’influence d’arts hétérogènes — bande dessinée, littérature, théâtre, danse —, à la confluence de l’expressivité du cinéma, de la plasticité de la peinture et de la temporalité de la musique. L’esthétique composite d’Averty est devenue la norme des technologies de vision : monstration faste de la scénographie télévisuelle (champ total alliant effets optiques disparates et étalage de signes), images saturées d’incrustations (bandeaux, titres, vignettes) pour actualiser l’attention ; jeux vidéo proposant une image opérable aux fonctions multiples affichées en strates ; dispositifs de visualisation (GPS, réalité mixte) qui imposent un espace visible, toujours plus segmenté, de signes surajoutés et de flux coexistants. Averty voulait créer un monde : c’est le monde lui-même qui est désormais rempli de cadres, d’apparitions, de transformations, de visibilités simultanées, intégrés/incrustés dans chaque pan de la perception. Images-écrans multiples, surfaces-apparences protéiformes, boîtes à mirages, les avatars des visions d’Averty sont partout. Ses investigations plastiques, son esthétique de l’intrication et sa pensée de la synthèse ont fait plus qu’inventer un système d’expression : elles ont préfiguré exactement le devenir de l’image-machine.