Corps de l’article

En matière de cinéma parlant, la situation historique de l’industrie japonaise est particulière. Si le premier film japonais sonore date de 1931 — Madame et mon épouse (Madamu to nyōbō) de Gosho Heinosuke [1] —, la nouvelle technologie ne s’impose vraiment au pays de l’origine du soleil qu’à compter du mitan des années 1930, soit avec près d’une décennie de retard sur l’Occident. Et encore faut-il attendre 1939 pour que l’implantation, l’usage et la maîtrise de ces techniques y soient totaux et définitifs. Jusqu’en 1935, le cinéma japonais est majoritairement muet.

Caractéristique du spectacle cinématographique japonais muet : le benshi, sorte de bonimenteur décrivant et expliquant les films. Le benshi est, mutatis mutandis, un orateur. Le mot japonais ne dit rien de plus, et en particulier rien de la performance, à la fois orale et scénique, spécifiquement attachée au contexte cinématographique. On préférera donc le terme plus précis, mais moins établi chez nous, de katsuben : mot-valise composé de benshi et de katsudō shashin (les « photographies animées »), que l’on pourrait rendre en français par « commentateur de films ». Le film était ce que l’on voyait sur l’écran plus ce que l’on entendait venant du katsuben. Voici comment Sawato Midori, katsuben contemporaine, définit son métier :

A person who works with the medium of silent films, sometimes as a narrator, sometimes as a voiceover for on-screen characters, and explains the characters and the story in order to better communicate the essence of a film to the audience [2].

Le travail du katsuben consiste à voir un film (parfois une seule fois), à écrire un texte a posteriori à partir des images, à le répéter un certain nombre de fois pour le faire correspondre le plus possible au rythme du film et aux événements montrés à l’écran avant de le déclamer devant les spectateurs, en y ajoutant la lecture à voix haute des quelques intertitres. On sait que la corporation des katsuben combattit longtemps, avec l’accord initial des distributeurs, le parlant. Il arrivait ainsi que la bande-son des films fût purement et simplement « passée sous silence », pour que le katsuben pût continuer de commenter les films comme il l’avait toujours fait jusque-là. Dans d’autres cas, on en diminuait simplement le volume, de sorte que les spectateurs pussent toutefois l’entendre, tandis que le katsuben parlait par-dessus.

Les prolongements du katsuben au-delà du strict muet, en tant que personne physique (comme la reconversion de certains katsuben dans l’actorat ou le kamishibai), que nous qualifierons de continus, ont fait l’objet d’analyses précises (Anderson 1992, p. 290-295). Mais la fonction du katsuben peut se voir également « incorporée » dans le monde fictionnel du film, déconnectée de sa personne physique (extra-filmique), notamment sous les espèces de la voix over très présente dans le cinéma japonais parlant (le dessin animé) ou du rôle interprétatif dévolu à un ou des personnages secondaires, ainsi qu’on peut le voir dans La forteresse cachée (Kakushi toride no san akunin, 1958) de Kurosawa Akira ou Le mont Fuji et la lance ensanglantée (Chiyari Fuji, 1955) d’Uchida Tomu. Après être revenu, dans un premier temps, sur la situation historique du katsuben ainsi que sur les débats ayant trait à sa figure, nous nous intéresserons spécifiquement, avec l’arrivée du parlant, avec la prise de conscience de ce que cette technologie allait en effet changer radicalement (qui précéda de quatre ou cinq ans la réalisation massive des films sonores), à un troisième type de déplacement du katsuben, particulièrement dans quelques longs métrages d’Ozu Yasujirō : ce qui nous apparaît comme des migrations discontinues (désincarnées) de la fonction du katsuben trouvant désormais refuge, au prix de quelques inflexions, moins survivance que transhumance, dans les films, par des stratégies originales d’images et de sons.

*

Partons de quelques caricatures ou illustrations de presse d’époque montrant l’organisation du dispositif du spectacle cinématographique japonais muet, depuis la présentation des premiers films occidentaux en 1896. Qu’y verra-t-on ? Des spectateurs assis, un écran, un film projeté, le gadukan [3] ; et, sur la gauche ou la droite, dans un espace spécialement aménagé, comme en balcon (dans les salles institutionnelles) ou sur une estrade (dans des lieux plus informels), debout ou assis, lui-même visiblement en représentation, à la même hauteur que l’image, face au public : voici le katsuben. Son rôle est si essentiel que le cinéma japonais est alors tout bonnement inconcevable sans celui qui non seulement a pour vocation de relever la présentation des images (il y a peu d’intertitres dans le cinéma japonais, et ils n’apparaissent que tardivement), mais va également petit à petit, du fait de sa popularité, y substituer son spectacle idiomatique : détournant fréquemment l’attention spectatorielle du film, s’entremettant entre la salle et les images, devenant parfois plus fameux et populaire que les acteurs eux-mêmes [4], allant jusqu’à exiger la révision de certains scénarios avant les tournages [5], enjeu de passions et de rivalités (il existait des « concours » — taikai — et un « classement » — banzuke — des katsuben) que l’on a peine à concevoir en Occident où rien de comparable n’a vu le jour.

Ce phénomène s’explique, au tout début de l’histoire du cinéma japonais, encore à peu près comme pour le conférencier occidental, du fait que les films étaient courts. On appelle eiga setsumei l’activité du katsuben, littéralement « l’explication de films ». Le setsumei désigne donc d’abord une simple présentation avant la projection qui prendra rapidement la forme qui nous occupe ici. Le katsuben, après avoir présenté le mécanisme de la projection et le sujet de chaque film, assurait le lien entre les bandes, rallongeait le spectacle et, de fait, était de plus en plus amené à composer une prestation « audio-visuelle » originale. À partir des années 1920, la hausse de la fréquentation cinématographique correspondra au moment de l’apogée du katsuben. Jusque-là, le cinéma n’avait été qu’un spectacle parmi d’autres et chaque Japonais voyait en moyenne, dans les années 1910, moins d’un film par an : au cours des vingt premières années de son existence, le cinéma, vues ou films, n’était guère considéré que comme une curiosité occidentale.

On doit nettement distinguer le katsuben du kowairo. Même si moins de films qu’on ne le pense d’ordinaire étaient effectivement adaptés du répertoire kabuki (du moins une fois dépassées les toutes premières années où les films n’étaient que des enregistrements de pièces), c’est ce dernier — recourant aux visages maquillés, aux moyens modernes d’éclairage, etc. — qui a imposé très tôt les normes du jeu d’acteur dans le cinéma japonais. Jusqu’en 1906, il était alors fréquent de placer, à côté de l’écran, un peu au-devant, en s’inspirant directement du dispositif du kabuki, autant d’interprètes censés faire vivre aux spectateurs une expérience pseudo-théâtrale, en fonction du ton de leur voix (kowairo), chacun (sexe, âge) étant choisi par rapport au rôle qu’il « doublait », un peu à la manière du futur acteur-doubleur, mais ici présent physiquement et visible pendant la représentation. En revanche, le katsuben n’est pas tenu par exemple, à l’instar de Somei Saburo, d’adapter sa voix à tel personnage ni de la changer selon les circonstances, comme pourrait le faire un imitateur [6]. Le kowairo disparut au cinéma entre 1915 et 1920 [7].

Le katsuben, pouvant parler (kataru) ou « chanter » (utau), prend en charge tour à tour la narration, les dialogues, mais aussi de plus en plus, au cours des années 1910 et 1920, l’interprétation, si ce n’est, comme couramment, le jugement axiologique de telle ou telle action (notamment celles qui étaient susceptibles de heurter la censure ou les moeurs établies), de tel ou tel comportement d’un des personnages à l’écran (chute ironique ou moralisatrice), voire la modification radicale du sens des images (transformer un mélodrame raté en comédie), le tout prenant la forme d’une « exégèse » enveloppée dans une rhétorique excentrique — outrance, trémolo… — aux épilogues interminables, ponctuée d’effets comiques ou débitée sur un ton professoral et didactique [8]. Le katsuben est un spectacle à entendre mais aussi à voir : il ne fait pas que « dire le film », il est une « voix à regarder ». C’est souvent plus les mimiques et les gestes du katsuben, accompagnés il est vrai de son ton, qui déclenchent les réponses émotionnelles des spectateurs, que ce qu’il dit effectivement, les salles japonaises n’étant pas alors plongées dans une obscurité complète (Takeda 1925, p. 43). Il arrive également au katsuben de demander au projectionniste, par le truchement d’un petit bouton, d’accélérer ou de ralentir la vitesse de défilement des images parce que tel passage l’ennuie ou, au contraire, le met en valeur (Fujiki 2006, p. 71).

*

Le katsuben était indispensable, non seulement parce qu’à cette époque les films étaient courts et le cinéma encore une nouveauté, mais surtout, si l’on suit plusieurs commentateurs, parce qu’il s’inscrivait dans toute une tradition du spectacle visuel japonais où la voix accompagne l’oeil et à laquelle le spectateur japonais est culturellement accoutumé. Ceci expliquerait sa singularité cinématographique.

Il est, en effet, impératif, à vouloir pister les configurations mouvantes du katsuben au moment de l’arrivée du parlant, de revenir d’abord rapidement sur le débat « général », non résolu, et sans doute insoluble tel qu’il est posé, entre ceux qui, à l’instar de Noël Burch ou de Joseph Anderson, situent le katsuben dans l’héritage confluent des arts traditionnels japonais du spectacle et de la narration orale, et ceux qui, à l’opposé, n’y voient que la version japonaise d’un phénomène existant tout autant en Occident (avec une simple différence de degré, non de nature) : après tout, les projections de lanterne magique avaient leurs conférenciers ou lecturers, et le katsuben, indiquant quoi voir, à quoi faire attention et comment voir, portant le public aux réactions qu’il désire, peut tout à fait être assimilé, au détriment de la stricte orthodoxie albertienne, à quelque amonitore (bavard, mobile, extérieur à l’espace fictionnel de l’image). Pourtant, en Europe et aux États-Unis, le conférencier, s’il a existé un temps, ne s’est jamais développé comme le fit le katsuben japonais.

La thèse d’Anderson (1992, p. 261), s’inspirant peu ou prou des théories du Nachleben, est sans équivoque : le katsuben est « une extension de pratiques narratives indigènes que j’appelle communication combinée (commingled media) et une variation moderne des traditions vocales de narration [9] ». L’auteur situe dans la « communication combinée », qu’avec Donald Richie (2005, p. 18) on pourrait également appeler « présentationnelle », le cartouche calligraphié des estampes, l’intrication plus complexe des poèmes et des figures dans la peinture sur rouleau (e-makimono), les romans illustrés, l’e-toki (narration populaire accompagnée de vignettes) et, dans les spectacles visuels, le « déclamant » (jōruri) du bunraku des marionnettes sans voix (puis du théâtre animalier), le « récitant » (gidayū) du kabuki ou le choeur du (qui, bien que les acteurs puissent parfaitement se faire entendre et comprendre, décrivent souvent en sus l’action que ceux-là sont en train d’accomplir), etc. : tous modes d’expression artistique impliquant concomitamment le « mot à lire » (read-word) et « l’image à voir » (see-picture) (Anderson 1992, p. 262). Il existe, bien entendu, des différences entre ces formes artistiques. Mais les ressemblances, aux yeux d’Anderson, l’emportent in fine et tressent un réseau de modes d’expression convergents, sur fond par ailleurs d’un certain nombre de pratiques récitatives séculaires avec leurs gestuelles et leurs expressions faciales propres (épiques, ou heikyoku — comiques, ou rakugo — historiques, ou kōdan). Le tout constituant ce que l’auteur nomme, avec un finalisme rétrospectif sans doute trop appuyé, l’« Ur-katsuben » (p. 266). Comme la tragédie grecque antique, le drame japonais n’est pas seulement joué, mais joué et raconté. La répétition y fait le sens. Le katsuben ne déroge pas à cette règle. On retrouve dans le dispositif cinématographique japonais les trois gestes dont parlait Roland Barthes (1970, p. 69) à propos du bunraku : le « geste effectué » (des acteurs à l’écran), le « geste effectif » (du projectionniste) et le « geste vocal » (du katsuben).

Cela, évidemment, n’est pas aussi unilatéral. Anderson, lui-même, en a parfaitement conscience. Il est au demeurant fort difficile de faire nettement la distinction entre ce qui est spécifiquement japonais dans le katsuben et ce qui y est plus ou moins adopté du modèle générique du conférencier à l’occidentale, à la suite, notamment, de « l’ouverture » de l’ère Meiji, mais pas seulement. Ainsi, le katsuben perpétue, en un sens, l’activité du montreur de vignettes projetées (utsushi-e) de l’e-toki, mais, en un autre sens, cette activité s’est elle-même amplifiée du fait de l’introduction, au Japon, de la lanterne magique par les marchands hollandais à partir de la fin du xviiie siècle (Anderson 1992, p. 266). Qui plus est, le katsuben, qui n’est pas une essence mais une fonction évolutive (Gerow 1994 et Hase 1994), se développe et s’impose comme spectacle visuel précisément au moment où d’autres formes inspirées de la tradition (le rensa-geki, le kowairo) périclitent dans le contexte des images filmées. À une époque où, pour des raisons économiques, le cinéma japonais doit absolument s’exporter mieux, le katsuben n’est pas concerné par le déclin de formes « nationales » trop marquées et, au contraire, va connaître un succès croissant, notamment avec la distribution exponentielle, à partir du milieu des années 1910, des films étrangers (yōga) ; succès qui, symétriquement, confortera de plus en plus sa nécessité spectaculaire (au moins à partir d’une certaine date et jusqu’à un certain point) [10]. C’est en partie sur ce fait que Charles Musser et Komatsu Hiroshi contestent une compréhension trop « japonisante » du katsuben, laquelle opposerait brutalement et sommairement l’Occident au Japon. Après tout, si le katsuben s’est développé, c’est parce qu’il fallait avant tout expliciter des films américains, pour la plupart, mais aussi français, italiens, etc., pour le public japonais connaissant mal les cultures occidentales (les producteurs étrangers n’estimant pas rentable, par ailleurs, d’investir dans des sous-titres en japonais) [11], plus peut-être que par « japonisme » traditionnel.

La thèse d’Anderson a néanmoins le mérite de mettre l’accent sur un élément d’importance, qui est effectivement une constante de l’art japonais : le refus de cacher l’artifice. Contrairement au doublage direct occidental, où les interprètes sont cachés à la vue des spectateurs [12], le katsuben, comme le kowairo ou le jorūri, s’affiche sans détour. Les arts japonais, ignorant notre transparence classique, montrent et montrent qu’ils montrent (ce qui expliquera, pour partie, l’engouement de nos diverses « modernités » occidentales à leur égard…) : la nature n’est jamais autant appréciée que lorsqu’elle porte la marque de l’intervention de l’homme (ikebana, jardins), pas de façade à proprement parler dans l’architecture traditionnelle, et ainsi de suite.

*

Dès la seconde moitié des années 1910 cependant, quelques voix discordantes se font entendre à propos du katsuben. Il nuirait au plein épanouissement d’un mode d’expression cinématographique idoine qu’on estimait alors essentiellement obtenu par le montage. On pourrait, tout autrement, considérer qu’il a été si indispensable au cinéma japonais que l’arrivée du parlant, loin de le supprimer avec soulagement, le « convertira », sous diverses modalités, dans les films. Aujourd’hui, il nous faut impérativement distinguer deux types de critiques : celles qui furent formulées au Japon au moment de l’apogée du katsuben ; celles qui émanent, depuis, des spécialistes de l’histoire du cinéma, occidentaux ou japonais.

Pour plusieurs des contemporains du katsuben, la présence de ce dernier tendrait à circonscrire les films à de simples avatars du théâtre filmé (fondamentalement le shimpa, variation du kabuki) : plans longs et statiques, dialogues nombreux, avec un minimum de coupures, sont privilégiés pour permettre au katsuben, compte tenu de son succès auprès du public, de faire son travail sans difficulté particulière et pour servir de véhicules neutres à sa virtuosité. De nombreux témoignages rapportent que, dans les années 1910, la plupart des films étaient encore enregistrés sans metteur en scène à proprement parler, distinct du cadreur : le cinéma était plus affaire de projection que de production (Kinugasa 1977, p. 17 et suivantes). Citons quelques exemples de ces critiques : le premier livre japonais sur le cinéma, Production et photographie du drame cinématographique du cinéaste Kaeriyama Norimasa (1916), dénonce les films sans scénario et la narration du katsuben ; des mouvements intellectuels comme le jun-eiga, le « cinéma pur », veulent débarrasser le cinéma de tout apport artistique allogène ; le romancier Tanizaki Jun.ichiro, dans l’autobiographie de sa jeunesse, remet en cause le principe du katsuben pour les films japonais et n’entend le conserver que pour les films étrangers.

À partir de 1915, les films hollywoodiens arrivant en masse sur le sol japonais, la nécessité de scénarios plus recherchés se fait plus pressante [13]. Les années 1920 verront tout autant s’épanouir le katsuben (dont l’âge d’or se situe entre 1927 et 1931 [14]) qu’elles donneront naissance, avec l’influence grandissante des films étrangers (à laquelle résistaient les katsuben), à des récits qui donneront lieu à de véritables nouveautés sur le plan proprement cinématographique : montage alterné dans Amateur Club (Amachua kurabu, 1920) de Kurihara Kisaburo, retour en arrière et gros plan dans La fille du lieutenant (Taii no musume, 1917) de Masao Inoue, colorisation « à l’italienne » dans L’éclat de la vie (Sei no kagayaki, 1919) de Kaeriyama, mouvements d’appareil et raccord dans l’axe dans Les quarante-sept ronins (Chūshingura, 1914) de Makino Shozo… En un sens, on pourrait dire que la présence du katsuben a autorisé certains cinéastes à prendre de véritables risques formels pour l’époque, puisqu’ils savaient que celui-ci serait toujours là, si besoin était, pour guider le public éventuellement déconcerté, même si, par ailleurs, les codes occidentaux dans lesquels les cinéastes ont puisé à partir des années 1910 (chez Ince, Griffith ou Pastrone) n’ont jamais été repris sous la forme d’un système (Burch 1982, p. 87) (ce que le katsuben peut-être, entre autres raisons, interdisait).

Pour ce qui est des débats occidentaux, le fait de voir dans le katsuben un frein à l’émancipation cinématographique — il aurait été un principe d’expropriation du filmique, subordonnant l’image au mot — est la conséquence d’une double erreur scientifique (et ethnocentrique) parfaitement résumée par Richie (2005, p. 27) : considérer le développement du cinéma tel que nous le connaissons moins comme historique que comme « naturel » et, conséquemment, ne pas envisager d’alternative à une conception aristotélicienne de la narration dramatique transparente et autosuffisante, conception qui est parfaitement étrangère à la culture japonaise. Le cinéma muet japonais ne ressemble absolument pas au nôtre : soit que l’on soutienne, avec Burch (1982, p. 83), que la présence du benshi en fait, par rebond, « le plus muet de tous » ; soit que l’on affirme, comme Yoshida Chieo, que le benshi, quoiqu’il n’ait jamais eu pour finalité de faire parler l’image avant le parlant (Burch 1982, p. 82), a fait qu’il n’y a jamais eu de cinéma muet au Japon parce que les spectateurs ont été d’emblée habitués à associer des voix à des figures photographiées (Yoshida 1978, p. 4). La rareté des intertitres a pour conséquence que, dans l’un ou l’autre cas, le cinéma japonais muet diffère fondamentalement du muet occidental (sans y méconnaître le rôle joué par le bonimenteur) où les intertitres sont intérieurs à la diégèse mais majoritairement successifs aux prises de vue, alors que la parole du katsuben se superpose aux images à partir de l’extérieur de la diégèse (Burch 1982, p. 83). Pour juger de l’effet du katsuben sur le développement d’un langage proprement cinématographique au Japon, il ne faut pas oublier qu’il « soustrayait le fardeau narratif aux images » (p. 84). Le katsuben, outre qu’il a permis le scellement du cinéma comme divertissement à part entière (à la différence du rensa-geki), a ainsi favorisé dans le cinéma japonais, sur un plan désormais plus nettement et esthétiquement cinématographique, l’émergence d’une narration — imagée et imageante — simple et concise sans être sommaire, close à chaque scène (malgré la complexité du shingeki ou le rocambolesque du chambara), laquelle constituera l’armature du cinéma japonais parlant classique.

*

Nous étudierons ainsi pour finir, à l’aide de quelques exemples, deux registres principaux des avatars filmiques du katsuben : l’incorporation dans le cadre de l’image d’un « objet-katsuben », d’une part ; le recours à un « montage-katsuben », d’autre part. Ces exemples, nous les avons sélectionnés dans des films d’Ozu réalisés pendant la période qui va du début des années 1930 (muets) au milieu de la décennie (avec son premier film parlant). Ozu, par ailleurs longtemps personnellement réticent au parlant, est l’un des cinéastes japonais dont nous estimons qu’ils ont très tôt, et le mieux, compris que l’institutionnalisation normative du parlant serait cependant inévitable. On peut voir certains de ses films comme des tentatives filmiques, et pas seulement cinématographiques, pour garder vivace la fonction du katsuben, et ayant apporté, notamment sur le plan sonore, des solutions esthétiques très personnelles qui font du cinéaste, ici comme ailleurs, un traditionnaliste tout autant qu’un « moderniste » à part entière. Comme le fait remarquer Yoshida Kijū (2004, p. 33) : « Ozu est d’abord un cinéaste du muet » (la majorité de ses films parlants sont notoirement mutiques, refusant le parlant pour la parole) ; mais en même temps, c’est au moment où il ne fait plus de doute que le muet et le katsuben sont condamnés par le parlant que se dessine chez Ozu l’un des tournants qui conduiront à son style tardif. La raison en pourrait résider, sans doute avec d’autres, dans ce qu’il a conservé, et converti, du muet dans le parlant, et en l’occurrence tout spécialement de l’expérience de la projection d’un film muet (avec katsuben) dans le parlant, et ce, dès ses derniers films encore muets réalisés après les timides débuts du cinéma sonore.

Chez Ozu, tout d’abord, il n’est pas rare que la fonction dévolue au katsuben transite dans le cadre et soit assurée par un objet que nous nommerons donc « objet-katsuben », dont l’emploi est également fort proche des fonctions connotatives, métonymiques ou métaphoriques du langage ordinaire. De tels objets ainsi que les plans qui les présentent — très souvent commentés dans d’autres orientations — n’appartiennent pas en propre à la narrativité du film qu’ils mettent en péril. En revanche, on a moins souvent mis l’accent sur ce que nous croyons qu’ils doivent à une sorte « d’intégration » visuelle du katsuben dans l’image filmique. Certains de ces objets-katsuben sont très célèbres : deux, tout particulièrement, quoiqu’ils sortent, stricto sensu, de notre période, mais que nous rappelons pour mémoire — la théière de Crépuscule à Tōkyō (Tōkyō boshoku, 1957) et le vase de Printemps tardif (Banshun, 1949). Dans le premier de ces deux films, la caméra continue de cadrer sur une théière fumante après que la mère, venant d’apprendre la mort de son fils, est sortie du champ, car par cette théière ce sont bien les pleurs de la mère qui sont glosés, si ce n’est indirectement « montrés », avec délicatesse ; dans le second, père et fille se préparent à se coucher dans la même chambre d’auberge et le vase détourne le spectateur de la pensée « pour le moins alarmante de l’inceste » (Yoshida 2004, p. 128) sur le mode de la « badinerie » (p. 119) [15].

Ce procédé, consistant à faire tenir un commentaire sur une scène par des objets témoins, est utilisé précocement par Ozu. Dans Où sont les rêves de jeunesse ? (Seishun no yume ima izuko, 1932), on rencontrait de nombreux objets-katsuben. C’est le cas, tout particulièrement, de deux ventilateurs : un petit ventilateur sur pied et un plafonnier. Le premier apparaît dans trois plans au moment de la scène de la mort du père de Tetsuo : d’abord dans un plan de coupe (qui le présente), puis dans un plan large (sur le côté gauche), enfin dans un plan d’ensemble (en retrait de la scène principale, sur le côté droit). Narrativement, ce ventilateur n’a pas de signification. Un peu auparavant, Tetsuo venait d’apprendre que son père était tombé soudainement et gravement malade : il quitte l’université où il passait son examen et arrive chez lui. Les amis et relations de son père sont déjà à faire les cent pas à l’extérieur devant la maison familiale. Le plan sur le ventilateur nous fait alors « pénétrer » dans la maison avant Tetsuo : suivi de ceux sur la servante affligée et sur le père alité, ce plan sur un ventilateur arrêté n’évoque-t-il pas, dans l’esprit du spectateur, l’image d’un souffle épuisé, ne l’introduit-il pas avant même que les images ne nous le donnent à voir ? Dans les deux autres plans où il intervient — quand Tetsuo entre puis quand il rejoint le chevet de son père —, sa présence de nouveau n’est pas fortuite. Ne se livre-t-il pas encore au même « commentaire », sur les bords, à la limite de l’image, à la manière d’un katsuben inséré ? L’effet sera similaire, un peu plus tard, avec un ventilateur suspendu. Tetsuo annonce à ses camarades d’université, devenus ses employés, son intention d’épouser Oshige, qu’ils avaient tous quatre connue étudiants, ignorant que l’un d’eux, Saiki, est amoureux de la jeune femme. Quand, par respect de la hiérarchie et par crainte de perdre son emploi, ce dernier ne fait aucune objection à la déclaration de Tetsuo, les ombres des pales en rotation biffent son corps dans la lumière du café, alors que les autres ne sont, quant à eux, nullement affectés, quoiqu’ils se tiennent à la même table. L’usage en est déictique. Le ventilateur n’avait jusque-là été aperçu qu’au fond du premier plan de la scène — un plan d’ensemble —, comme un objet du décor parmi les autres. Il acquiert désormais une toute nouvelle singularité, encore indirecte, mais rapidement confirmée par un premier gros plan, puis par un second (en fait, le dernier plan de la scène, qui donc s’ouvre et se clôt avec le ventilateur) : dans le premier gros plan, un « contrechamp » l’associe immédiatement à Saiki, comme s’il s’agissait de deux images mises face à face où l’une serait, telles les pages en vis-à-vis d’un texte bilingue, la « traduction » de l’autre ; dans le second, il ralentit jusqu’à l’immobilisation totale sans justification diégétique, sinon là encore pour signifier, par un biais connotatif, l’état d’esprit d’un homme dont les prétentions affectives viennent de subir, apparemment, un coup d’arrêt net. L’objet-katsuben « regarde » le personnage ; le plan sur l’objet-katsuben « annote » celui sur le personnage en prenant en charge ses émotions autrement communiquées aux spectateurs [16].

Le fond sonore amplifiera la portée de l’objet-katsuben. Le début d’Un fils unique (Hitori musuko, 1936) — film dans lequel les personnages principaux vont voir un film parlant au cinéma — est ainsi tout entier travaillé, et traversé, par la présence écranique des machines à filer la soie (en gros plans, en plans plus larges sur les rangées d’ouvrières, etc.) : ce sont là des objet-katsuben, comme les ventilateurs d’Où sont les rêves de jeunesse ? Le son apporte ici, en plus du retour des plans, la répétition aveugle — ou plutôt faudrait-il dire sourde ? — du roulement mécanique à chaque plan et accentue le « commentaire social » des images : le rabâchage des jours laborieux d’une mère seule et pauvre, à Shinshu, qui se sacrifiera pour payer les études de son garçon. Un peu plus tard, à Tōkyō, la puissance évocatrice de plans sur un oiseau en cage (objet-katsuben), quand un autre provincial (l’ancien professeur) évoque sa région natale, est enrichie par le chant plaintif de l’animal, ce qui accentue l’effet de cette scène dans laquelle nous découvrons qu’un homme ambitieux n’a eu qu’une vie ratée dans une ville à la fois trop grande pour lui et dans laquelle il est prisonnier d’une existence étroite et médiocre.

*

Dans d’autres cas, c’est plus précisément le montage — quoique cette dimension ne soit pas absente du point précédent (puisqu’il s’y agissait déjà de lier des images à d’autres) — qui remplace l’objet-katsuben (dans le cadre) : on parlera alors de « montage-katsuben ». Il a souvent été rapporté qu’Ozu n’aimait guère le montage, qu’il a toujours pris soin d’intervenir et d’interpréter le moins possible, qu’il méprisait la manipulation (mensongère) du monde que le cinéma rendait possible, qu’il assumait le désordre du monde, qu’il tenait plus à laisser les choses se présenter qu’à les représenter (Richie 1980, p. 155), à privilégier un « cinéma d’état » sur un « cinéma d’action » (Ishaghpour 2002, p. 22), à faire des images qui « soient vues » qu’à « montrer » des images (Yoshida 2004, p. 57). Mais il ne faut pas, pour autant, négliger qu’en mode cinématographique la méfiance à l’égard du montage est encore une proposition esthétique sur le montage, qu’il s’agit moins d’une négation que d’un minimalisme, et que, à y regarder de plus près, les films d’Ozu sont structurés par des rythmes d’images et de sons d’une grande subtilité.

On a commencé de le voir : la « sauvegarde » du katsuben, de son esprit sinon de sa lettre, consiste chez Ozu à dissocier sa fonction de sa personne et à faire passer en « contrebande » ladite fonction dans le film. Il ne sera pas jusqu’à la fameuse rupture de l’axis-of-action qui ne puisse être regardée comme une manière de prolonger visuellement l’expérience spatiale (spectaculaire) du katsuben. Comme celui-ci brise l’unité spatiale close du film et tire entre les images et lui (et le public) des droites fictives qui « avancent » depuis le film et sculptent l’expérience d’un nouvel espace tridimensionnel, la rupture de l’axe central fait passer imaginairement le spectateur, alternativement, d’un côté puis de l’autre d’une action (une conversation, par exemple) et casse l’illusionnisme du montage « à l’américaine » (l’espace narratif continu construit par le champ-contrechamp), pris par le spectateur comme un « donné » (spatium ordinatum), pour obtenir un morcèlement spatial qui devra être résolu par ce spectateur dans une unité insolite plus esthétique que narrative, un « bâtir » (spatium ordinans).

L’une des formes les plus originales de cette survivance déictique réside dans le recours que fait Ozu à des films étrangers dans le montage de certains de ses films des années 1930 : le sketch d’Ernst Lubitsch dans Si j’avais un million (If I Had a Million, 1932) pour Une femme de Tōkyō (Tōkyō no onna, 1933), Symphonie inachevée (Leise flehen meine Lieder, 1933) de Willi Forst pour Un fils unique. Comme toujours chez Ozu, l’argument tient en peu de mots : dans Une femme de Tōkyō, une femme, Chikako, se prostitue pour que son frère puisse étudier. L’apprenant, il ne lui en aura aucune reconnaissance et, estimant que celle-ci l’a déshonoré, il la répudiera et prendra la fuite. Il se suicidera peu de temps après. À un moment donné, un policier, ayant quelque soupçon sur la double vie illégale de la soeur, se présente à son travail. Tandis que directeur et policier discutent, celle-ci tape un texte à la machine. Cut brutal : le plan suivant brise la transparence spatiale et narrative pour citer, sur quelques plans, le générique de Si j’avais un million. Le geste de montage est ici doublement saisissant : d’abord parce que ce plan ouvre une autre scène (comme on le comprend quelques plans plus tard), où le frère de Chikako et sa petite amie sont au cinéma (et sont justement en train de voir ce film hollywoodien : film parlant ; il n’y a plus de katsuben dans la salle mais il y est question d’un programme sur papier…) ; ensuite, parce qu’il rompt sans annonce avec le principe de la prise de vue réelle pour trois plans tirés au banc-titre qui ne sont pas seulement surcadrés, mais qui sont directement, comme l’épisode lubitschien cité qui suivra, assimilés, les deux cadres — du film américain et du film japonais — venant exactement se correspondre l’un l’autre, dans la pellicule même d’Une femme de Tōkyō , par une sorte de collage audacieux.

Pour Yoshida (2004, p. 51-52), il y a là une manière de relativiser le fait que les personnages du film sont fictionnels. Comme ils vont eux-mêmes voir un film ou, mieux : comme il y a un autre film dans le film, il se produit un effet de décalage par lequel nous assimilons les figures du premier à des personnes réelles. Mais n’est-il pas envisageable de le voir tout à fait autrement ? Il n’est évidemment pas négligeable qu’Ozu, qui cherche ici également à fissurer la transparence de la norme hollywoodienne, commence par citer un générique, c’est-à-dire précisément ce film « d’avant » le film qui le présente et l’introduit, mais qui est ici appelé en plein milieu d’un film : on pourrait croire de prime abord à une erreur de manipulation pendant la projection (interpolation de bobines, plaisanterie de projectionniste…). Le générique en question ne joue-t-il pas ici le rôle d’une sorte de katsuben ? Il ne serait dès lors pas sans un humour très ozuesque que le katsuben, orateur japonais qui expliquait les films étrangers, devienne un film étranger dont la fonction sera de « communiquer » à propos d’un film japonais (ni, d’ailleurs, que le film en question soit un film sonore assigné dans un film muet). Notre suggestion est que l’extrait de Lubitsch ici convoqué dépend donc moins de la scène au cinéma (selon une logique narrative linéaire, dont Ozu — comme à son habitude — n’a pas grand-chose à faire : le film intercalé étant le film projeté dans la scène postérieure à celle avec le policier) qu’il n’appartient à cette scène précédente avec le policier, avec laquelle, pourtant, il semble en déphasage, pour la raison même qu’il en constitue un commentaire « de côté », un discours sur le récit, une mise en abyme du cinéma par contrepoint.

En effet, le générique lubitschien, puis l’extrait qui suit, ne sont pas sans rapport avec la scène où Chikako tape à la machine. Seulement, ces rapports ne sont pas des rapports narratifs. Vu d’une certaine façon, ce générique s’inscrit même dans une certaine proximité de figure avec le dernier plan où la jeune femme tape un texte, que nous ne pouvons pas lire. Ensuite, l’épisode cité presque intégralement — fort célèbre : un clerc modeste apprend qu’il vient d’hériter d’un million, et monte alors jusqu’au bureau de son directeur pour lui tirer la langue (plan final irrévérencieux qu’Une femme de Tōkyō omet sciemment) — montrera ce que Chikako ne peut, elle, pas faire : il met en symétrie une femme sans argent obligée de se dégrader avec un employé de fiction devenu richissime par hasard qui accède à l’indépendance et, par la même occasion, à la dignité de sujet (alors que tous les autres employés sont filmés par Lubitsch comme des êtres anonymes) ; il dit, à la fois par la proximité (secrétaire/clerc) et l’écart (la soumission de l’une/ l’insolence de l’autre), quelque chose du souhait intérieur de richesse de Chikako, que nulle image ne peut faire voir et qui, surtout, est laissé avec politesse à l’intelligence du spectateur sans qu’Ozu ait à le montrer trop démonstrativement.

Le cinéaste abandonnera rapidement cette forme de montage encore trop appuyée à son goût. En un sens, c’est le passage au parlant qui en sera l’occasion. Dans les films parlants, le son va lui permettre d’associer, par exemple, à de multiples reprises des scènes distantes l’une de l’autre et de les unir par une forme de relation, dans le même temps lien et témoignage, alors qu’elles sont effectivement séparées et « muettes » l’une pour l’autre, et ce, d’une manière encore un peu plus raffinée et discrète. Un fils unique : quand la mère vient rendre visite à son fils, qui n’a pas réussi la vie qu’il espérait avoir, on entend en bruit de fond un tapement, inlassablement repris, similaire au roulement mécanique des machines à tisser de la fabrique où elle travaille (entendu au début du film). C’est que, malgré l’abnégation de la mère, le fils n’a pas quitté la condition sociale dans laquelle il est né. Rien, dans sa masure ni dans les alentours, du moins rien de montré à l’écran, ne justifie l’existence de ce bruit : on admettra, par la suite, qu’il vient de l’usine des parages, mais quand fils et mère discutent dans son voisinage, on ne l’entend pas (il s’arrêtera une seule fois à l’intérieur de la maison : pendant la scène poignante où le fils avouera à sa mère sa déconvenue). Ce son a une raison d’être, stricto sensu, métanarrative : il assure la communication, la boucle, entre ces deux scènes, il est un « succédané de voix » qui vient compléter ce que font voir les images [17]. Un effet sonore de même ordre viendra également renforcer un autre objet-katsuben du film : l’oiseau en cage. Quand le fils confesse à sa mère sa désillusion, on pense immédiatement à son ancien professeur, dont on a vu qu’il avait connu une déception identique. Cette déception avait été alors associée à la présence d’un oiseau captif. Désormais, c’est une alouette que l’on entend chanter dans le ciel. Ce qui signale à la fois la délicatesse du geste d’Ozu et le fait que ce chant, de nouveau, n’appartient pas, littéralement parlant, à la diégèse, c’est que, lorsque Ryosuke lève les yeux, un plan sur le ciel, suivi plus tard d’un second, nous révèle un ciel… sans oiseau. D’où vient ce chant, sinon de la scène chez le professeur ? Ne serait-on pas alors tentés de dire que l’oiseau n’est pas dans le ciel, puisqu’il a été mis en cage dans la scène antérieure ? Le retour immotivé de ce son n’est-il pas à entendre comme un commentaire, d’une exquise tendresse, venant préciser les confidences du fils en amenant le spectateur à comprendre, là encore, que, comme l’oiseau, les destins individuels sont prisonniers de la répétition ?

*

Ces quelques remarques ne sont, évidemment, pas suffisantes : elles ne peuvent ici que délinéer une possibilité esthétique qu’il faudrait tester chez d’autres cinéastes, dans d’autres films, mais qui ne doit pas, non plus, devenir un abord systématique, sinon à se dissoudre : celle que le katsuben, pour extérieur aux films qu’il ait été, a pu, sous l’impulsion du parlant et de sa disparition effective en chair et en os, migrer dans la forme même de plusieurs films japonais sous des combinaisons proprement filmiques et dans des phénomènes de continuité entre le muet et le parlant japonais différents des lectures déjà proposées de cette période de transition. Les exemples retenus chez Ozu, pris ici comme représentants (sinon représentatifs) de ce que le katsuben, qui disparaît comme figure cinématographique, persiste autrement en tant que fonction filmique, n’épuisent pas la manière de les envisager, non plus qu’ils n’ignorent qu’on pourrait peut-être tout autant y déterminer des traces d’influences occidentales (le montage parallèle), et ce, d’autant qu’il est parfaitement envisageable que de tels phénomènes puissent également se rencontrer, sous d’autres spécifications, dans les films muets puis parlants européens ou hollywoodiens. Bien que ces nuances, et d’autres (telle l’absence des premiers films d’Ozu à ce jour disparus), n’annulent pas la lecture que nous en avons proposée, elles la règlent dans les limites d’un cadre opératoire.