Corps de l’article

1. Introduction

Depuis ses origines, la question centrale de la traductologie de corpus a été celle de l’existence et de la nature des soi-disant « universaux » de traduction. Proposés de manière formelle pour la première fois par Baker (1993), sous l’inspiration du concept des universaux en linguistique, les universaux de traduction sont des traits linguistiques qui distinguent les textes traduits de textes nontraduits. Depuis les années 1990, de nombreuses études ont été consacrées à leur identification et à leur vérification[2]. Les chercheurs reconnaissent quatre universaux principaux : l’explicitation, la simplification, la normalisation et le nivellement. D’autres universaux ont été proposés, dont le plus pertinent pour la présente étude sera l’interférence. En dépit de l’intérêt manifesté par les chercheurs, de nombreuses critiques ont été formulées à l’encontre de l’idée même des universaux ou des propositions particulières (voir par exemple House 2008). Ces critiques n’ont pas réduit l’intérêt pour le sujet, mais elles ont contribué à l’introduction de plus de nuance dans ce domaine où le terme d’« universaux » se trouve maintenant souvent employé dans une acception moins absolue, pour renvoyer aux tendances générales de la langue de la traduction (Bernardini et Kenny 2019 : 112).

La traduction journalistique est une forme de traduction spécialisée qui a depuis longtemps suscité l’intérêt des traductologues. À partir du milieu des années 2000, cet intérêt général s’est transformé en un véritable champ de recherche et le nombre de publications est en croissance continue (Bielsa et Bassnett 2009 ; Hernández Guerrero 2009 ; Conway 2011 ; 2015 ; McLaughlin 2011 ; 2013 ; Valdeón 2012 ; 2020a ; Davier 2017 ; Károly 2017). Le fait qu’un premier numéro rétrospectif vienne tout juste de paraître marque l’évolution de ce champ de recherche que Valdeón (2020b : 10) qualifie aujourd’hui de « truly global ». L’importance du rôle joué par la traduction dans la production et la circulation de l’information explique l’intérêt de cette forme de traduction spécialisée et sa pertinence pour les questions socioculturelles va de soi. Il est intéressant de noter que, tout comme en traductologie de corpus, les chercheurs travaillant sur la traduction journalistique ont commencé à réfléchir de manière plus approfondie à la question de la méthodologie. Citons, à titre illustratif, Davier, Schäffner et van Doorslaer (2018 : 157) qui soulignent l’importance de la réflexion méthodologique dans ce domaine en expliquant que les particularités de cette forme de traduction spécialisée ont des conséquences pour le développement d’approches qui lui sont propres. En particulier, ils prônent l’usage de la triangulation méthodologique où différentes méthodes sont combinées pour mieux comprendre la traduction journalistique dans toute son étendue (Davier, Schäffner et van Doorslaer 2018 : 160-161). L’approche sur corpus figure bien évidemment parmi les différentes démarches méthodologiques employées par les chercheurs s’intéressant à la traduction journalistique (McLaughlin 2011 ; 2013).

Comme l’indique Valdeón (2020b : 8), « the role of translation in news writing can […] be traced back to the birth of journalism in the early modern period » et ce fait n’a pas échappé aux chercheurs qui s’intéressent à la traduction journalistique dans différentes disciplines. Pour la présente étude, ce sont les travaux en linguistique qui sont les plus pertinents, dont mon propre travail sur la presse historique de langue française[3]. Dans le cadre d’un projet linguistique sur la presse française historique, j’ai effectué trois enquêtes sur la traduction journalistique entre 1631, date de la fondation de la Gazette de France, et la Révolution de 1789. Il s’agit d’analyser un corpus que j’ai compilé et qui se compose de journaux et de périodiques historiques importants fondés dans cette période (McLaughlin 2021). Les trois enquêtes ont utilisé ce corpus pour explorer l’hypothèse que la traduction des informations aurait laissé des traces au niveau linguistico-textuel. Une première enquête a lié la traduction à, d’une part, la présence de mots empruntés et de calques, et d’autre part, un niveau de concision plus élevé dans les informations traduites (McLaughlin 2016). La deuxième enquête, publiée par hasard avant la première, a pour sa part examiné le rapport entre la traduction et la culture (McLaughlin 2015). La dernière enquête fait partie de mon livre sur la langue de la presse française historique (McLaughlin 2021 : 324-335). J’ai employé un test de signification qui évalue la fréquence relative de mots dans un corpus par rapport à un corpus de référence, à savoir le test de keyness, pour comparer les informations que l’on sait ou croit être des traductions aux informations non traduites. Cette approche a permis de conclure que l’acte de la traduction produit des effets à au moins quatre niveaux différents (orthographe, syntaxe, lexique et style). Prises ensemble, ces trois enquêtes soulignent l’intérêt de la traduction journalistique historique pour les historiens de la langue qui veulent comprendre son impact sur le discours journalistique historique et sur la langue elle-même.

Dans leur introduction à un numéro spécial sur l’importance de la méthodologie dans la recherche sur la traduction journalistique, Davier, Schäffner et van Doorslaer (2018 : 160) attirent l’attention sur les difficultés particulières posées par la recherche historique : « Getting access to historical sources which are spread across libraries or may even have disappeared is a major challenge to such research. » L’objectif du présent article est de tenter de résoudre un problème particulier que j’ai rencontré en étudiant la Gazette de France (1631-1792), le premier périodique de langue française à avoir connu un succès à long terme. Il s’agit d’un périodique officiel qui se compose de courtes dépêches anonymes. À cause de son statut de périodique officiel, la Gazette de France ne traite que rarement d’affaires intérieures jugées trop sensibles et la majeure partie de ses informations sont internationales. Il n’est donc pas surprenant d’apprendre que les historiens ont montré que, dès le départ, une grande partie des informations publiées étaient des traductions (McLaughlin 2016 : 205-209). Au début, la Gazette de France consistait en deux cahiers qui s’intitulaient Gazette et Nouvelles ordinaires. Chaque cahier se compose de quatre pages et ils présentent une série de dépêches d’informations qui se caractérisent par le même style sec et impersonnel. Mais, comme l’indique Feyel (1999 : 15), les dépêches publiées dans les Nouvelles ordinaires étaient « [r]édigées par Jean Epstein, un bourgeois de Paris d’origine allemande, qui reçoit et traduit les nouvelles et les gazettes venues d’Allemagne » et de Hollande (Feyel 2000 : 182). Les historiens ont fourni différentes preuves de cette hypothèse, dont la plus certaine est un contrat (Feyel 2000 : 140-141). L’hypothèse a aussi été confirmée par la recherche de Haffemayer (2002 : 212) sur la circulation des informations et la Gazette de France entre 1647 et 1663. Mais, comme l’ont indiqué Davier, Schäffner et van Doorslaer (2018 : 160), quand on travaille sur la traduction journalistique, historique ou contemporaine, il peut être difficile, sinon impossible, d’identifier les textes sources qui constitueraient la preuve définitive du statut traduit des informations.

Dans ce contexte, l’objectif de la présente étude est de voir si une analyse sur corpus de la Gazette de France nous aiderait à confirmer l’hypothèse que le cahier Nouvelles ordinaires se compose de dépêches traduites, hypothèse qui sera désormais dénommée « l’hypothèse de la traduction ». Mes recherches antérieures ont déjà identifié un certain nombre de différences entre les deux cahiers de la Gazette de France qui peuvent être comprises comme des indications que le cahier Nouvelles ordinaires se compose de dépêches traduites. Premièrement, une comparaison de la longueur des dépêches dans les deux cahiers a montré que celles publiées dans les Nouvelles ordinaires sont systématiquement plus courtes (McLaughlin 2016 : 210). Haffemayer (2002 : 212) avait déjà indiqué que la relative concision des dépêches pourrait être « due à un travail préalable de traduction et puis d’élimination ». Même s’il serait simpliste d’aligner la pratique des traducteurs de textes journalistiques historiques et modernes, le fait que l’élimination du contenu constitue un trait particulier de cette forme de traduction spécialisée aujourd’hui renforce l’idée que la concision résulte du processus de la traduction[4]. Deuxièmement, le test de keyness a permis d’identifier un certain nombre de différences entre les Nouvelles ordinaires et la Gazette qui peuvent être comprises comme des conséquences de l’acte de la traduction (McLaughlin 2021 : 325-329). Citons premièrement, une fréquence quelque peu plus élevée de mots d’emprunt, deuxièmement, une présence plus notable d’abréviations qui serait un reflet de la concision, et troisièmement, des différences stylistiques concernant le marquage de la véracité des informations. Les données les plus révélatrices concernent l’usage du passif (McLaughlin 2021 : 171-180). J’ai trouvé que le passif en être + participe passé est plus fréquent dans les Nouvelles ordinaires – et surtout dans les dépêches en provenance de Londres – deux résultats importants parce qu’ils coïncident de manière frappante avec ceux qui ont été rapportés pour la traduction journalistique contemporaine (McLaughlin 2011 : 55-76). Si l’on considère ces résultats dans le contexte de la recherche en traductologie de corpus, il semble évident qu’au moins certaines différences peuvent être liées aux universaux de traduction. En particulier, la présence des emprunts et la surreprésentation du passif seraient des exemples de l’interférence, et la concision des informations serait un exemple de la simplification. Je présente donc ici une enquête qui profite des progrès faits à la fois en traductologie de corpus et dans la recherche sur la traduction journalistique pour tenter d’offrir des preuves linguistico-textuelles plus amples du statut traduit des informations publiées dans les Nouvelles ordinaires.

2. Approche et corpus

L’approche que j’ai développée se situe au croisement de deux champs de recherche : la traductologie de corpus et la traduction journalistique. À la différence de la majeure partie des travaux antérieurs qui ont pour objectif d’examiner les traits de la langue de la traduction, cette recherche utilise ce que l’on sait déjà de la langue de la traduction en général, et de la langue de la traduction journalistique en particulier, pour tenter d’identifier la présence de la traduction dans la presse historique. Le fait que l’on puisse adopter cette approche aujourd’hui témoigne de l’état relativement avancé des travaux dans ces deux domaines. Il va sans dire que les universaux de traduction sont essentiels pour cette recherche parce qu’ils sont à la base des différences qui seront examinées dans les études de cas. Il convient de les utiliser avec circonspection compte tenu de leur caractère non absolu, en s’appuyant le plus possible sur les travaux concernant la forme de traduction spécialisée sous étude. Mon approche est similaire à celle utilisée dans la première vague de travaux en traductologie de corpus comme ceux de Laviosa (1998b), Kenny (2001) et Xiao (2010). Elle s’attache à l’analyse d’un corpus de recherche de taille limitée qui est utilisé pour identifier une série de tendances qui refléteraient la présence de la traduction dans la production du texte. L’analyse combinera méthodes qualitatives et quantitatives[5].

Le corpus employé dans la présente enquête fait partie du corpus que j’ai compilé pour mon étude plus large sur la langue de la presse française historique (McLaughlin 2021). La partie utilisée ici comprend tous les numéros de la Gazette de France qui ont été publiés au mois de janvier 1632 : il s’agit de cinq numéros de huit pages composés chacun des deux cahiers. Les numéros datent du 2, 9, 16, 23, et 30 janvier 1632. Au total, le corpus comprend 20 286 mots, dont 10 376 dans le cahier Gazette et 9 910 dans le cahier Nouvelles ordinaires. Deux versions de chaque numéro dans le corpus sont disponibles : une version image et une transcription manuelle. J’utilise ce corpus pour tester l’hypothèse que les dépêches publiées dans le cahier Gazette ont été écrites en français mais que celles publiées dans le cahier Nouvelles ordinaires ont été traduites à partir de journaux en langues germaniques. Pour ce faire, j’ai réalisé une série d’études de cas qui ont été inspirées premièrement par les travaux antérieurs en traductologie de corpus et sur la traduction journalistique, et deuxièmement par le corpus lui-même. Chaque étude concerne un trait linguistique qui peut être lié à au moins un universel de traduction. L’analyse des traits est facilitée par deux logiciels qui offrent différentes possibilités de calculs et d’analyses : Sketch Engine et AntConc[6]. J’espère ainsi faire évoluer notre compréhension de la presse française historique en confirmant ou non la présence de la traduction dans la production de la Gazette de France (1631-1792) dans la deuxième année de son existence.

3. Études de cas

3.1 La simplification

Cette partie présente les résultats de deux études de cas concernant des traits qui peuvent être liés à l’universel de la simplification, c’est-à-dire, « la tendance qu’auraient les traducteurs à utiliser une langue plus simple […] dans le cadre des traductions par rapport à des textes rédigés dans la même langue, mais originale cette fois-ci » (Loock 2016 : 183). Les chercheurs ont lié un certain nombre de caractéristiques de la langue de la traduction à cet universel dont les plus connues sont une série de tendances observables au niveau lexical qui ont été décrites par Laviosa (1999b : 8). Dans ce qui suit, je présente une étude de la longueur des phrases dans la partie 3.1.1 et une étude de la diversité lexicale dans la partie 3.1.2.

3.1.1 La longueur des phrases

Cette étude de cas est la plus simple du point de vue conceptuel : elle offre un examen de la longueur des phrases dans les deux cahiers de la Gazette de France. L’intérêt de la longueur des phrases réside dans le fait qu’elle peut être interprétée comme un indicateur de la simplicité d’un texte. Comme le note Xiao (2010 : 10), les résultats ne sont pas uniformes dans ce domaine. Si Hansen-Schirra (2011 : 147) a identifié une réduction de la longueur des phrases dans les deux sens de traduction entre l’anglais et l’allemand, Laviosa (1998b : 1, 5) et Xiao (2010 : 21-22) ont rapporté des résultats différents pour différents genres de discours. Ce qui m’a conduite à choisir ce trait pour la première étude de cas est le fait que Laviosa (1998b : 1) et Xiao (2010 : 21-22) ont tous deux trouvé une réduction de la longueur moyenne des phrases dans les textes journalistiques traduits.

Sketch Engine permet de calculer le nombre de mots (occurrences) et le nombre de phrases (orthographiques) pour un corpus donné. Le tableau 1 présente ces informations pour les deux cahiers de chaque numéro de la Gazette de France publié au mois de janvier 1632.

Tableau 1

Nombre de phrases

Nombre de phrases

-> Voir la liste des tableaux

Le tableau 1 suggère qu’il y a une différence entre les deux cahiers de la Gazette de France parce que la Gazette comprend plus de mots, mais moins de phrases que les Nouvelles ordinaires. Les chiffres permettent de calculer la longueur moyenne des phrases dans les deux cahiers : la longueur moyenne des phrases pour la Gazette est 26,01 mots contre 22,94 mots pour les Nouvelles ordinaires. Cette différence s’avère presque systématique ; ce n’est que dans un seul numéro (celui publié le 2 janvier 1632) que la longueur moyenne est plus élevée dans les Nouvelles ordinaires que dans la Gazette. Ces résultats semblent confirmer l’hypothèse de traduction parce que les phrases plus courtes sont associées à la simplification. Le test de log-likelihood permet d’évaluer la signification statistique des données dans le tableau 1 : il indique que les résultats ne sont pas significatifs au seuil de 0,05 car à 3,27, le résultat se trouve entre la valeur de 2,71 requise pour le seuil de 0,10 et la valeur de 3,84 requise pour le seuil de 0,05. La proximité du résultat de la valeur requise pour la signification statistique ainsi que la relative systématicité de la différence nous laisse penser qu’un corpus plus grand permettrait de confirmer la signification de cette différence. Ces premiers résultats offrent une première indication que les dépêches publiées dans les Nouvelles ordinaires sont vraisemblablement des traductions.

3.1.2 La diversité lexicale

La deuxième étude de cas examine la diversité lexicale de la Gazette de France de plusieurs points de vue. Dans le premier numéro spécial de META consacré à la traductologie de corpus (Laviosa 1998a), Laviosa (1998b : 8) a postulé l’existence de quatre tendances qui caractérisent le lexique des textes traduits et c’est l’universel de la simplification qui les expliquerait :

  1. Translated texts have a relatively lower percentage of content words versus grammatical words (i.e. their lexical density is lower) ;

  2. The proportion of high frequency words versus low frequency words is relatively higher in translated texts ;

  3. The list head of a corpus of translated texts accounts for a larger area of the corpus (i.e. the most frequent words are repeated more often) ;

  4. The list head of translated texts contains fewer lemmas.

La proposition initiale de Laviosa se base sur ses études de textes journalistiques et littéraires, et des études subséquentes sont venues confirmer ses résultats. Citons par exemple celle de Xiao (2010 : 22) qui a confirmé que les quatre tendances se vérifient toutes dans le chinois traduit, et ce dans différents genres de discours[7].

Pour analyser la densité lexicale des deux cahiers de la Gazette de France, j’ai employé le logiciel AntConc. Une liste de mots clés à exclure a été utilisée pour identifier la proportion relative des mots lexicaux dans la Gazette et dans les Nouvelles ordinaires. Cette liste inclut tous les mots fonctionnels les plus fréquents dans le corpus[8]. Le tableau 2 présente les résultats.

Tableau 2

Densité lexicale[9]

Densité lexicale9

-> Voir la liste des tableaux

Le tableau 2 montre que les deux cahiers de la Gazette de France ont la même densité lexicale : les mots lexicaux représentent 45 % du lexique dans les deux cahiers et le test de log-likelihood confirme la similarité des résultats (log-likelihood = 0,71, p> 0.05). Les résultats de cette analyse ne confirment pas l’hypothèse de traduction.

J’ai ensuite examiné les têtes de liste (list head en anglais) des deux cahiers pour obtenir des informations concernant la fréquence des mots. Ce travail a été facilité par l’outil Wordlist de Sketch Engine qui fournit une liste complète de tous les mots (types) dans le corpus classés par fréquence d’occurrence. Comme Laviosa (1998b) et Xiao (2010), je définis la tête de liste comme tous les mots (types) dont les occurrences représentent individuellement au moins 0,10 % de tous les mots (occurrences) dans le corpus[10]. Pour la plupart, les têtes de liste se composent de mots outils. Le tableau 3 fournit les informations sur les têtes de liste des deux cahiers : il indique le nombre de mots (types) dans chaque tête de liste et la proportion cumulative de tous les mots (occurrences) que représente la tête de liste.

Tableau 3

Tête de liste

Tête de liste

-> Voir la liste des tableaux

Le tableau 3 montre que la tête de liste de la Gazette comprend moins de mots que celle des Nouvelles ordinaires, un résultat qui va à l’encontre de l’hypothèse de traduction. Le test de log-likelihood indique que cette différence n’est pas significative (log-likelihood = 0,99, p> 0,05). En ce qui concerne la proportion cumulative, le rapport entre les deux cahiers s’inverse : la tête de liste des Nouvelles ordinaires représente une proportion plus large du corpus que ne le fait celle de la Gazette. Il est intéressant de noter qu’en ceci, ces résultats sont similaires à ceux de Xiao (2010 : 22) dans son analyse du chinois traduit : il a trouvé plus de mots dans la tête de liste de la partie traduite du corpus et elle en a représenté une proportion cumulative plus importante. Si l’on compare l’écart entre les proportions du corpus représentées par les têtes de liste, on voit que la différence est moins importante pour mon corpus que pour ceux examinés par Laviosa (1998b) et Xiao (2010) : c’est une différence de 0,89 % par rapport aux différences de presque 5 % repérées dans ces deux études antérieures. Cette analyse des têtes de liste a donc mené à une conclusion mixte concernant l’hypothèse de traduction.

3.2 L’explicitation

Les études de cas présentées dans cette partie concernent l’universel de l’explicitation, « à savoir la tendance qu’auraient les traducteurs à expliciter les choses en langue cible » (Loock 2016 : 183). Les effets de cet universel ont été illustrés à différents niveaux par des études antérieures. Citons, à titre d’exemple, un usage plus élevé en espagnol traduit des pronoms sujets, facultatifs dans cette langue pro-drop, et un usage plus élevé en anglais traduit du complémenteur that, facultatif lui aussi dans certains contextes (voir Zanettin 2013 : 23). Les Parties 3.2.1 et 3.2.2 présentent les résultats d’études de cas concernant les connecteurs et le passif.

3.2.1 Les connecteurs

J’ai choisi d’analyser l’usage des connecteurs parce qu’ils peuvent être interprétés comme un reflet de l’universel de l’explicitation. Dans une série d’études, différents chercheurs ont fourni des preuves relativement solides du fait que les connecteurs sont plus fréquents dans le chinois traduit que dans le chinois original à cause de l’explicitation (Chen 2006 ; Xiao et Yue 2009 ; Xiao 2010 : 23-26). Comme pour la variation lexicale, il peut y avoir de la variation entre différents genres de discours. Xiao (2010 : 23-24) a découvert une différence importante générale en ce qui concerne la fréquence des connecteurs dans le chinois original et traduit mais certains genres de discours sont moins touchés par cette différence. J’ai séléctionné les connecteurs pour la présente étude sur la base du fait que les trois sous-genres journalistiques examinés par Xiao sont tous touchés par cette différence.

Les chapitres pertinents de la Grammaire méthodique du français (Riegel, Pellat et Rioul 2004 : 519-527, 616-623) décrivent la grande diversité d’éléments qui peuvent connecter différentes phrases et/ou différentes parties d’une phrase en français. J’ai, pour ma part, choisi d’examiner les conjonctions considérées comme classiques : mais, ou, et, donc, or, ni et car (Riegel, Pellat et Rioul 2004 : 525[11]). AntConc a permis de calculer la fréquence de ces différentes conjonctions dans les deux cahiers de la Gazette de France et les résultats sont présentés dans le tableau 4. Notons de prime abord que le tableau comprend deux rangées pour la conjonction coordinative (et et &) parce qu’en 1632, la forme orthographique ne se trouve qu’en début de phrase, l’esperluette étant employée ailleurs.

Tableau 4

Fréquence des conjonctions

Fréquence des conjonctions

-> Voir la liste des tableaux

Le tableau 4 montre que les Nouvelles ordinaires comprennent plus de conjonctions que la Gazette, un résultat qui semble confirmer l’hypothèse de traduction. Le test de log-likelihood montre que ce résultat n’est pas significatif au seuil de 0,05 mais qu’il est significatif au seuil de 0,10 (log-likelihood = 3,37, p > 0,05). Il est important de noter que cette différence ne touche pas les différentes conjonctions de manière uniforme. C’est surtout la fréquence élevée de l’esperluette dans les Nouvelles ordinaires qui explique la différence globale entre les deux cahiers et le test de log-likelihood montre que cette différence est significative (log-likelihood = 3,90, p < 0,05). Il n’est pas surprenant que la conjonction coordinative soit plus fréquente que les autres conjonctions – elle est la conjonction la plus fréquente en français en général (Riegel, Pellat et Rioul 2004 : 525[12]) – mais il est néanmoins utile de l’examiner de plus près pour tenter de déterminer si on a affaire ici à un reflet de traduction.

L’esperluette a représenté le mot et latin depuis au moins le premier siècle de notre ère (Houston 2013 : 64) et il est peu surprenant de le retrouver dans les textes historiques français, qu’ils soient manuscrits ou imprimés. Ce caractère est utilisé pour représenter la conjonction coordinative de manière systématique dans les deux cahiers de la Gazette de France en 1632 à une exception près, c’est-à-dire en début de phrase. Cette pratique est illustrée par l’exemple (1) : la conjonction paraît sous forme orthographique en début de phrase et sous forme d’esperluette en position médiane.

Le fait que l’esperluette l’emporte sur son équivalent orthographique dans le corpus est donc la conséquence de la rareté de la conjonction coordinative en début de phrase, un usage qui n’était pourtant pas alors considéré comme fautif (Siouffi 1998 : 297) : elle ne figure que cinq fois en début de phrase. La distribution presque égale de et dans les deux cahiers – elle paraît trois fois dans la Gazette et deux fois dans les Nouvelles ordinaires – ne suggère pas un effet de contact. J’ai néanmoins décidé d’examiner les exemples de plus près parce que dans une étude récente, Baumgarten (2007) a lié une augmentation de l’usage de und en début de phrase en allemand à l’influence de l’anglais. J’ai été frappée par une similarité entre toutes les dépêches dans lesquelles les exemples ont été repérés. Les cinq occurrences de et se trouvent réparties dans quatre dépêches qui ont toutes un rapport direct à un pays germanophone. Les deux exemples dans les Nouvelles ordinaires se trouvent dans une dépêche envoyée de Vienne et les trois exemples dans la Gazette se trouvent dans des dépêches qui traitent d’événements en Allemagne. Il est peu surprenant de trouver des exemples dans des dépêches qui rendent compte d’événements touchant les pays germanophones parce que mon corpus coïncide avec la Guerre des Trente Ans (1618-1648). Mais ce qui est surprenant, c’est le fait que ce n’est que dans ce type de dépêche que les occurrences de et paraissent. Bien évidemment, le nombre très réduit d’occurrences empêche d’émettre l’hypothèse de l’interférence venant de langues germaniques, et ce d’autant qu’il y a plus d’exemples dans la Gazette que dans les Nouvelles ordinaires, mais je voudrais attirer l’attention sur ce point comme un aspect à explorer dans une étude future.

Il est intéressant d’examiner l’usage beaucoup plus fréquent de l’esperluette qui figure un total de 459 fois dans le corpus, avec une fréquence plus élevée dans les Nouvelles ordinaires que dans la Gazette (24,72 contre 20,62 par 1 000 mots[14]). J’ai utilisé Sketch Engine pour analyser les collocations de l’esperluette et les résultats sont révélateurs[15]. Ils montrent que les mots mois, ans et desd. (desdits) figurent dans la liste des 20 collocations les plus fréquentes de l’esperluette dans les Nouvelles ordinaires mais non pas dans la liste équivalente pour la Gazette. Cette différence s’explique par le fait que, dans les Nouvelles ordinaires, l’esperluette figure de manière beaucoup plus fréquente dans les informations marginales qui accompagnent les dépêches pour fournir la date et le lieu d’origine comme dans l’exemple (2).

L’expression desd. mois & an est utilisée onze fois dans les Nouvelles ordinaires mais ne paraît que deux fois dans la Gazette. J’ai déjà établi un lien entre l’usage de l’abréviation desd. et la concision relative du cahier Nouvelles ordinaires qui serait un effet de traduction (McLaughlin 2021 : 326). L’usage plus fréquent de l’esperluette dans les Nouvelles ordinaires semble donc, en partie au moins, refléter le statut traduit des dépêches publiées dans ce cahier.

Il est aussi intéressant de noter que le pronom impersonnel on figure dans la liste des collocations les plus fréquentes pour l’esperluette dans les Nouvelles ordinaires mais non pas dans la Gazette. Il figure pour la plupart dans des exemples tels que (3) où l’esperluette a pour fonction d’ajouter à travers la coordination une phrase qui fournit des informations sur ce que disent ou pensent les gens.

Cette différence entre la Gazette et les Nouvelles ordinaires a attiré mon attention parce que j’ai déjà constaté la fréquence plus élevée du pronom on dans les Nouvelles ordinaires en général (McLaughlin 2021 : 327-329) et proposé deux explications : c’est soit un effet de traduction provoqué par un usage plus fréquent en allemand du pronom impersonnel mann, soit un reflet d’une particularité du style des gazettes écrites en langues germaniques parce qu’elles signalaient de manière plus précise les sources externes ou l’incertitude des informations. Les résultats de la présente étude confortent la deuxième hypothèse parce qu’ils mettent au jour un contexte particulier dans lequel on se manifeste plus souvent dans les Nouvelles ordinaires, c’est-à-dire en ajoutant du discours rapporté. On examinera l’usage de on avec les verbes introducteurs de discours dans le contexte de l’universel de la normalisation dans la partie 3.3.1.

3.2.2 Le passif

Cette étude de cas porte sur le passif, une construction qui a souvent attiré l’attention des chercheurs travaillant sur la traduction[16]. Comme indiqué ci-dessus (partie 1), j’ai déjà eu l’occasion d’examiner la construction passive en être + participe passé dans la Gazette de France. J’ai lié une surexploitation de constructions passives dans les Nouvelles ordinaires – et dans les nouvelles venant de Londres en particulier – à l’interférence (McLaughlin 2021 : 177-180), une analyse analogue à celle que j’ai faite de dépêches d’agences de presse contemporaines (McLaughlin 2011 : 55-76). J’ai donc voulu approfondir ce travail en examinant non pas l’usage général du passif, mais l’usage de ses formes dites « longues » et « courtes », c’est-à-dire avec et sans agent. Les deux formes sont grammaticales en français du XVIIe siècle et, comme c’est le cas aujourd’hui, différents types de facteurs peuvent entrer en jeu pour déterminer si l’agent sera exprimé ou non. Dans cette étude, j’explore l’hypothèse que les passifs longs seraient plus fréquents dans les Nouvelles ordinaires à cause de l’universel de l’explicitation.

Le tableau 5 présente la fréquence des constructions passives avec et sans agent dans la Gazette de France.

Tableau 5

Fréquence des constructions passives

Fréquence des constructions passives

-> Voir la liste des tableaux

Le tableau 5 témoigne de la différence entre la Gazette et les Nouvelles ordinaires que j’ai déjà détaillée (McLaughlin 2021 : 177-180) : les passifs sont en général plus fréquents dans les Nouvelles ordinaires que dans la Gazette. Cela dit, en appliquant le test de log-likelihood pour la première fois ici, il émerge que cette différence n’est pas significative (log-likelihood = 1,41, p> 0,05). En outre, les informations concernant les deux types de constructions passives ne confirment pas l’hypothèse que les passifs longs seraient plus fréquents à cause de l’explicitation ; il y en a 23 dans la Gazette et 22 dans les Nouvelles ordinaires, ce qui représente une fréquence moyenne de 2,22 par 1 000 mots dans les deux cahiers. Même si cette analyse ne permet pas de confirmer l’hypothèse dérivée de l’universel de l’explicitation, elle fournit des informations intéressantes sur le type d’interférence qui serait présente dans les Nouvelles ordinaires. Si une étude basée sur un corpus plus large confirme que les constructions passives sont plus fréquentes dans les Nouvelles ordinaires que dans la Gazette, ce sera sans doute la fréquence des passifs courts et non pas celle des passifs longs qui augmente dans la présence apparente de la traduction.

3.3 La normalisation

Selon les propos de Loock (2016 : 183), la normalisation est « la tendance qu’auraient les traducteurs à surexploiter les caractéristiques de la langue cible, en se conformant à des choix linguistiques typiques, standard, et donc par conséquent moins créatifs ». Cet universel a été illustré à plusieurs niveaux linguistiques depuis sa proposition initiale par Baker (1993). Pour le niveau lexical, citons une enquête importante par Kenny (2001) qui a lié un usage moins fréquent de hapax (legomena) et de collocations créatives à la normalisation. Pour le niveau lexico-grammatical, citons la recherche de Hansen-Schirra (2011) qui a découvert une surexploitation générale dans la traduction de toute une série de traits considérés comme typiques de textes de la fiction dont, par exemple, l’usage de l’aspect perfectif et d’adverbiaux temporels. J’ai donc décidé d’examiner les niveaux grammatical et lexical ici à travers une analyse de l’usage du pronom on dans le discours rapporté (partie 3.3.1), et une analyse de la queue de liste (list tail en anglais) (partie 3.3.2).

3.3.1 On et le discours rapporté

Cette étude de cas porte sur l’usage du pronom impersonnel on dans le contexte du discours rapporté. Ce trait a été choisi parce qu’il peut être considéré comme caractéristique du genre journalistique dans la première moitié du XVIIe siècle (McLaughlin 2021 : 47). L’usage de on avec un verbum dicendi, scribendi ou sentiendi représente une stratégie primordiale du discours rapporté dans les premières publications périodiques de langue française. Ceci est illustré de manière iconique par le titre de l’essai « On dit » écrit par le grand spécialiste de la presse française historique, Jean Sgard (1991). Dans son essai, Sgard (1991 : 27) attribue la fréquence de formules telles que on assure et on écrit dans les gazettes historiques au fait qu’elles se composent pour l’essentiel de citations (anonymes) de différentes sortes de sources (discours, communiqués officiels, dépêches de correspondants étrangers, etc.) et il communique le même effet de distanciation qu’il a dans la presse contemporaine. Le fait que ce pronom impersonnel ait déjà attiré mon attention à plusieurs reprises m’a conduite à examiner de plus près le lien éventuel entre son usage et le processus de traduction.

J’ai commencé par examiner l’usage du modalisateur lexicalisé on dit. L’outil Sketch Engine a permis d’extraire toutes les occurrences de ses formes sans et avec inversion : on dit et dit-on[17]. Les résultats sont présentés dans le tableau 6.

Tableau 6

Fréquence de on dit / dit-on

Fréquence de on dit / dit-on

-> Voir la liste des tableaux

Les résultats présentés dans le tableau 6 semblent confirmer l’hypothèse de traduction puisque on dit est beaucoup plus fréquent dans les Nouvelles ordinaires que dans la Gazette. Cela dit, le nombre très réduit d’occurrences rend impossible d’en tirer une conclusion ferme à travers une évaluation de leur signification.

Pour élargir la portée de l’enquête, j’ai examiné l’usage général du pronom impersonnel on avec tous les verbes qui peuvent servir à rapporter le discours. J’ai utilisé Sketch Engine pour extraire toutes les occurrences du pronom impersonnel dans les deux cahiers. Une analyse manuelle a permis d’identifier celles qui impliquent un verbumdicendi, sentiendi ou scribendi comme l’exemple (4) où le verbe qui sert à rapporter le discours est le verbe rapporter lui-même.

L’exemple (4) illustre clairement le principe décrit par Sgard (1991) : les informations présentées sont bien évidemment de seconde main mais leur source et le canal de transmission restent imprécisés. Le tableau 7 présente la fréquence générale de on dans le corpus et aussi sa fréquence avec les verbadicendi, sentiendi et scribendi[18].

Tableau 7

Fréquence de on

Fréquence de on

-> Voir la liste des tableaux

Le tableau 7 témoigne d’une grande différence en ce qui concerne l’usage de on dans les deux cahiers : il est utilisé 53 fois dans la Gazette, mais 81 fois dans les Nouvelles ordinaires, ce qui représente une différence de 52,83 %. Le test de log-likelihood confirme la signification de cette différence (log-likelihood = 7,25, p < 0,05). Le fait que les constructions impersonnelles soient considérées un trait typique de ce genre (McLaughlin 2021 : 60-61) implique que la fréquence beaucoup plus élevée du pronom on dans les Nouvelles ordinaires peut être interprétée comme une normalisation produite par le processus de traduction. La même analyse s’applique à l’usage de on pour rapporter le discours : comme l’a indiqué Sgard (1991 : 27), ces constructions sont typiques de la Gazette de France à cette époque et elles sont 70,83 % plus fréquentes dans les Nouvelles ordinaires. Le test de log-likelihood confirme l’importance de cette différence aussi (log-likelihood = 5,31, p < 0,05).

Il faut noter, à ce stade de l’enquête, l’existence d’une explication alternative : au lieu d’être une normalisation introduite par le processus de traduction, les fréquences plus élevées signalées dans le tableau 7 pourraient être des exemples de l’interférence soit du type grammatical, soit du type stylistique. L’existence de deux explications possibles n’est en effet pas surprenante ; l’une des contributions les plus importantes de l’étude de Hansen-Schirra (2011) est d’avoir souligné ce qu’elle appelle « l’hybridisation », c’est-à-dire la présence simultanée de la normalisation et de l’interférence. Un examen qualitatif des exemples fournit une confirmation supplémentaire de l’hypothèse de traduction à travers cet universel de l’interférence. En examinant toutes les occurrences du pronom impersonnel avec les verbadicendi, sentiendi et scribendi, j’ai remarqué plusieurs différences entre les deux cahiers. Deux cas sont particulièrement intéressants. Citons premièrement le cas de croire et de son synonyme proche tenir. Le verbe croire est le verbe rapporteur le plus fréquent avec on dans la Gazette où il paraît quatre fois. Il est donc surprenant que ce verbe ne s’emploie pas dans ce même contexte dans les Nouvelles ordinaires. Dans ce deuxième cahier, le verbe le plus fréquent est tenir, un verbe polysémique dont une acception métaphorique est très proche de celle de croire[19]. Il me semble probable que tenir ait été sélectionné au lieu de croire dans les Nouvelles ordinaires sous l’influence du verbe allemand halten qui partage avec tenir et non pas avec croire la coexistence des acceptions métaphorique et littérale[20]. Ce principe est illustré par la paire d’exemples (5) et (6) tirés de la Gazette et des Nouvelles ordinaires.

La similarité des exemples (5) et (6) renforce l’hypothèse que tient s’emploie au lieu de croire dans les Nouvelles ordinaires. Une analyse similaire s’applique au verbe parler qui ne s’emploie pas avec on dans la Gazette, mais qui paraît quatre fois avec ce pronom dans les Nouvelles ordinaires comme l’illustre (7).

Même s’il n’y a rien d’agrammatical dans l’usage de parler avec la préposition de dans l’exemple (7), je suggère que cette construction est surexploitée dans les Nouvelles ordinaires à cause de l’usage de sprechen von en allemand[21]. Ces deux cas particuliers illustrent exactement le même type d’effet relevé par Hansen-Schirra (2011 : 140-142) qui a identifié, à côté de la surexploitation de traits typiques dans les textes traduits, une surexploitation de traits atypiques qui peut être attribuée à l’interférence. Même s’il n’est pas possible de trancher entre les effets de la normalisation et ceux de l’interférence dans la présente analyse, il est toutefois évident que globalement les résultats confirment l’hypothèse de traduction.

3.3.2 La queue de liste

Cette étude de cas est inspirée par le travail de Kenny (2001) qui a fourni des preuves très convaincantes de la normalisation à travers une analyse des hapax. J’ai utilisé l’outil Word List de Sketch Engine pour créer les queues de liste pour la Gazette et pour les Nouvelles ordinaires, c’est-à-dire la liste de mots (types) qui ne paraissent qu’une seule fois. Le tableau 8 fournit des informations générales sur la taille de chaque liste : il indique le nombre de mots (types) dans chaque liste et la proportion cumulative de tous les mots (occurrences) que représente chaque liste.

Tableau 8

Queue de liste

Queue de liste

-> Voir la liste des tableaux

Le tableau 8 montre que la queue de liste de la Gazette est plus longue que celle des Nouvelles ordinaires et qu’elle représente une proportion plus large des mots dans le corpus. Le test de log-likelihood montre que le résultat est significatif au seuil de 0,10 mais non pas au seuil de 0,05 (log-likelihood = 2,81, p> 0,05). Cette différence peut être interprétée comme un reflet de la normalisation dans les Nouvelles ordinaires parce que les hapax représentent une proportion plus limitée de tous les mots (occurrences). Notons en passant que la proportion de hapax est relativement basse par rapport à d’autres corpus comme par exemple le corpus de textes littéraires allemands examiné par Kenny (2001 : 105-141) où 57,56 % des mots (types) sont des hapax[22]. La différence est sans doute le reflet d’un trait du genre de discours, la Gazette de France se caractérisant à cette époque par son uniformité thématique, lexicale et stylistique (McLaughlin 2021 : 149-150).

J’ai aussi voulu examiner la queue de liste dans une perspective qualitative. La longueur des deux listes a empêché une lecture comparative générale donc j’ai commencé par analyser tous les mots dans ces listes qui commencent par la lettre p-[23] : au total, il s’agit de 312 mots (157 pour la Gazette et 155 pour les Nouvelles ordinaires). Ce faisant, j’ai remarqué une présence plus élevée d’adverbes qui se terminent par le suffixe adverbial -ment dans les Nouvelles ordinaires : il y en a deux dans la Gazette mais sept dans les Nouvelles ordinaires. J’ai donc décidé d’examiner l’usage général des adverbes en -ment dans les deux cahiers et les résultats sont présentés dans le tableau 9.

Tableau 9

Adverbes en -ment

Adverbes en -ment

-> Voir la liste des tableaux

Le tableau 9 montre de manière claire que les adverbes en -ment sont presque deux fois plus fréquents dans les Nouvelles ordinaires que dans la Gazette. Le test de log-likelihood montre que ce résultat est significatif au seuil de 0,01 (log-likelihood = 6,73, p < 0,05). De nouveau, il n’est pas possible de trancher entre la normalisation et l’interférence pour expliquer cette différence. Il est possible de l’imputer à la normalisation car ce type d’adverbe était fréquemment utilisé à l’époque (Hummel 2018). Mais il serait également possible d’y voir un effet de l’interférence si les adverbes s’avéraient plus fréquents dans les périodiques de langues germaniques. Bien évidemment il va falloir attendre une étude comparative des périodiques historiques français et germaniques pour pouvoir tester cette hypothèse. Si les différents résultats présentés dans cette partie 3.3 confirment l’hypothèse de traduction, ils soulignent également un besoin urgent d’études linguistiques comparatives et diachroniques des périodiques historiques de différentes langues.

4. Conclusion

L’objectif de cet article était de mettre à profit les progrès faits dans deux domaines de la traductologie pour tester de manière plus approfondie l’hypothèse que les Nouvelles ordinaires se composent de dépêches traduites de périodiques écrits en langues germaniques (dénommée « hypothèse de traduction » dans cet article). Les travaux en traductologie de corpus et les recherches sur la traduction journalistique ont permis de formuler et de tester une série d’hypothèses concernant les traits caractéristiques de la langue de la traduction en général et de la langue de la traduction journalistique plus particulièrement. J’ai présenté dans la partie 3 une série de trois paires d’études de cas liées à trois différents universaux de traduction.

Les deux études de cas liées à l’universel de la simplification ont produit des résultats mixtes. Si les résultats de l’analyse de la longueur des phrases constituent une première indication que les dépêches publiées dans les Nouvelles ordinaires sont des traductions (partie 3.1.1), l’étude plus poussée de la diversité lexicale de ce périodique n’a pas abouti à des résultats concluants. Le seul résultat présenté dans la partie 3.1.2 qui conforte l’hypothèse de traduction concerne la proportion des mots dans le corpus qui sont représentés par la tête de liste ; les deux autres résultats ne permettent pas de vérifier l’hypothèse en question. Les études de cas liées à l’universel de l’explicitation ont donné elles aussi des résultats mixtes. La fréquence plus élevée des connecteurs relevée dans la partie 3.2.1 apporte une confirmation de l’hypothèse de traduction. Ce résultat est appuyé par l’analyse de l’esperluette dont la fréquence plus élevée dans les Nouvelles ordinaires semble être au moins en partie un reflet du niveau de concision plus élevé de ce cahier, une caractéristique qui a déjà été liée ailleurs au processus de la traduction (Haffemayer 2002 : 212 ; McLaughlin 2011 : 21 ; 2021 : 326). En revanche, la stabilité parfaite de la fréquence des passifs longs dans les deux cahiers ne permet pas de confirmer l’hypothèse de traduction (partie 3.2.2). Le fait que cette étude ne concerne que 112 occurrences du passif au total souligne l’intérêt d’une recherche future. L’examen d’un corpus plus large pourrait permettre de confirmer la signification statistique de la différence entre la Gazette et les Nouvelles ordinaires en ce qui concerne les constructions passives (longues et courtes) en général et cette différence serait attribuable à l’interférence provoquée par les textes source en langues germaniques. Enfin, les résultats des deux études de cas liées à la normalisation fournissent des preuves relativement solides de l’hypothèse de traduction. L’étude présentée dans la partie 3.3.1 témoigne d’une grande différence entre les deux cahiers en ce qui concerne l’usage de on, surtout quand il s’agit de rapporter le discours. De même, l’analyse de la queue de liste dans la partie 3.3.2 a révélé une grande différence entre les deux cahiers en ce qui concerne la fréquence des adverbes en -ment. Dans ces deux cas, faute d’une étude comparative des périodiques de langues germaniques, il s’est avéré impossible de trancher entre la normalisation et l’interférence pour expliquer les différences découvertes.

Pris dans leur ensemble, les résultats des trois paires d’études de cas semblent confirmer l’hypothèse que les Nouvelles ordinaires se composent de dépêches traduites de périodiques germaniques. En ceci, la contribution principale de cette étude est d’avoir fourni des indications plus rigoureuses du statut traduit du deuxième cahier de la Gazette de France. Mais les résultats permettent aussi de réfléchir de manière plus approfondie à la question méthodologique. Mes premières remarques concernent la nature des preuves. Il est frappant que même sans avoir inclus des études de cas basées sur l’universel de l’interférence, les résultats des études de cas m’ont souvent amenée à l’évoquer comme l’explication la plus probable. Ceci attire notre attention sur la valeur des différents types de preuves et il me semble raisonnable de proposer que les preuves fournies à travers l’universel de l’interférence soient en général plus fiables que celles fournies à travers les autres universaux parce que ceux-ci sont en quelque sorte moins directs. Cela implique que les études comme celle-ci qui visent à identifier la présence de la traduction, devront peut-être privilégier les hypothèses qui se basent sur l’universel de l’interférence. Bien sûr, comme dans le cas présent, un corpus parallèle n’est pas toujours disponible. Dans ces cas, il serait toujours recommandable d’inclure une pluralité d’analyses inspirées par les différents universaux.

Nos dernières remarques sur la méthodologie concernent le croisement de deux domaines de recherche en traductologie. Le présent article applique les progrès méthodologiques de la traductologie de corpus aux recherches sur la traduction journalistique (historique) comme forme de traduction spécialisée. Le travail présenté ici dévoile ainsi des enjeux en dehors du courant principal des études en traductologie de corpus, qui portent sur d’immenses corpus de textes littéraires traduits et originaux. Ce travail confirme l’existence d’un certain nombre d’obstacles importants dans la recherche sur cette forme de traduction spécialisée, dont surtout l’absence de corpus existants, l’absence de versions numérotées des périodiques historiques, la difficulté d’identifier les sources originales des informations traduites, et la rareté d’études contrastives de périodiques historiques de langues différentes. Si l’on assiste aujourd’hui au « tournant statistique » (Kübler, Loock et Pecman 2018 : 577) de la traductologie de corpus, il n’est pas évident que celui-ci puisse toucher de manière simultanée toutes les formes spécialisées de traduction. J’ai tenté de montrer ici que les méthodes associées à la première phase de la traductologie de corpus par Ji (2019 : 7-8) restent utiles, surtout pour une première étude qui est de par sa nature exploratoire. Les obstacles sont particulièrement importants quand on s’intéresse à la pratique historique de la traduction journalistique. On peut cependant espérer que les progrès technologiques – surtout en ce qui concerne l’apprentissage automatique – rendront bientôt possible de compiler dans ce domaine le type de corpus de taille importante qui inspire et facilite la recherche sur la traduction littéraire moderne. Un tel corpus permettrait de suivre une démarche similaire pour identifier la présence de la traduction, mais à un niveau de sophistication plus élevé en employant les statistiques inférentielles et exploratoires prônées par Ji (2019 : 7-8). Je suspecte qu’alors, on découvrira que la traduction était encore plus importante qu’on ne le pense aujourd’hui pour la production et la circulation des informations dans la période prémoderne.