26 (2005)

Anne Bandry-Scubbi et Françoise Deconinck-Brossard

De la lexicométrie à la stylostatistique ? Sterne et Swift :  textes croisés*

La question provient du dialogue qui nous amène depuis plusieurs années à confronter nos expériences d’analyse textuelle assistée par ordinateur (A.T.A.O.) sur des documents du dix-huitième siècle1. L’une d’entre nous travaille surtout sur les romans, l’autre sur les sermons, avec des logiciels qui tous participent de la démarche lexicométrique2. Ces outils servent à mesurer la « fréquence »3 des formes lexicales, des co-occurrences ou des expressions figées, pour ensuite leur appliquer divers traitements statistiques. Il est permis de se demander s’ils peuvent également servir à mesurer le style.

Le corpus électronique ici rassemblé croise des séries de textes rédigés par deux grandes figures des Lumières anglaises, Jonathan Swift (1667-1745) et Laurence Sterne (1713-1768) : onze ou douze sermons composés par le doyen de Saint Patrick4, les neuf volumes de Tristram Shandy5, les deux tomes du Voyage Sentimental6, ainsi que les quarante-cinq sermons du même auteur7. Pour comparaison, nous disposons aussi d’un corpus homilétique plus large, permettant de situer les textes étudiés dans le contexte de la prédication anglaise au dix-huitième siècle, y compris le méthodisme naissant8 et les sermons manuscrits de John Sharp III (1723-1792), prébendier de Durham et archidiacre du Northumberland9, dont on peut imaginer qu’ils reflètent l’oralité du genre mieux que les ouvrages imprimés. Les quatre livres des Voyages de Gulliver constituent, à l’évidence, un autre texte de référence10. S’il est intéressant de voir figurer, dans un même corpus, l’œuvre homilétique et narrative d’un même auteur, le cas le plus remarquable est sans doute le sermon de Sterne The Abuses of Conscience¸ publié d’abord séparément à York en 175011, puis intégré avec des variantes mineures dans le deuxième volume de Tristram Shandy en 175912 avant d’être republié dans la collection des sermons de Yorick en 176613.

Par définition, un sermon est un texte partant d’un autre texte, citation biblique liminaire qui lui sert de pré-texte (ou de prétexte) et que les prédicateurs anglophones désignent habituellement comme « the text » ou bien « my text14.» Comme le montre la découverte accidentelle du sermon dans Tristram Shandy, la loi du genre est l’intertextualité15. Bible et sermon forment un intertexte obligatoire  qui permet de repérer l’appartenance d’un texte à ce genre discursif: « ‘tis more like a sermon, — for it begins, with a text of scripture, and the chapter and verse; — and then goes on, not as a chariot, — but like a sermon directly » (TS II, 15, 138). L’insertion du sermon dans le roman situe ce discours hors contexte, à bien des égards. C’est un personnage secondaire, militaire et non pasteur, qui lit, dans un salon et non dans une église, un sermon qui se trouvait, non dans un livre de dévotion, mais dans un ouvrage de Stevinus sur les fortifications militaires. Si le discours retrouve son oralité, car il est lu à haute voix, il n’en est pas moins interrompu par les commentaires des auditeurs et par diverses séquences narratives qui l’incorporent au récit :  

 Trim made a bow, and read as follows:

The SERMON.

Hebrews xiii. 18.

For we trust we have a good Conscience.—

“TRUST! – Trust we have a good conscience!”

[Certainly, Trim, quoth my father, interrupting him, you give that sentence a very improper accent;….] (TS II, 17, 143)

Devant cette « transgression générique caractérisée »16 se pose la question de savoir dans quelle mesure ce chapitre qui incorpore un texte non fictionnel se distingue du roman dans son ensemble. Inversement, l’on peut se demander si le sermon choisi comporte plus ou moins d’éléments narratifs que la prédication habituelle de Sterne ou de ses contemporains. A ce titre, nous aimerions en particulier tester certaines hypothèses du linguiste américain Douglas Biber sur les traits linguistiques caractérisant la production impliquée ou informationnelle, la référence (in)dépendante de la situation d’énonciation, l’orientation (non)narrative, la visée (non)persuasive et le style (im)personnel pour tenter d’identifier dans notre corpus des faits stylistiques caractérisant divers registres discursifs17.

La démarche lexicométrique se fonde essentiellement sur la mesure du vocabulaire. La fonction documentaire des divers logiciels utilisés18 fait d’abord apparaître la structure lexicale du corpus étudié. Ainsi, le sermon 27 de Sterne a une étendue de 3878 occurrences et comporte 1176 vocables distincts. Pour le chapitre correspondant de Tristram Shandy (II.17), les chiffres sont respectivement de 7646  et 2002. L’on retiendra donc par approximation que ce chapitre est environ deux fois plus long que le sermon incorporé.

Le rapport entre l’effectif des vocables et des occurrences, qu’en anglais on appelle type/token ratio, est l’un des indicateurs traditionnels de la délicate notion de « richesse » lexicale19. Toutefois, dans la mesure où la longueur des textes étudiés peut l’infléchir considérablement, il n’est pas d’un emploi très commode. Si la valeur en est plus élevée (3,81) pour le chapitre II.17 que pour le sermon 27 de Sterne (3,29), cela ne signifie nullement que le roman est d’une écriture plus « riche ». La différence tient sans doute seulement à la longueur relative des deux textes. Un autre indice de « richesse » de vocabulaire est la proportion de formes lexicales employées une seule fois, donc traditionnellement désignées par le terme grec hapax [legomena]. C’est un critère qui privilégie « l’excentricité » de l’écriture, voire de la typographie20. Assez souvent leur nombre augmente avec la longueur du texte. Ce n’est pas le cas dans notre corpus : ces termes rares représentent 20% des occurrences utilisés dans le sermon 27, mais seulement 17% du chapitre II.17. Une telle différence reflète simplement la structure en miroir du chapitre, dont le texte commente le prêche interprétant un verset scripturaire. Il est logique d’y trouver une certaine redondance. Si l’on rapporte le nombre des hapax à celui des vocables distincts, alors la proportion s’élève respectivement à 66% pour le sermon et 65% pour le chapitre. De ce point de vue, sermon et chapitre ont le même excès d’hapax puisque normalement les formes lexicales de fréquence 1 représentent environ la moitié des vocables distincts d’un corpus donné21.

La lexicométrie propose souvent un calcul statistique de type probabiliste qui cherche à définir les « spécificités » des textes étudiés. Il s’agit de repérer les « formes "anormalement" fréquentes dans une partie du corpus22,» donc les termes d’une originalité disproportionnée, soit à l’intérieur du corpus étudié, soit par comparaison avec un corpus externe. En général les logiciels développés dans le monde francophone effectuent ce calcul de caractérisation des termes clefs par référence endogène. Lorsque le sermon 27 de Sterne et le chapitre correspondant de Tristram Shandy sont considérés ensemble, le sermon est doublement pris en compte : une fois seul et une autre fois mêlé aux commentaires sur sa lecture23. L’analyse des spécificités de chacun des deux textes par rapport à l’autre fait donc apparaître des traits d’écriture qui permettent d’avancer certaines hypothèses de différentiation.

« Quoth », « replied » et « said » comptent parmi les termes spécifiques du chapitre par comparaison avec le sermon, la quasi-totalité des occurrences figurant, sans surprise, dans les éléments du chapitre qui ne reprennent pas le sermon (à l’exception de deux occurrences de « said » sur un total de 75). Dans un contexte plus large, « quoth » et « replied » appartiennent aux spécificités de ce chapitre par rapport au reste des deux premiers volumes de Tristram Shandy ainsi qu’à celles du second tome relativement à l’ensemble du roman (avec respectivement 2,5 et 2 fois plus d’occurrences que le nombre attendu). En effet, les deux termes apparaissent déjà de manière forte et conjointe dans le chapitre qui introduit le personnage de Trim pour relater le projet de l’aménagement du boulingrin en villes fortifiées miniatures (19 occurrences dans TS II, 5, 110-112). Le fidèle serviteur de Toby donne désormais la réplique à son maître. Sterne a donc utilisé de manière encore plus intensive la même paire de mots pour insérer le sermon dans son récit par un dialogue rapporté au passé faisant intervenir les deux interlocuteurs précédents : Trim lit le sermon pendant que Toby, Walter et Slop le commentent.

Parmi les spécificités du chapitre se trouvent aussi « I » et « my ». Leur faible présence dans le sermon confirme la différence d’écriture avec la partie dialoguée, où figurent les trois quarts des occurrences de « I » et les neuf dixièmes de celles de « my » (respectivement 132 et 94 au total). Ce contraste semble pertinent dans le cas présent car le poids de la première personne ne singularise ni le chapitre parmi les autres, ni le volume dans l’ouvrage entier24. En revanche, ce sermon s’appuie un peu plus sur « I » et « my » que la moyenne des sermons de Sterne (respectivement 4,7% et 5,6% des occurrences de ces formes pour un poids de 2,8% dans ce corpus) en raison de la concentration de ces vocables dans un court épisode narratif donné en illustration : « I know the banker I deal with, or the physician I usually call in, … »25. Cependant, en l’état actuel de nos données, le sermon 27 de Sterne ne se distingue pas ici de la littérature homilétique contemporaine. Dans la mesure où l’utilisation de la seconde personne ne permet pas de distinguer l’écriture sermonnaire de celle de la fiction, ni le sermon ou le chapitre parmi leurs semblables26, le dialogue qui s’entrelace au prêche repose principalement sur les verbes au passé et sur la première personne. C’est en fait le possessif qui permet le mieux de comprendre la stratégie d’écriture.

Une concordance montre que, dans le chapitre, « my » est avant tout employé par le narrateur ; trois quarts des occurrences désignent le père et l’oncle de Tristram en train d’assister à la lecture du sermon (36 « my father » et 27 « my uncle »). A neuf reprises (soit 10% de l’ensemble), « my » se rattache à l’acte de lecture, aux exclamations de Trim qui prend ce qu’il lit à la lettre, évoquant son cœur, son mousquet et sa vie, sans faire de différence entre le texte abstrait et la « réalité » douloureuse qu’il imagine pour son frère, emprisonné au Portugal. Enfin, « my » sert aussi à désigner le sermon en tant que prétexte, car Toby explique qu’il est tombé de « my Stevinus, » le livre où il avait été inséré par mégarde et dont il est sorti par hasard ; il s’agit donc d’un pré-texte, prétendument inédit comme le déclare le personnage : « for it does not appear that the sermon is printed, or ever likely to be » (TS II, 17, 146). Walter, pour sa part, attribue le texte au pasteur de sa paroisse, prétexte servant d’annonce à la publication des Sermons véritables par Sterne sous le nom de Yorick quelques mois plus tard: « unless my judment greatly deceives me, — I know the author » (TS II, 17, 165). Un des ressorts du jeu shandéen apparaît clairement dans cette mise en abyme de l’acte de lecture.

Biber fournit des listes de mots et de formes syntaxiques pour chacun des registres qu’il propose. Les instruments dont nous disposons actuellement ne permettant de prendre en compte que certains de ces éléments, nos mesures sont seulement indicatives. Selon ce linguiste, un texte narratif comporte notamment une forte présence des formes du passé, des personnels et possessifs de la troisième personne et d’une série de verbes d’assertion qu’à la suite de Quirk il appelle « public verbs »27. Les deux dernières caractéristiques se mesurent en intégrant dans le logiciel les listes des termes indiqués par Biber. Comme nous ne disposons pas encore d’analyseur syntaxique, comptabiliser les formes du passé s’avère délicat. Dans un premier temps, nous nous sommes contentées de faire établir par le logiciel la liste des mots se terminant par « -ed » et de la toiletter. 73% des occurrences du passé ainsi recensées se trouvent dans le chapitre, d’où un léger excédent par rapport au sermon, trop faible cependant pour être statistiquement significatif. Le résultat d’ensemble ne différencie pas clairement le sermon du chapitre, sans doute à cause de la double présence du texte homilétique dans le corpus :  un tiers des occurrences rassemblées pour estimer le caractère narratif d’un texte selon Biber se trouve dans le sermon, ce qui correspond à l’hypothèse d’équi-répartition. De plus, les spécificités examinées précédemment (ainsi qu’une simple lecture) montrent que la partie du chapitre hors sermon comporte une utilisation plus fréquente de la première que de la troisième personne et consiste surtout en un dialogue, effectivement au passé.  

Les formes caractéristiques de la « persuasion » définies par Biber selon une démarche similaire28 sont un peu plus présentes dans le sermon que dans le chapitre, même si le seuil statistique à partir duquel les écarts deviennent véritablement significatifs n’est pas atteint non plus. En effet, 35% des modaux de prédiction, des verbes de persuasion (« suasive verbs ») et des mots introduisant les propositions conditionnelles se trouvent dans le sermon, soit très légèrement plus que les 32% attendus29.  Dans un corpus plus global, constitué des prêches de Swift et de Sterne, de Gulliver’s Travels,  de Tristram Shandy et A Sentimental Journey, les formes de la « persuasion » distinguent effectivement les sermons de la fiction (Graphique 1)30 :

GRAPHIQUE 1 : Sterne et Swift, sermons et fiction - « PERSUASION »

Image1

L’on n’est guère surpris de constater que, dans l’ensemble des 57 sermons du corpus ici étudié, les verbes de persuasion dépassent toujours en nombre les verbes d’assertion considérés par Biber comme l’un des traits caractéristiques de la narration. L’éloquence de la chaire ne repose pas sur le récit, comme le rappelle Walter à Trim : « this is not a history, ‘tis a sermon thou art reading » (TS II, 17, 162). Certains discours toutefois comportent proportionnellement plus de verbes de persuasion que d’autres. C’est lorsque Swift prêche sur « les causes de la condition déplorable où se trouve l’Irlande »31 ou que Sterne évoque, dans un « sermon de charité » prêché pour le compte d’une institution philanthropique, la rencontre du prophète Elie avec la veuve de Sarepta32 ou ailleurs encore la parabole de Lazare avec l’homme riche33, que la persuasion s’affirme le plus, malgré le recours à des épisodes narratifs. La notion de « littérature engagée » serait sans doute anachronique, mais l’insistance persuasive de discours relatifs à des questions socio-politiques n’a peut-être rien de fortuit. Il importe également d’observer ici que l’écriture sermonnaire n’est pas monolithique. Chaque texte propose des variations particulières sur le thème rhétorique général. Toutefois, la démarche persuasive dans le discours sur les abus de la conscience ne présente aucun trait saillant: de ce point de vue, le sermon 27 semble assez banal dans le contexte de la prédication sternienne.

Dans le roman au contraire, l’emploi des hapax distingue clairement le chapitre 17 des autres chapitres du deuxième volume, à l’exception des numéros 3 et 19. Si l’on peut considérer les mots rares comme des indices de différenciation stylistique34, il ne manque pas d’intérêt d’observer que le chapitre incorporant un sermon diffère sensiblement de son contexte fictionnel. Les deux autres chapitres sont presque aussi particuliers, construits sur une accumulation de termes uniques qui détaillent les hobby-horses poliorcétique et obstétrique des frères Shandy  au point de mettre Toby et Mrs Shandy en danger, ainsi que l’annonce Tristram : « ‘Twas not by ideas, by heaven ! his life was put in jeopardy by words » (TS II, 2, 101)35. La singularité de ces concentrations de hapax devient menaçante (et cocasse) lorsqu’elle envahit le récit, rendant floues les frontières entre texte, contexte et hors-texte, comme le montre l’application par Trim du sermon à sa propre vie.

Une série de mesures plus abstraites permet de représenter graphiquement les rapprochements qui émergent de calculs complexes sur un grand nombre de données. Le principe consiste à « déterminer, au sein d'un espace à n dimensions, un système d'axes, appelés axes factoriels, tels que l'essentiel des proximités entre les points d'un tableau se voie dès les premiers plans des coordonnées. »36 L'analyse factorielle des correspondances peut porter sur la distance lexicale et situer graphiquement les textes les uns par rapport aux autres en visualisant les distances entre les parties du corpus selon la part de vocabulaire qu'elles ont en commun et la part de vocabulaire qui appartient en propre à chacune d'elles37. « Pour deux textes dont on cherche à apprécier la connexion, un mot contribue à rapprocher ces deux textes s'il est commun aux deux et à augmenter la distance s'il est privatif et ne se rencontre que dans un seul. »38

Une telle mesure appliquée à l’ensemble des sermons de Sterne et aux deux premiers tomes de Tristram Shandy divisés en chapitres donne des résultats assez  spectaculaires (Graphique 2) :39

GRAPHIQUE 2 : Tristam Shandy I-II & Sermons de Sterne
Analyse factorielle de la distance lexicale (1er et 2e facteurs)

Image2

L’axe horizontal représente le premier facteur, très important ici car il contient 57% de l’information ; il différencie de manière très nette les chapitres, tous situés à gauche de l’origine, des sermons, tous situés à droite. Statistiquement, et de manière globale, l’écriture sermonnaire et l’écriture de fiction n’emploient donc pas les mêmes formes. Il est logique que selon cet axe, le chapitre II.17 (désigné par 2I sur le graphique) soit le moins éloigné des sermons puisqu’il en contient un ; au contraire, le sermon 27 ne se distingue pas des autres, ce qui confirme son caractère banal déjà évoqué. Tant le chapitre que le sermon se détachent de leurs groupes respectifs pour se rapprocher l’un de l’autre selon le second facteur, figuré sur l’axe vertical. Le poids des facteurs permet de dire que le chapitre est avant tout différent du sermon même s’il le contient, puis, de manière beaucoup moins significative, semblable à lui, car ils ont une ordonnée identique40. C’est bien leur ressemblance qui les fait sortir des deux agrégats dans le graphique 2. L’analyse factorielle de la distance faite sur les chapitres considérés seuls place TS II.17 à la périphérie de l’ensemble sans l’en détacher. Le sermon ne fait pas partie de ceux qui se différencient des autres, comme le montre une représentation différente du même calcul de la distance dans le corpus des sermons de Sterne (Graphique 3) :

GRAPHIQUE 3 : Sermons de Sterne
Analyse arborée de la distance lexicale

Image3

La proximité des deux prêches isolés vient de leur caractère politique et du « recyclage » du sermon 32 (« Thirtieth of January ») dans le sermon 45 (« The Ingratitude of Israel »), avec de forts échos dans les sermons 21 (« National Mercies Considered » et 40 (« Asa : A Thanksgiving Sermon »)41. Sterne publia seulement vingt-sept sermons, ne jugeant sans doute pas utile de montrer à quel point il s’appuyait sur les pratiques des prédicateurs contemporains, habitués à prononcer plusieurs fois le même sermon dans des circonstances différentes. Il suffisait souvent de changer l’exorde ou la péroraison et d’ajouter quelques allusions aux questions d’actualité pour adapter le discours à un nouveau contexte42. Il n’est donc pas curieux que Sterne ait utilisé la même problématique pour commémorer l’exécution de Charles I (sermon 32) et célébrer l’ascension sur le trône de George III ainsi sans doute que son couronnement (sermons 21 et 40).  Il eut l’élégance, ou l’habileté, de placer le sermon 27 en dernier. Après sa mort, sa fille, prête à de nombreuses manœuvres pour profiter de sa renommée, n’hésita pas à utiliser les textes délaissés pour constituer trois volumes supplémentaires (sermons 28 à 45)43.  

Si on élargit le contexte homilétique à Swift, les mêmes rapprochements entre les sermons 32 et 45 de Sterne apparaissent dans l’analyse factorielle des distances lexicales (Graphique 4)44 :

GRAPHIQUE 4 : Sterne et Swift – sermons mêlés
Analyse factorielle de la distance lexicale (1er et 2e facteurs)

Image4

Plus important, les textes de chaque auteur se regroupent de manière nette selon le premier facteur (axe horizontal) et dans une moindre mesure selon le second, ce qui témoigne d’une différence entre leur écriture. Le sermon vraisemblablement apocryphe de Swift, « The Difficulty of Knowing One’s Self » (DIF dans le graphique), se détache de l’agrégat pour se rapprocher de ceux de Sterne, notamment « On Enthusiasm » (LS38). Les problématiques de ces deux textes sont proches et le thème fréquent tout au long du siècle45. Melvyn New montre comment Sterne revisite les thèmes de Swift dans ce sermon en actualisant les références tout en gardant la même argumentation46, ce qui implique des changements de vocabulaire et explique la proximité seulement relative avec les textes de Swift, plus forte selon le second facteur. De même, si les liens forts entre les sermons 27 et 4 de Sterne apparaissent aussi bien dans le graphique 3 que dans le graphique 4, seul le second facteur indique la proximité de ces textes avec « The Difficulty of Knowing One’s Self ». En revanche, l’analyse ne rapproche pas « On the Testimony of Conscience » (CON) et le sermon 27, alors que les emprunts sont avérés47.  

Si l’on étend encore la comparaison à d’autres prédicateurs contemporains de Sterne et de Swift, une analyse factorielle de correspondances calculée sur les « mots signifiants »48 de haute fréquence, dont on peut arguer qu’ils sont un bon indice stylistique49, les auteurs se distinguent bien les uns des autres (Graphique 5) :

GRAPHIQUE 5 : Sterne, Swift, Sharp, Wesley – sermons mêlés
analyse factorielle des mots signifiants de haute fréquence

Image5

Dans ce corpus plus large, Sterne et Swift se retrouvent voisins : le graphique les représente dans le même quadrant inférieur droit, avec des coordonnées très proches. Sur l’axe des abscisses, qui représente le premier facteur contenant ici 47,34% de l’information, John Sharp se rapproche plus que John Wesley d’autres anglicans comme Sterne et Swift. Faut-il y voir une distinction, au sein de l’Eglise établie, entre des textes rédigés pour publication et des homélies composées en vue d’une prestation orale? D’autre part, l’isolement de John Wesley à gauche du graphique préfigure-t-il le schisme que le fondateur du méthodisme refusa toujours de son vivant50 ?

Toujours est-il que ces résultats semblent bien confirmer l’hypothèse, souvent sous-jacente dans les travaux d’A.T.A.O. depuis l’étude pionnière de Louis Milic, d’une « signature » stylistique propre à chaque auteur51. La métaphore récurrente, en particulier dans les travaux rédigés par des anglophones, compare ces caractéristiques personnelles aux empreintes digitales : « linguistic fingerprints »52. L’idée inspire en particulier toute une lignée d’études en paternité (authorship studies) qui tentent d’identifier l’auteur d’œuvres anonymes ou apocryphes53. Nulle surprise donc si le sermon contesté de Swift, « The Difficulty of Knowing One’ Self » se trouve assez éloigné des autres prêches de l’auteur sur le graphique 4 : à vrai dire, si l’on n’en connaissait pas l’auteur supposé, on ne l’attribuerait pas au doyen de Saint-Patrick54.

C’est d’ailleurs bien le style du sermon lu par Trim qui permet à Walter de l’authentifier :

… — I know the author, for 'tis wrote, certainly, by the parson of the parish.

The similitude of the stile and manner of it, with those my father constantly had heard preach’d in his parish-church, was the ground of his conjecture … (TS  II, 17, 165-166)

Comme l’explique Milic, une telle hypothèse suppose que l’écriture, dans tous les sens du terme, reflète inconsciemment l’individualité55. Buffon n’avait-il pas affirmé que « le style est l’homme même »56 ? Si Walter avait pu repérer une constance d’expression chez le prédicateur local, cela ne prouve pas nécessairement que le pasteur recyclait en permanence ses sermons comme un mauvais enseignant réutilise ses vieilles préparations sur du papier jauni avec les années, mais plutôt que l’on peut attendre d’un auteur ayant atteint sa maturité une sorte d’invariabilité stylistique57. De telles habitudes lexicales ou syntaxiques doivent pouvoir se mesurer. L’on peut même se demander si la personnalité de l’auteur l’emporte sur le genre.

Autant que nous puissions le savoir, ce postulat n’a été que rarement remis en cause. A l’aide de méthodes informatisées de statistique lexicale appliquée aux œuvres que Romain Gary publia sous le pseudonyme d’Emile Ajar, Vina Tirvengadum conclut que le romancier, soupçonnant que certains critiques littéraires commençaient d’entrevoir la fraude, changea délibérément de technique pour le deuxième roman publié sous un nom d’emprunt. Voici qui tendrait à infirmer l’hypothèse selon laquelle certains éléments de style échappent au contrôle conscient de l'auteur58. Mais il s’agit ici d’une langue artificiellement créée par un écrivain s’efforçant de modifier son expression habituelle. De même que l’on peut contrefaire sa voix ou sa signature, de même il est possible de dénaturer son écriture. Cela n’empêche pas pour autant de reconnaître le style original. Il ne fallut pas longtemps aux contemporains de Swift pour identifier l’auteur apparemment anonyme des Voyages de Gulliver. L’empreinte stylistique ne trompe pas. Walter écoutant le sermon lu par Trim sait vite à qui en attribuer la paternité : « It was Yorick’s and no one’s else » (TS II, 17, 166).

Pourtant, l’auteur ainsi authentifié n’est qu’une persona. Sterne se joue du lecteur et en profite pour annoncer la prochaine publication de ses sermons dont il vient de présenter un échantillon : « this sample of his sermons » (TS II, 17, 167). Toutefois un lecteur attentif, ayant appris à ne pas prendre tout au pied de la lettre, peut se demander si le sermon incorporé au roman représente bien le style homilétique de Sterne. A la première lecture, Trim et Toby ont l’impression qu’il s’agit d’un texte très court : « ‘tis a very short one, replied Trim. — I wish it was longer, quoth my uncle Toby, for I like it hugely » (TS II, 17, 152). S’ils avaient pu disposer d’une machine à compter les mots, ils se seraient rendu compte que cette intuition tient plus de la fiction que de la réalité. Abuses of Conscience est un des sermons les plus longs de Sterne, mais il se situe dans la moyenne des autres sermons pris en compte dans cette étude. De même, si on affine la mesure entamée ci-dessus, que l’on combine tous les traits stylistiques définis par Biber pour caractériser l’orientation narrative d’un texte, et qu’on les applique à l’ensemble du corpus homilétique de Sterne et de Swift59, le sermon 27 ne se distingue pas spécialement des autres. A la différence du sermon 5 sur Elie et la veuve de Sarepta, qui toujours se différencie de la prédication contemporaine, quel que soit le critère d’évaluation, Abuses of Conscience resterait effectivement très banal, s’il n’avait été l’ « échantillon » choisi à juste titre comme digression dans un récit de fiction afin d’illustrer un genre plus persuasif que narratif. De l’auteur ou du genre, il semble donc que le genre l’emporte60, comme le suggère une dernière analyse de distance lexicale (Graphique 6) :

GRAPHIQUE 6 : Swift et Sterne, sermons et fiction
Analyse arborée de la distance lexicale

Image6 

Il faudrait évidemment affiner encore beaucoup ces mesures pour en arriver à une conclusion définitive. Hélas les instruments dont nous disposons sont encore bien imparfaits par comparaison avec la machine qu’avait imaginée le savant fou de Lagado : « he had emptyed the whole Vocabulary into his Frame, and made the strictest computation of the general Proportion there is in Books between the Numbers of Particles, Nouns, Verbs, and other Parts of Speech. »61

Documents annexes

Il y a 1 document annexé à cet article.

Notes de base de page numériques:

1  Voir par exemple notre article à quatre mains, « On peut compter sur Moll, » BSEAA XVII-XVIII 45 (novembre 1997) 171-90.
2  L’ouvrage classique dans ce domaine est Traitement statistique de données textuelles de Ludovic Lebart et André Salem (Paris : Dunod, 1988). Voir aussi la revue électronique Lexicometrica, disponible en ligne http://www.cavi.univ-paris3.fr/lexicometrica/ [26 août 2005].
3  Les statisticiens français voient dans ce terme un anglicisme, consacré par l’usage dans les milieux de l’A.T.A.O. : mathématiquement, il faudrait parler d’ « effectif ».
4  La paternité du sermon sur « la difficulté de se connaître soi-même », que pourtant la tradition attribue à Swift, est mise en doute depuis longtemps : voir Louis Landa, ed., Irish Tracts, 1720-1723, and Sermons, vol 9 de The Prose Works of Jonathan Swift, ed. Herbert Davies (Oxford : Basil Blackwell, 1948). Le texte de l’édition Landa fut numérisé à titre privé.  
5  Tristram Shandy fut obtenu au fur et à mesure de la numérisation de l’édition originale par Diana Patterson (1989-1990) ; il est maintenant disponible auprès de l’Oxford Text Archive <http://ota.ahds.ac.uk>  [26 août 2005].
6  A Sentimental Journey fut numérisé à titre privé à partir de l’édition World Classics (Oxford U P, 1984). Il peut être téléchargé sur le site de l’Oxford Text Archive (voir note ci-dessus).
7  The Sermons of Laurence Sterne: The Text, ed. Melvyn New (U P of Florida, 1996). Le texte en fut numérisé pour usage privé, à des fins de recherche personnelle.
8  Il existe au moins deux éditions électroniques des œuvres de John Wesley : The Works of John Wesley on Compact Disc (Franklin, Tennessee : Providence House Publishers, 1995) et Sermons and Hymns of John Wesley, ed. Richard P. Heitzenrater (Abingdon P, 1999) qui reprend l’édition scientifique The Works of John Wesley 1-4: Sermons I-IV, ed. Albert C. Outler (Nashville: Abingdon P, 1984-7). Les sermons de Wesley sont également disponibles sur Internet: <http://gbgm-umc.org/umhistory/wesley/jwesley3.html#top> [20 août 2005].
9  Les manuscrits de John Sharp se trouvent à la bibliothèque capitulaire de Durham (Grande-Bretagne). Le texte des sermons fut saisi sur ordinateur, en partie par Françoise Deconinck-Brossard en 1992 et 1995, en partie en 1992 par Joyce Carse au « Data Preparation Centre » de Durham. Une édition critique est en préparation, The Sermons of John Sharp (Woodbridge : Boydell & Brewer).
10  L’édition de 1735 est disponible en ligne : <http://www.gutenberg.org/dirs/etext97/gltrv10h.htm> [26 août 2005].
11  Laurence Sterne, The Abuses of Conscience : Set Forth in a Sermon, Preached in the Cathedral Church of St. Peter’s, York, At the Summer Assizes, Before the Hon. Mr. Baron Clive, And the Hon. Mr. Baron Smythe, On Sunday, July 29, 1750 (York: John Hildyard, 1750).
12  The Life and Opinions of Tristram Shandy, Gentleman ([York: Ward], 1760). La page de titre des deux premiers volumes porte la date de 1760 mais ils parurent en décembre 1759.
13  The Sermons of Mr. Yorick, Vols I & II (London: R. & J. Dodsley, [1760]. The Sermons of Mr. Yorick, Vols III & IV (London: T. Becket and P.A. De Hondt, 1766). Comme The Abuses of Conscience porte le numéro 27 dans l’édition savante citée ci-dessus qui sert maintenant de référence, nous le désignerons désormais par ce nombre.
14  Pascal Caillet choisit d’écrire le mot « Texte » avec une majuscule pour bien distinguer ainsi le verset biblique commenté dans le sermon : « Lecture stylistique d’un sermon de John Donne, » Bulletin de la Société de stylistique anglaise 23 (2002) 53.
15  Laurence Sterne, The Life and Opinions of Tristram Shandy Gentleman, eds. Melvyn & Joan New (U P of Florida, 1978-1984), désormais abrégé sous la forme TS. Les références indiqueront volume, chapitre et numéro de page dans cette édition.
16  Madeleine Descargues, Prédicateurs et journalistes : Petits récits de la persuasion en Grande-Bretagne au XVIIIe siècle : Swift, Addison, Fielding et Sterne (Villeneuve d’Ascq : P U du Septentrion, 2004) 96.
17  Douglas Biber, Variation across Speech and Writing (Cambridge U P, 1988).
18  Etienne Brunet, Hyperbase, logiciel hypertexte pour le traitement documentaire et statistique des corpus textuels, version Windows 5.0, INaLF, 2002.   WordMapper Text V8, Grimmer Logiciels, 2004 <http://www.grimmersoft.com/Fr/index_fichiers/WordMapperTextMining.htm> [26 août 2005].
19  Comme le souligne André Cossette dans La Richesse lexicale et sa mesure, « le nombre de formules ou indices qui ont été proposés depuis 40 ans pour mesurer la richesse lexicale laisse soupçonner un problème complexe » (Paris: Champion, 1994) 4.
20  Brunet, Manuel de référence : Hyperbase 5.0  (2002) 61.
21  Christopher S. Butler, ed. Computers and Written Texts (Oxford: Blackwell, 1992) 147.
22  Lebart et Salem 260.
23  Si l’hypothèse nulle d’équi-répartition des mots dans l’ensemble était vérifiée, on s’attendrait à trouver un tiers des occurrences de chaque terme dans le sermon et un tiers dans la partie du chapitre qui ne reprend pas le texte homilétique.
24  La première personne présente un léger déficit dans le chapitre, qui « pèse » 17% des deux premiers tomes mais ne comporte que 14% des occurrences  de « I » et de « my ». Le second volume constitue 13% de l’ensemble de Tristram Shandy  et contient 12% des occurrences de ces termes ; il n’y a donc ni excédent ni déficit.
25  The Sermons of Laurence Sterne: The Text 263.
26  Dans l’ensemble des sermons de Sterne, la 2e personne « pèse » 0,35% de toutes les occurrences, un taux légèrement plus bas que pour Tristram Shandy, 0,51% (« you », « thou », « thee »). Ces termes forment 0,7% du sermon considéré ici, mais cet excédent n’est pas suffisant pour être significatif statistiquement. Le chapitre est en très léger déficit avec un taux de 0,4%. Swift utilise moins encore ces personnels et possessifs, avec 0,27% pour les sermons (comparable à ceux de Sterne pour cette mesure) et seulement 0,08% dans Gulliver’s Travels, ce qui confère à « you » un rôle très ciblé (Voir Anne Bandry, « Gulliver et la machine à compter » BSEAA XVII-XVIII 53 (Novembre 2001), 149-51.
27  Biber 135-6. Cf. Randolph Quirk, A Comprehensive Grammar of the English Language, London: Longman, 1986.
28  Biber 148.
29  Selon Descargues, Sterne « utilise la dimension modale » d’une manière plus diversifiée que Swift dans les sermons (81). La démarche quantitative permet seulement d’affirmer que Sterne a un peu moins recours aux modaux que son prédécesseur (75% des modaux pour 80% du corpus constitué par les sermons des deux auteurs).
30  Sermons de Swift (SWserm), sermons de Sterne (STserm), Gulliver’s Travels (GUL), les deux premiers tomes de Tristram Shandy (TS12), A Sentimental Journey (ASJ). Seuls les blocs dépassant les seuils de 5% sont statistiquement significatifs.  
31  Landa 199-209.
32  Numéro 5 dans l’édition de référence.
33  Ibidem, numéro 23.
34  La question est controversée : Malcolm Coulthard, « Author Identification, Idiolect, and Linguistic Uniqueness, » Applied Linguistics 25/4 (2004) 431-47 s’intéresse au caractère distinctif des hapax  tandis que pour Brunet  « les paramètres stylistiques s’attach[ent] plutôt aux mots de fréquence supérieure » <http://www.uottawa.ca/academic/arts/astrolabe/auteurs.htm> [26 août 2005].
35  Walter souhaite que son fils naisse par césarienne, ce qui terrifie sa femme (non sans raison au dix-huitième siècle) et justifie la présence de Slop à Shandy Hall.
36  Pascal Marchand L'Analyse du discours assistée par ordinateur (Paris : Colin, 1998) 55.
37  Sylvie Mellet, « Les tragédies de Sénèque vues à travers Hyperbase, » Mots chiffrés et déchiffrés : Mélanges offerts à Etienne Brunet, Sylvie Mellet et Marcel Vuillaume eds (Paris : Champion, 1998) 258.
38  Brunet,  Manuel de référence : Hyperbase 2.0 (1998) 63.
39  A l’exception de TS II.17, les chapitres ont dû être groupés par deux, pour ne pas dépasser le nombre de textes qu’autorise Hyperbase. Les abréviations utilisées pour les chapitres dans ce graphique sont dues aux  contraintes imposées par le logiciel. Le chiffre désigne le volume et la lettre la paire de chapitres (2I est TS II.17). Les sermons sont désignés par LS et leur numéro dans l’édition de référence.
40  Le second facteur ne contient que 14% de l’information, soit quatre fois moins que le premier.
41  The Sermons of Laurence Sterne: The Notes, ed. Melvyn New (U P of Florida, 1996) 336, 450.
42  Dans un ouvrage qui fit longtemps référence, Lansing V. d. H. Hammond insiste sur les plagiats de Sterne (Laurence Sterne’s Sermons of Mr. Yorick, New Haven : Yale U P, 1948). Il propose l’hypothèse que les quatre volumes publiés par Sterne contiennent les textes les plus tardifs, ce qui fut mis en cause par James Downey dans « The Sermons of Mr. Yorick : A Reassessment of Hammond » ESC 4 (1978) 208-9. Tenant compte des deux arguments, New décrit les sermons comme « incremental structures with interchangeable parts » The Sermons of Laurence Sterne: The Notes 11.
43  The Sermons of Mr. Yorick, Vols V, VI & VII (London: W. Strahan, T.Cadell, T. Becket and Co., 1769), 3 vols.
44  Les sermons de Swift sont désignés par trois lettres évoquant leur titre.
45  « The “mediating” and “moderating” position of the Church of England [was] a very popular pulpit subject » Ibid.  386-7.
46  « Swift and Sterne : Two Tales, Several Sermons, and a Relationship Revisited » Critical Essays on Jonathan Swift, Frank Palmeri ed. (New York: G.K. Hall & Co., 1993) 175.
47  Ibid. 166.
48  C’est le terme employé par Wordmapper pour désigner les mots clefs dont d’autres logiciels, tel Hyperbase, soulignent la « spécificité » positive.
49 Brunet, « Formalisation et quantification des textes. III. Les traitements statistiques » <http://www.uottawa.ca/academic/arts/astrolabe/auteurs.htm> [26 août 2005]
50  Un travail effectué avec un autre logiciel (SPAD-T) sur un corpus homilétique différent, constitué uniquement d’échantillons textuels, alors que nous travaillons maintenant sur des données en texte intégral, avait déjà obtenu un résultat semblable, soulignant la marginalité de textes wesleyens par rapport à la prédication anglicane et dissidente : voir Françoise Deconinck-Brossard, « Stylistic Marginality of Eighteenth-century Dissenting Preachers, » JADT 1995 : III Giornate internazionali di Analisi statistica dei dati testuali, eds. S. Bolasco, L. Lebart, & A. Salem, vol. II, 321-28. L’étude fut reprise dans ses grandes lignes dans « The Case for Computer-Aided Textual Analysis, » Erfurt Electronic Studies in English 4/1996 < http://webdoc.sub.gwdg.de/edoc/ia/eese/eese.html > [25 août 2005].
51  Louis Tonko Milic, A Quantitative Approach to the Style of Jonathan Swift (The Hague: Mouton, 1967).
52  Coulthard 432 cite ce concept pour le critiquer.
53  La plus récente à ce jour s’est malheureusement entourée d’un parfum de scandale : Dominique Labbé, Corneille dans l’ombre de Molière : Histoire d’une découverte (Paris : Les Impressions Nouvelles, 2003).
54  Malheureusement Milic ne traite pas de ce texte dans l’ouvrage cité ci-dessus, donc il nous est impossible de comparer nos résultats aux siens.
55  Milic 77.
56  Discours sur le style (1753) [Document électronique] Frantext, INaLF <http://gallica.bnf.fr> [26 août 2005]  p. 24.
57  Milic 78.
58  Vina Tirvengadum, « Linguistic Fingerprints and Literary Fraud,” Computers in the Humanities Working Papers A.9 (avril 1998) <http://www.chass.utoronto.ca/epc/chwp/tirven/index.html> [25 août 2005]. L’étude, menée sous Wordcruncher, ne s’appuie pas sur l’ensemble de l’œuvre de Gary/Ajar, mais compare seulement deux romans « Ajar » avec deux romans Gary.
59  Calcul effectué à l’aide d’un repérage par le logiciel d’analyse textuelle non lexicométrique Prospéro, grâce à la généreuse hospitalité scientifique de Patrick Trabal, professeur de sociologie à l’université de Paris X, dans le séminaire qu’il animait en 2004-5 à l’Ecole des Hautes Etudes en Sciences Sociales, ainsi qu’au laboratoire libre-service de l’U.F.R. S.T.A.P.S. de l’université Paris X.
60  Ce qui confirme l’hypothèse de Brunet : « De toutes les forces qui s’exercent sur un texte, le genre semble la plus pesante et la plus pressante »   <http://www.outtawa.ca/academic/arts/astrolabe/articles/art0016.htm/Quantification3.htm> [4 février 2003] p. 9.
61  Gulliver’s Travels III, 5 (Oxford: Oxford World Classics, 1998) 176-177.

Notes de bas de page astérisques:

*  Communication faite au Congrès de la S.A.E.S. de Toulouse en mai 2005.


Pour citer cet article :

Anne Bandry-Scubbi et Françoise Deconinck-Brossard. «De la lexicométrie à la stylostatistique ? Sterne et Swift :  textes croisés*». Bulletin de la Société de Stylistique Anglaise , 26 (2005), p. 67-85.

URL: http://stylistique-anglaise.org/document.php?id=630
(Consulté le 21 mai 2013)

© Anne Bandry-Scubbi et Françoise Deconinck-Brossard. Propriété intellectuelle de l'auteur. Tous droits réservés.

Quelques mots à propos de :  Anne  Bandry-Scubbi

CREL – Université de Haute-Alsace, anne.bandry@uha.fr

Quelques mots à propos de :  Françoise  Deconinck-Brossard

RAO – Paris X Nanterre, fadeco@u-paris10.fr

>> Voir l'article recensé :



Index
RSSRSS Lodel (accès réservé)