Les embrouillaminis

J’aime beaucoup les Embrouillaminis. C’est un sujet qui me taraude depuis des années : que deviennent toutes les histoires, ces variantes avortées qui ne terminent pas dans un roman ? C’est injuste car certaines sont méritoires. Pourquoi n’ont-elles pas la chance d’être lues ? Pourquoi le lecteur doit se limiter à la lecture de la seule histoire survivante ? Qui nous dit que l’auteur a fait le bon choix ? Et si une lectrice avait préféré une autre fin ?
José-Luis Borges parlait d’une bibliothèque infinie dans laquelle se trouveraient toutes les histoires du monde. Ici, je vous propose un roman labyrinthique où Lorenzo quitte sa chère vallée de Chantebrie pour découvrir le vaste monde. Ou pas.
Sortie Aux Forges de Vulcain le 21 mai 2021.

David Meulemans, Maître Forgeron, à côté de votre serviteur, devant l’entrée de l’ancien château du Bien-Assis, demeure de Florin Perrier, beau-frère de Blaise Pascal. (Tiens, encore un Florin ;-)). À Clermont-Ferrand, donc.
Splendide couverture d’Elena Vieillard, graphiste talentueuse aux Forges.

Atelier d’écriture en lycée pro

J’ai fait deux ateliers d’écriture sur deux vendredis, au lycée professionnel Tony Garnier de Bron (69). Ce que j’aime dans cet exercice, c’est de montrer que tout le monde est capable d’écrire une histoire, car cela fait appel à notre imaginaire, outil universel. Les élèves de ces classes ne sont en général pas de gros lecteurs et ils arrivent avec méfiance. A partir d’une image, ils ont la journée pour imaginer et écrire une histoire, suivant un canevas en six étapes. Au début, ils tâtonnent, posent des questions scolaires : « ai-je le droit d’écrire ci ? d’inventer le nom d’une ville ? » et quand ils comprennent qu’il n’y a pas vraiment de règle, qu’ils n’ont qu’à laisser parler leur imagination, ils sont à fond…

Certains ont du mal à démarrer. Je leur dis « Regarde cette photo, ça te fait penser à quoi ? » Ils ont plein d’idées. OK. « Alors, comment raconterais-tu cette histoire à ton petit frère, ou ta petite soeur ?, là, comme ça, en parlant ? » Ils racontent, très à l’aise, leur histoire. « Et bien tu vois, tu n’as qu’à écrire ce que tu viens de dire, pour le style, on verra après ». Car ce qui compte, c’est l’histoire, leur projection, leur travail unique, leur création. Les textes sont forcément bons, originaux, amusants, parfois tristes ; on leur dit, et ces élèves, qui n’ont malheureusement pas toujours été encensés dans leurs études apprécient ces compliments mérités. Ils prennent confiance en eux, certains rédigent six, sept pages. D’autres ne prennent pas leur récré, une souhaite lire son texte à toute la classe. Un autre, très fier, demande que son prof relise chaque nouveau paragraphe.

À un moment, c’est le calme absolu. Une douzaine de gamins écrivent en silence au CDI. Je n’entends que le cliquetis des claviers. Nous nous regardons avec Gaëlle, la prof de Français et Laurence, la documentaliste. Je lance à la cantonade « vous êtes toujours aussi sage ? Mais de quoi se plaignent vos professeurs ? » Aussitôt, c’est un déclenchement de rires. « Ouais, M’sieur, on est toujours aussi tranquilles ! », « Non, M’sieur, mais là on kiffe notre texte… ».

Merci à Laurence L. et à Gaelle C. pour avoir pensé à ce projet et pour l’avoir mené jusqu’au bout, malgré les difficultés actuelles. Le genre de journée qui fait grandir tout le monde.

Le cas Musso

La signature d’un auteur ?

La version 6 de mon logiciel analyse désormais 21 critères différents. Dans les articles précédents, je pensais pouvoir trouver la signature d’un auteur grâce à une combinaison linéaire de ces critères (une sorte de « hash » ou clé unique identifiant l’auteur d’un texte – à l’image d’une reconnaissance faciale qui, à partir de certains points, en déduit l’identité d’une personne). Malheureusement, cela est plus complexe que prévu.

Pour m’aider, je me suis servi d’un logiciel d’analyse statistique : Orange Data Mining (Université de Ljubljana). Il me calcule, pour l’oeuvre d’un auteur (= plusieurs romans), les critères qui ont le plus fort taux de corrélation entre eux (avec leur R respectifs : plus R est proche de 1 (ou -1) et plus les critères sont corrélés).
Rappel : en probabilités et en statistique, la corrélation entre plusieurs variables aléatoires ou statistiques est une notion de liaison qui contredit leur indépendance. Par exemple, le poids d’un livre est corrélé au nombre de pages (R>0.9). Par contre, le nombre de pages d’un livre est très faiblement corrélé au nombre de lettres du titre (R<0.01)

Initialement, je m’attendais à trouver les mêmes corrélations évidentes entre auteurs, par exemple le taux de virgules d’un texte devrait être fortement corrélé à la longueur des phrases. Mais non. Pour chaque auteur, les plus fortes corrélations sont différentes.
Pour mes romans, le plus fort coefficient de corrélation est entre le taux de mots communs et le taux de verbe au passé simple (R=-0.94).

Pour Amélie Nothomb, c’est le taux de point-virgule qui est inversement proportionnel au taux d’expressions communes (R=0.88)

Enfin, pour San Antonio, c’est le taux de parenthèses (pour 10 000 signes) qui est corrélé (R=-0.94) au taux de mots communs.

Pourquoi les auteurs ne partagent-ils pas ces duos de critères fortement corrélés ? (R>0.9). Représentent-ils la signature d’une œuvre ?

Creusons du côté des clusters

Le logiciel Orange Data Mining permet de classifier les romans dans des clusters (k-means clustering algorithm). Il propose un nombre de clusters optimal et regroupe les textes similaires dans ces « clusters ».

Par exemple, le logiciel différencie mes romans publiés chez Alma, celui publié chez Stock et mes 2 romans de genre (érotique et polar, non publiés) : soit 4 clusters qui correspondent effectivement à des styles bien différents (et je suis tout à fait à l’aise avec cette classification). Le diagramme précédent avec les clusters colorés devient :

 

Le cas Musso

Prenons les 13 romans de Guillaume Musso publiés entre 2001 et 2019. Sa «signature» est la corrélation négative (R=-0,91) entre le taux de points d’exclamation et le taux de pronoms relatifs et interrogatifs. Cela est assez logique : les points d’exclamation sont utilisés lorsque l’auteur a recours au dialogue, notamment pour montrer une émotion. Plus la phrase sera concise, plus l’émotion à faire passer sera ressentie par le lecteur. (« Tu ne me l’as jamais dit ! » vs « Tu ne me l’as jamais dit » cria la jeune femme qui tremblait sous l’effet de cette subite annonce ».
A l’opposé, les pronoms relatifs introduisent ce qu’on appelle « des phrases complexes », donc par essence plus longues.
Les 5 clusters trouvés par le logiciel correspondent à des regroupements d’années consécutives :
C1: 2001,
C2: 2004, 2005, 2006,
C3: 2008,
C4: 2011,2012,2013,2014,
C5: 2015,2016,2018,2019

Comme si l’auteur, changeait périodiquement quelque chose de suffisamment conséquent dans sa façon d’écrire pour que le logiciel s’en aperçoive.

Il n’est pas étonnant d’avoir plusieurs clusters pour un auteur (comme dans mon cas pour les maisons d’éditions ou les genres) mais ce qui est remarquable ici est la parfaite cohérence chronologique (alors que l’auteur revendique un même style/genre et la même maison d’édition depuis son deuxième roman).

Son premier roman « Skidamarink » a un style différent, comme le montre le cluster dédié. Par contre, il est positionné tout près des œuvres 2018 et 2019. (L’auteur semble avoir progressivement « descendu » cette droite de régression dès 2001 pour la remonter à partir de 2013).

Coïncidence à cette proximité, en octobre 2020, sa maison d’édition décide de republier ce premier roman. Et si cette courbe montrait que c’était finalement l’année où il fallait le faire, dans la « parfaite continuité statistique » des 2 précédents ?

 

 

Si vous avez aimé cet article:
Analyse de romans
Les liaisons dangereuses aux rayons X
Le cas San-Antonio

 

Le cas San-Antonio

Étiquettes

À l’occasion du centenaire de la naissance de Frédéric Dard, Fleuves Editions a décidé de créer un concours, récompensé par le Prix San-Antonio : https://www.prixsanantonio.universpoche.fr/concours/prix-san-antonio
L’occasion de se pencher sur cette série phénomène de la littérature policière :175 ouvrages publiés entre 1949 et 2001 (soit plus de 3 par an !) dont les couverture mythiques ont suivi l’air du temps.

Particularité des San-Antonio

Frédéric Dard s’est illustré par l’emploi d’un vocabulaire fleuri de son cru. Il a créé une véritable signature en inventant des milliers de mots (le dictionnaire San-Antonio existe et je vous le conseille). En conséquent, il passe sous le radar de mon analyse sur le critère « mots grossiers ». Ma liste de 130 mots grossiers ne vaut pas tripette face à ses expressions faites maison : beurrer la coquelle, brandonner du calbar, éjaculance et autres figouses. Ce biais baisse la note d’oralité, mais c’est le jeu ! Dans le texte, il y a effectivement peu de mots grossiers, même si la thématique globale reste pas mal en dessous de la ceinture (le célèbre humour grivois).

Évolution du style

Passons quatre romans écrits à différents époques sous notre analyse aux rayons X.

Il est intéressant de constater que le style évolue avec le temps. L’écriture est moins « facile » (suivant les critères de mon algorithme, c’est à dire moins de mots banals, d’expressions toutes faites, d’adverbes). Les autres critères restent étonnamment  stables, même si l’oralité a varié sur quelques romans.

Signalons toutefois deux baisses notables au fil du temps : le taux d’expressions communes (« blanc comme neige ») et l’usage des points-virgules (le sacrifié de la littérature contemporaine).

Comparaison avec des « classiques » du policier


Comparons San-Antonio de 1953 avec deux classiques : Georges Simenon (et son célèbre inspecteur Maigret) et Maurice Leblanc (et son tout aussi fameux Arsène Lupin). Il est amusant de constater 3 styles radicalement différents.
Maurice Leblanc a le style le plus « littéraire » des trois. Simenon, un texte plus travaillé mais davantage porté sur les dialogues. San-Antonio, un style plus grand public. Encore une fois, la comparaison est purement analytique et ne compare pas la richesse du vocabulaire, l’inventivité du style ou le suspens de l’intrigue.

Comparaison avec des auteurs contemporains

Intéressant de comparer que le rythme d’un policier est visiblement une constante (avec une moyenne de mots par phrase autour de 10, ce qui est un rythme rapide, là où Proust est à 33 et Helen Fielding à 7).
Ensuite, les deux critères facilité et oralité (nombre de dialogues, taux de !, ?, … et mots vulgaires) sont vraiment différents d’un auteur à l’autre. Autant de styles que d’auteurs, c’est une bonne nouvelle pour la littérature policière qui n’est pas cantonnée dans un style imposé.

Conclusion

Il n’y en a pas 🙂 Cette analyse aux rayons X de San-Antonio montre seulement que l’on peut écrire des romans policiers avec des styles vraiment différents. Sans doute parce que le suspens, l’ambiance et l’intrigue ne se résume pas à une histoire de style. Mais ça, on le savait déjà pour notre plus grand plaisir !
Je suis par contre curieux de voir le lauréat de ce prix : est-ce que le texte sélectionné aura le même « profil » qu’un San-Antonio ? Est-ce que le jury va être influencé (inconsciemment ou consciemment) par la similitude du style ? Ou alors ne vont-ils que s’intéresser au fond ? à l’inventivité du vocabulaire ? Réponse à l’automne.

A lire aussi

L’article qui explique le fonctionnement de ce logiciel.
L’analyse des Liaisons dangereuses avec ce logiciel.
Le cas Musso

Les liaisons dangereuses aux rayons X

Le roman

Les liaisons dangereuses est un roman épistolaire écrit par Pierre Choderlos de Laclos en 1782. Selon wikipedia, « il porte à un degré de perfection la forme épistolaire : aucun élément n’est gratuit, chaque épistolier a son style et la polyphonie des correspondances croisées construit un drame en quatre étapes au dénouement moralement ambigu ».

Le pari d’un roman polyphonique est de réussir la différenciation des voix narratives. Le style, comme un support à la signature des personnages. Laclos a-t-il réussi son pari ? (spoiler : oui ! 🙂 ) Voici une bonne occasion de passer ce roman aux rayons X grâce à l’outil présenté dans un précédent article afin de vérifier tout cela.

L’analyse

Un petit programme en python a regroupé toutes les lettres par émetteur. Puis, le programme d’analyse a donné la matrice de similitudes suivante.

Valmont

Valmont et la marquise de Merteuil sont les deux grands complices de l’histoire et l’auteur les a voulus proches dans le style (3,6) : de longues phrases, beaucoup de mots de liaison, un style pour convaincre, manipuler ?
Le deuxième style le plus proche de Valmont est celui de la présidente de Tourvel, la jeune femme qu’il séduira d’abord par jeu, puis dont il deviendra amoureux. Coïncidence ? 😉

Cécile de Volanges et Le chevalier de Danceny

Cécile de Volanges est la jeunette de l’intrigue. Naïve, elle se fait abuser par Valmont, le séducteur. Son style enfantin est très différent des autres protagonistes. Très différent de sa mère comme pour mieux marquer leur opposition. Plus proche de la marquise de Merteuil, sa confidente et de Valmont, son séducteur.
Cécile abuse des points de suspension (3 fois plus que Valmont) comme si sa pensée était submergée par les émotions. Elle utilise deux fois plus de mots communs que les autres, les phrases sont courtes.

Son prétendant, tout aussi jeune, partage sa fougue : C’est lui qui a le plus grand nombre de points d’exclamation et le rythme le plus élevé. Il est pourtant très éloigné du style de Cécile et de sa mère (16,8 et 16,9). Une indication de l’auteur pour nous montrer qu’il n’arrivera pas à ses fins ?

Madame de Volanges

Dans la hiérarchie sociale, c’est la plus âgée, la plus « sage ». Cela se traduit par la plus faible note d’oralité, les plus longues phrases, le plus faible taux de mots communs (qu’elle partage avec la présidente de Tourvel, autre personnage à la réputation irréprochable et au style à l’avenant).
Madame de Volanges voit d’un très mauvais oeil que le chevalier Danceny tourne autour de sa fille Cécile. Elle s’agace du comportement de celle-ci envers ce prédendant. Coïncidence ? C’est avec ces deux personnages que son style est le plus éloigné (19,1 et 16,9 le double des autres).
En revanche, le style le plus proche est celui de la marquise de Merteuil, sa confidente (8,8).

Encore plus fort…

Allons un cran plus loin et amusons-nous maintenant à regarder la différence de style en fonction du destinataire des lettres. Cécile de Volanges écrit-elle de la même façon à sa confidente Sophie, qu’au vicomte de Valmont ? Voici deux exemples amusants.

Cécile de Volanges
Ses lettres pour ses deux confidentes (Sophie et Merteuil) sont proches (9,7).
Par contre, en prenant pour référence ses lettres à la Merteuil, ses courriers pour Danceny et Valmont sont plus éloignés (resp. 14,4 et 18,4), reflétant ainsi l’éloignement nécessaire à la bienséance.
L’axe Oralité semble bien traduire chez elle cette distanciation. (Sur ce graphe, on pourrait même deviner que Danceny est, à son grand dam, dans la « friend zone » avec Sophie ! 😀 )

Le chevalier Danceny
En prenant pour références ses lettres à sa dulcinée Cécile, les lettres pour la Merteuil sont à 14 et celles pour Valmont à 24, marquant ainsi clairement son changement de style en fonction de ses interlocuteurs.
Chez Danceny, c’est plutôt la Facilité du style qui marque sa distance avec l’interlocuteur. Plus la personne est aimée, et moins il succombe à la facilité du style. Mais nous sommes au XVIIIe, et l’amour précieux se déclamait alors avec style ! 😉

Au fil du temps ?
On pourrait même imaginer une analyse des lettres au fil de l’intrigue. Cécile écrit-elle de la même façon à Valmont avant et après la fameuse nuit ? Même question pour la Présidente de Tourvel.

Conclusions

J’aime cet outil. Il ressemble vraiment à une machine à rayons X car il nous révèle l’ossature stylistique d’une oeuvre au service de la narration. On voit ici que Choderlos de Laclos a parfaitement réussi son pari : avoir une voix différente et une proximité des styles qui sert la proximité des personnages et des interactions. Chapeau.
Je me suis amusé à faire un tel traitement dans d’autres romans plus contemporains. Disons que je comprends pourquoi Les liaisons dangereuses est un classique, enseigné encore au bout de presque 250 ans 😉

Si vous avez aimé cet article, autre article d’analyse:
Analyse de romans
Le cas San-Antonio
Le cas Musso

 

 

Analyse de romans

L’objectif

Imaginez un logiciel qui analyse un roman, non pas sur le fond, mais exclusivement sur la forme. Avec un tel outil:

  • Verrait-on une différence entre la littérature de « genre » et la « blanche » ?
  • Le jury Goncourt aurait-il pu déceler Romain Gary derrière Emile Ajar ?
  • Il y a-t-il un « pattern » du succès commercial ? Lequel ?
  • Les oeuvres d’un auteur sont-elles homogènes tout au long de sa carrière ?
  • Il y a-t-il des ovnis littéraires, dont le style est éloigné de tous leurs confrères ?

La réponse est oui. Voyons comment.

L’algorithme

Points de mesure et distance

J’ai développé un logiciel : certains parleront d’IA (Intelligence Artificielle), mais nous n’en sommes pas encore là. Je préfère parler d’analyses statistiques. L’algorithme mesure 14 critères sur 380 ebooks. Je vous en donne 7 : le taux de virgules, de dialogues, de points d’exclamation, d’adverbes, de mots longs, de mots grossiers, le nombre de mots par phrase.
Une fois ces critères normalisés, on peut calculer une « distance » entre chaque auteur. Cela traduit une forme de proximité dans le style. Par exemple, Balzac est proche de Stendhal (8,7), mais éloigné de Bukowski (48). L’échelle est la suivante.

Regroupement en 4 axes

Ces 14 critères sont regroupés en 4 thématiques

  • Le rythme du texte (longueur des phrases)
  • L’oralité (la présence de dialogue, de mots grossiers, de !, …, ?)
  • La facilité (présence de verbes simples conjugués au présent, nombreux adverbes, des expressions « clichés », par exemple « blanc comme neige », …)
  • La complexité (mots longs ou phrase longue articulée par des conjonctions de coordination)

On obtient des diagrammes radar de ce style, bien pratiques pour comparer 2 auteurs.

Exemple évident : nous savons tous que San Antonio n’a pas du tout le même style que Marcel Proust. Une plus grande oralité, un rythme plus rapide, une grande facilité. Mais cet exemple outrancier est important pour introduire une notion importante : cette méthode n’est pas destinée à juger de la qualité d’une oeuvre. L’analyse du style ne préjuge pas de la qualité littéraire d’un roman ou de sa puissance narrative. Avec cette méthode, Marcel Pagnol a un score important en oralité et Albert Cohen, en facilité. A titre d’illustration, voici la comparaison entre Jean Giono et Fred Vargas : deux genres différents, deux regards différents sur le monde, et pourtant, des styles très comparables selon ce logiciel.

Que peut-on faire de cet outil ?

1. Littérature de genre

Commençons par enfoncer des portes ouvertes. Qu’est-ce-qui fait la différence entre la littérature de genre (ici le polar) et la littérature « blanche » contemporaine ? Sans surprise, l’oralité et le rythme sont deux critères permettant de ségréguer très nettement nos deux échantillons représentatifs.

Notons au passage que les critères Oralité et Rythme sont bien corrélés.

2. Évolution tout au long d’une Oeuvre

Amusons-nous à étudier la proximité des romans d’un même auteur tout au long de sa carrière.

Victor Hugo : Ses oeuvres sont très proches ; même les jaunes sont proches de la limite du vert.

Bernard Werber, l’analyse chronologique montre une belle homogénéité, sauf pour son miroir de Cassandre, qui se distingue légèrement de ses premiers livres.

Contrairement à l’idée reçue que « tous les Amélie Nothomb se ressemblent », la matrice ci-dessous montre une certaine diversité dans le style que cette romancière emploie. C’est une des rares à franchir la barre du orange – sans emprunter un pseudonyme.

Une analyse plus exhaustive de la proximité des 88 romans de Balzac, montre aussi une prédominance de verts (81%) et environ 19% de jaunes. Un seul orange, Petites misères de la vie conjugale : texte écrit entre 1830 et 1846 et publié par chapitre dans plusieurs revues, ce qui peut justifier un style disparate.

Une analyse de 15 textes de Patrick Modiano montre que ses deux premiers romans (La place de l’étoile et La ronde de nuit) se démarquent du reste de sa production.
Pour illustrer, voici l’empreinte radar de ses deux premiers romans et de Rue des boutiques obscures qui lui valut le Goncourt dix ans plus tard en 1978.

Détection de pseudonymes ?

Mais alors, serait-il possible de détecter parmi les textes d’un auteur, lesquels il n’aurait pas rédigés (#JeSache), ou à l’inverse, un même romancier qui se cache derrière deux pseudonymes ?
On pense évidemment à Romain Gary qui a gagné deux fois le prix Goncourt. Une première fois en 1956 pour Les racines du ciel, une seconde fois en 1975 pour La vie devant soi signé Emile Ajar.

Rendons justice au jury : le logiciel confirme la distance importante entre ces deux textes et la difficulté de démasquer le farceur !

Moins réussie, la tentative de Boris Vian d’écrire sous la plume de Vernon Sullivan. Avec ce logiciel, la supercherie aurait été facilement dévoilée.

Une recette du succès ?

En analysant bien tous les romans et en corrélant avec leur succès commercial, pourrait-on, avec ce logiciel, trouver « la recette du succès commercial » ? Les auteurs qui vendent le plus ont-ils des points communs ?
A titre d’exemple, prenons Guillaume Musso : les 5 auteurs les plus proches de lui sont tous des poids lourds internationaux.

  • Dan Brown (6,5, ce qui est une très très courte distance !)
  • JK Rowling (8,3)
  • Collins Suzanne (9,3)
  • Tom Clancy (10,6)
  • Amélie Nothomb (10,8)

Et rien que pour vous, voici donc la recette d’un best-seller international :

Malheureusement, le recette d’un Goncourt semble plus ardue : aucune similitude des textes dans mon échantillon.

Le cas Mathias Enard

Suite à son Goncourt en 2015,  Le Nouvel Observateur a comparé Mathias Enard à Honoré de Balzac dans cet article. Comparaison soulignée par son physique, comme le montre cette étonnante illustration.

Avec ce logiciel, j’affirme haut et fort, que le style de Mathias Enard se rapproche davantage de celui de Stendhal (12,9, son plus proche score) que de celui de Balzac (16,6). Ahah ! Quel plaisir que de contredire Le Nouvel Obs (sans rancune, hein ? :-))

L’affaire HP. Lovecraft

En rajoutant HP Lovecraft dans mon analyse, je m’aperçois que Marcel Proust, qui jusque là, n’avait qu’une proximité (assez logique) avec Amin Maalouf (12,0), devient « ami » de Lovecraft avec une proximité de 11,2. Étonné, je me renseigne sur le lien potentiel entre ces deux auteurs et je découvre cette citation de Proust : « Lovecraft est passionnant quand il parle de réalisme (où il place Balzac et Tourguenev au plus haut, s’en sert d’alibi à son dédain de Dickens), et de real literature (…) Il lit les deux premiers tomes de la première traduction d’À la recherche du temps perdu (Un amour de Swann, Les jeunes filles en fleurs). Et puis il dit que « personne au XXe siècle n’est capable d’éclipser ce bonhomme-là ». Ce qui me fait plaisir à plus d’un titre. »
Lovecraft était fan de Proust, mais est-ce que cela suffit à expliquer leur proximité ?

Les deux profils se distinguent par un rythme très différent, genre oblige ! 🙂
Soulignons aussi la limite de l’exercice : comparer un texte en français avec une traduction introduit forcément un biais (il faudrait vérifier que la traduction de dénature pas le texte d’origine). Par contre, une analyse plus poussée de l’oeuvre de Lovecraft, montre une hétérogénéité non négligeable.

A noter, qu’il est aussi très proche de JL Borges (11,1) :cela semble cohérent, du point de vue du registre fantastique, mais cela ne devrait être visible sur ce genre d’analyse purement syntaxique. Intéressant. Le radar montre 2 triangles emboités, Borges est le maître de Lovecraft ! 😉

Et le Cerbère blanc dans tout ça ?

En temps qu’auteur, il est très intéressant d’analyser l’évolution d’un manuscrit au fil des versions (je suis un adepte de l’écriture itérative). Voici quelques statistiques intéressantes sur mon dernier roman Le cerbère blanc.

Quelques points de mesure évoluent nettement entre la première version (2016) et le manuscrit définitif (2020). Tandis que le rythme du récit reste constant, l’oralité diminue, signe d’un travail sur l’écriture, confirmé par la chasse aux adverbes et l’ajout de points-virgules (symptomatiques de phrases plus structurées).

Sur ce tableau, nous voyons nettement la distance du premier jet avec les versions successives. Même si on reconnait l’oeuvre écrite par un même auteur, la distance double pratiquement dans le laps de temps du projet.
Bien entendu, ce logiciel m’a permis de comparer mon style aux autres auteurs contemporains ou classiques… mais là, je garde le résultat pour moi ! 😉

Quelques distances entre auteurs

Justement, un classement intéressant : voici la proximité d’auteurs entre eux (critère : une proximité < 13).

Le cas Asimov m’amuse beaucoup. Bien que ce logiciel n’analyse ni la thématique ni le fond, on retrouve Bradbury (SF), Tom Clancy et Dan Brown (Fantastique) dans son top-3.

Certains auteurs n’ont aucun collègue proche. Ce sont des OVNI. Cela se traduit par un style bien à part. C’est le cas notamment de Bukoswki, Zweig ou Houellebecq (du moins avec mon échantillon de 85 auteurs).

Autres exemples

Dans un autre article, j’analyse le roman épistolier « les liaisons dangereuses » en utilisant cet outil sur les personnages. Ont-ils tous la même voix ? le même style ?

Conclusion

Ce logiciel a été développé pendant le confinement : j’ai pris beaucoup de plaisir à l’écrire et à observer les différents résultats. Moi qui m’intéressais, en tant qu’auteur, aux structures narratives, me voici plongé dans une autre dimension toute aussi passionnante.
Je n’ai pas encore la matière, mais il serait aussi intéressant de mesurer l’influence d’un traducteur sur l’oeuvre traduite. Le Moby Dick de Giono ressemble-t-il à un autre roman de Giono ? Quelle proximité avec les autres traductions ?
Vos commentaires sont les bienvenus.
Portez-vous bien, lisez beaucoup.

Si vous avez aimé cet article
Le cas Musso
Le cas San-Antonio
Les liaisons dangereuses aux rayons X