Analyse de romans

L’objectif

Imaginez un logiciel qui analyse un roman, non pas sur le fond, mais exclusivement sur la forme. Avec un tel outil:

  • Verrait-on une différence entre la littérature de « genre » et la « blanche » ?
  • Le jury Goncourt aurait-il pu déceler Romain Gary derrière Emile Ajar ?
  • Il y a-t-il un « pattern » du succès commercial ? Lequel ?
  • Les oeuvres d’un auteur sont-elles homogènes tout au long de sa carrière ?
  • Il y a-t-il des ovnis littéraires, dont le style est éloigné de tous leurs confrères ?

La réponse est oui. Voyons comment.

L’algorithme

Points de mesure et distance

J’ai développé un logiciel : certains parleront d’IA (Intelligence Artificielle), mais nous n’en sommes pas encore là. Je préfère parler d’analyses statistiques. L’algorithme mesure 14 critères sur 380 ebooks. Je vous en donne 7 : le taux de virgules, de dialogues, de points d’exclamation, d’adverbes, de mots longs, de mots grossiers, le nombre de mots par phrase.
Une fois ces critères normalisés, on peut calculer une « distance » entre chaque auteur. Cela traduit une forme de proximité dans le style. Par exemple, Balzac est proche de Stendhal (8,7), mais éloigné de Bukowski (48). L’échelle est la suivante.

Regroupement en 4 axes

Ces 14 critères sont regroupés en 4 thématiques

  • Le rythme du texte (longueur des phrases)
  • L’oralité (la présence de dialogue, de mots grossiers, de !, …, ?)
  • La facilité (présence de verbes simples conjugués au présent, nombreux adverbes, des expressions « clichés », par exemple « blanc comme neige », …)
  • La complexité (mots longs ou phrase longue articulée par des conjonctions de coordination)

On obtient des diagrammes radar de ce style, bien pratiques pour comparer 2 auteurs.

Exemple évident : nous savons tous que San Antonio n’a pas du tout le même style que Marcel Proust. Une plus grande oralité, un rythme plus rapide, une grande facilité. Mais cet exemple outrancier est important pour introduire une notion importante : cette méthode n’est pas destinée à juger de la qualité d’une oeuvre. L’analyse du style ne préjuge pas de la qualité littéraire d’un roman ou de sa puissance narrative. Avec cette méthode, Marcel Pagnol a un score important en oralité et Albert Cohen, en facilité. A titre d’illustration, voici la comparaison entre Jean Giono et Fred Vargas : deux genres différents, deux regards différents sur le monde, et pourtant, des styles très comparables selon ce logiciel.

Que peut-on faire de cet outil ?

1. Littérature de genre

Commençons par enfoncer des portes ouvertes. Qu’est-ce-qui fait la différence entre la littérature de genre (ici le polar) et la littérature « blanche » contemporaine ? Sans surprise, l’oralité et le rythme sont deux critères permettant de ségréguer très nettement nos deux échantillons représentatifs.

Notons au passage que les critères Oralité et Rythme sont bien corrélés.

2. Évolution tout au long d’une Oeuvre

Amusons-nous à étudier la proximité des romans d’un même auteur tout au long de sa carrière.

Victor Hugo : Ses oeuvres sont très proches ; même les jaunes sont proches de la limite du vert.

Bernard Werber, l’analyse chronologique montre une belle homogénéité, sauf pour son miroir de Cassandre, qui se distingue légèrement de ses premiers livres.

Contrairement à l’idée reçue que « tous les Amélie Nothomb se ressemblent », la matrice ci-dessous montre une certaine diversité dans le style que cette romancière emploie. C’est une des rares à franchir la barre du orange – sans emprunter un pseudonyme.

Une analyse plus exhaustive de la proximité des 88 romans de Balzac, montre aussi une prédominance de verts (81%) et environ 19% de jaunes. Un seul orange, Petites misères de la vie conjugale : texte écrit entre 1830 et 1846 et publié par chapitre dans plusieurs revues, ce qui peut justifier un style disparate.

Une analyse de 15 textes de Patrick Modiano montre que ses deux premiers romans (La place de l’étoile et La ronde de nuit) se démarquent du reste de sa production.
Pour illustrer, voici l’empreinte radar de ses deux premiers romans et de Rue des boutiques obscures qui lui valut le Goncourt dix ans plus tard en 1978.

Détection de pseudonymes ?

Mais alors, serait-il possible de détecter parmi les textes d’un auteur, lesquels il n’aurait pas rédigés (#JeSache), ou à l’inverse, un même romancier qui se cache derrière deux pseudonymes ?
On pense évidemment à Romain Gary qui a gagné deux fois le prix Goncourt. Une première fois en 1956 pour Les racines du ciel, une seconde fois en 1975 pour La vie devant soi signé Emile Ajar.

Rendons justice au jury : le logiciel confirme la distance importante entre ces deux textes et la difficulté de démasquer le farceur !

Moins réussie, la tentative de Boris Vian d’écrire sous la plume de Vernon Sullivan. Avec ce logiciel, la supercherie aurait été facilement dévoilée.

Une recette du succès ?

En analysant bien tous les romans et en corrélant avec leur succès commercial, pourrait-on, avec ce logiciel, trouver « la recette du succès commercial » ? Les auteurs qui vendent le plus ont-ils des points communs ?
A titre d’exemple, prenons Guillaume Musso : les 5 auteurs les plus proches de lui sont tous des poids lourds internationaux.

  • Dan Brown (6,5, ce qui est une très très courte distance !)
  • JK Rowling (8,3)
  • Collins Suzanne (9,3)
  • Tom Clancy (10,6)
  • Amélie Nothomb (10,8)

Et rien que pour vous, voici donc la recette d’un best-seller international :

Malheureusement, le recette d’un Goncourt semble plus ardue : aucune similitude des textes dans mon échantillon.

Le cas Mathias Enard

Suite à son Goncourt en 2015,  Le Nouvel Observateur a comparé Mathias Enard à Honoré de Balzac dans cet article. Comparaison soulignée par son physique, comme le montre cette étonnante illustration.

Avec ce logiciel, j’affirme haut et fort, que le style de Mathias Enard se rapproche davantage de celui de Stendhal (12,9, son plus proche score) que de celui de Balzac (16,6). Ahah ! Quel plaisir que de contredire Le Nouvel Obs (sans rancune, hein ? :-))

L’affaire HP. Lovecraft

En rajoutant HP Lovecraft dans mon analyse, je m’aperçois que Marcel Proust, qui jusque là, n’avait qu’une proximité (assez logique) avec Amin Maalouf (12,0), devient « ami » de Lovecraft avec une proximité de 11,2. Étonné, je me renseigne sur le lien potentiel entre ces deux auteurs et je découvre cette citation de Proust : « Lovecraft est passionnant quand il parle de réalisme (où il place Balzac et Tourguenev au plus haut, s’en sert d’alibi à son dédain de Dickens), et de real literature (…) Il lit les deux premiers tomes de la première traduction d’À la recherche du temps perdu (Un amour de Swann, Les jeunes filles en fleurs). Et puis il dit que « personne au XXe siècle n’est capable d’éclipser ce bonhomme-là ». Ce qui me fait plaisir à plus d’un titre. »
Lovecraft était fan de Proust, mais est-ce que cela suffit à expliquer leur proximité ?

Les deux profils se distinguent par un rythme très différent, genre oblige ! 🙂
Soulignons aussi la limite de l’exercice : comparer un texte en français avec une traduction introduit forcément un biais (il faudrait vérifier que la traduction de dénature pas le texte d’origine). Par contre, une analyse plus poussée de l’oeuvre de Lovecraft, montre une hétérogénéité non négligeable.

A noter, qu’il est aussi très proche de JL Borges (11,1) :cela semble cohérent, du point de vue du registre fantastique, mais cela ne devrait être visible sur ce genre d’analyse purement syntaxique. Intéressant. Le radar montre 2 triangles emboités, Borges est le maître de Lovecraft ! 😉

Et le Cerbère blanc dans tout ça ?

En temps qu’auteur, il est très intéressant d’analyser l’évolution d’un manuscrit au fil des versions (je suis un adepte de l’écriture itérative). Voici quelques statistiques intéressantes sur mon dernier roman Le cerbère blanc.

Quelques points de mesure évoluent nettement entre la première version (2016) et le manuscrit définitif (2020). Tandis que le rythme du récit reste constant, l’oralité diminue, signe d’un travail sur l’écriture, confirmé par la chasse aux adverbes et l’ajout de points-virgules (symptomatiques de phrases plus structurées).

Sur ce tableau, nous voyons nettement la distance du premier jet avec les versions successives. Même si on reconnait l’oeuvre écrite par un même auteur, la distance double pratiquement dans le laps de temps du projet.
Bien entendu, ce logiciel m’a permis de comparer mon style aux autres auteurs contemporains ou classiques… mais là, je garde le résultat pour moi ! 😉

Quelques distances entre auteurs

Justement, un classement intéressant : voici la proximité d’auteurs entre eux (critère : une proximité < 13).

Le cas Asimov m’amuse beaucoup. Bien que ce logiciel n’analyse ni la thématique ni le fond, on retrouve Bradbury (SF), Tom Clancy et Dan Brown (Fantastique) dans son top-3.

Certains auteurs n’ont aucun collègue proche. Ce sont des OVNI. Cela se traduit par un style bien à part. C’est le cas notamment de Bukoswki, Zweig ou Houellebecq (du moins avec mon échantillon de 85 auteurs).

Autres exemples

Dans un autre article, j’analyse le roman épistolier « les liaisons dangereuses » en utilisant cet outil sur les personnages. Ont-ils tous la même voix ? le même style ?

Conclusion

Ce logiciel a été développé pendant le confinement : j’ai pris beaucoup de plaisir à l’écrire et à observer les différents résultats. Moi qui m’intéressais, en tant qu’auteur, aux structures narratives, me voici plongé dans une autre dimension toute aussi passionnante.
Je n’ai pas encore la matière, mais il serait aussi intéressant de mesurer l’influence d’un traducteur sur l’oeuvre traduite. Le Moby Dick de Giono ressemble-t-il à un autre roman de Giono ? Quelle proximité avec les autres traductions ?
Vos commentaires sont les bienvenus.
Portez-vous bien, lisez beaucoup.

Si vous avez aimé cet article
Le cas Musso
Le cas San-Antonio
Les liaisons dangereuses aux rayons X

Habemus Piratam : ce qui est devenu vrai…

Habemus Piratam est un ouvrage de (presque) fiction. Ecrit en 2015-2016, il a été publié en octobre 2018. Pourtant, depuis son écriture, des histoires imaginées se sont réellement produites… Quand la réalité rejoint la fiction, cela donne ce TOP5 très étonnant :

Top 5. Les cabinets dentaires américains ciblés par des hackers (voir chapitre 9 : la dent)

TOP 4. Les hackers tentent de pirater le prochain manuscrit de Margaret Atwood, auteure à succès de La servante écarlate. (voir chapitre 6 : les portes du monastère).

TOP 3. Des hackers coupent l’électricité de Kiev, mais certainement pas pour mieux observer les étoiles ! 🙂 (voir chapitre 4 : le pic du Midi).

Top 2: des hackers russes inculpés pour avoir influé sur l’élection américaine (voir chapitre 12 : le botnet présidentiel)

Top 1: des cybercriminels compromettent la base de données notariale pour voler des appartements. (chapitre 14 : quelques mois plus tard).

30 ans plus tard…

Dans Habemus Piratam, je cite le nom de quelques pirates qui sévissaient sur Apple 2 du temps de mon adolescence (1980-1990). Ils « déplombaient » les jeux et les faisaient circuler gratuitement (sans internet : les disquettes passaient de main en main…). L’un d’entre-eux était « Godfather » (que je cite p37) :

A la sortie du roman, je l’ai retrouvé sur Facebook (la communauté Apple 2 reste encore très active, 30 ans plus tard) pour lui offrir un exemplaire dédicacé du livre.
La semaine dernière, nous nous sommes rencontrés à Paris et avons évoqué (la larme à l’oeil) nos souvenirs d’antan. Comment il avait commencé son activité, les potins du milieu, comment ses jeux, déplombés sur Paris, pouvaient-ils atteindre Martigues où j’habitais)… Jean-Philippe m’a dédicacé mon livre, à sa manière … j’adore. (Après 30 ans, il y a prescription pour ses méfaits informatiques 😉 )

C’est aussi ça la magie de l’écriture. Ecrire pour soi, écrire sur soi, faire des rencontres. J’aime.

Le livre papier, cet objet unique

Les amoureux des livres savent que, contrairement aux livres électroniques, chaque livre papier est unique. Voyons ce qui les différencient.

L’édition : souvent en dernière page, vous trouverez la date d’impression, qui vous indique l’ « édition » vous avez :

Dans le cas du broché de la Variante chilienne (sortie août 2015), vous voyez ici les 3 dates :
– première impression : avril 2015.
– avant sa sortie, la mise en place et la demande des libraires est importante : l’éditeur lance une seconde impression en août 2015.
– l’éditeur surveille attentivement les ventes. En septembre, il décide d’anticiper les ventes de Noël et commande un troisième tirage.

L’impression : l’éditeur envoie à l’imprimeur la couleur exacte Pantone qu’il souhaite pour la tranche du livre. Malheureusement, il se peut que des aléas de production ne rendent pas fidèlement les teintes souhaitées. On voit un bon exemple sur les 3 éditions de La fractale des raviolis où les roses ne sont pas exactement les mêmes.

Le texte : les fautes d’orthographes sont la hantise des éditeurs (et des auteurs). Malheureusement, malgré le travail attentif des correcteurs, la première impression en contient toujours. Une fois signalées, l’éditeur va les corriger pour les éditions suivantes. Dans le cas de La variante chilienne, un ignoble « Argentine de Pinochet » (p214) était dans le tirage d’avril 2015. Celui d’août 2015 le corrigeait par « Chili de Pinochet »… mais celui de septembre 2015 reprenait l’erreur ! Pourquoi ? Une simple inattention lors de l’envoi du fichier à l’imprimeur (non, nos amis éditeurs n’utilisent pas SVN ou Github comme les informaticients ;-))
Les « pré-print » ou « service presse ». En fonction du planning des corrections, il est possible que l’éditeur envoie aux distributeurs, médias ou libraires des exemplaires non corrigés. Ce sont des exemplaires différents de la version finale (en général moins cher à imprimer). Cela se voit clairement sur la couverture de La variante chilienne (couverture blanche non texturée avec la mention épreuves non corrigées).

Les exemplaires médiathèques. Les couvertures sont en général plastifiées et ont un code à barre. C’est assez collector quand on arrive à en récupérer un (sans le voler ! 🙂

Les versions poches : elles aussi ont leurs différentes vies. Témoin la collection folio qui a changé vers 2016 leur identité visuelle.

Les dédicaces. C’est la personnalisation ultime de votre roman, possible lors des rencontres avec les auteurs sur les salons ou dans les librairies. Voici la page dédiée à mes plus belles dédicaces.

 

Rencontre avec des lycéens auvergnats

Les élèves de seconde des lycées Albert Londres et Valery Larbaud  (Cusset dans l’Allier) ont travaillé toute l’année sur la Fractale des raviolis. Les enseignants ont organisé un concours de nouvelles de récits enchassés « à la mode Raufast ». Jeudi dernier, je les ai rencontrés et nous avons discuté du métier d’écrivain, du roman et de leurs nouvelles. Voilà une photo des 6 lauréats. Bravo à eux !
Les secondes cuisine/hôtellerie avaient préparé de délicieuses pâtisseries. Je suis reparti avec plein de petits mots, une boite de raviolis « spéciale » et … de jolis souvenirs ! Merci !

dig

Le vendredi, j’ai rencontré des élèves de seconde du lycée St Thérèse les cordeliers à Montferrand (63). Ils avaient tous préparé des supers carnets de lecture sur « La Variante Chilienne ». Ils ont posé  plein de questions. Merci aux professeurs de français et aux documentalistes pour leur passion et l’excellent travail qu’ils font avec leurs élèves #respect …

Atelier d’écriture

Le week-end dernier, j’ai participé à une expérience extraordinaire : un atelier d’écriture privé (4 personnes uniquement) vraiment spécial.
Nous étions logés dans le mythique hôtel littéraire de La Louisiane dans le 6e arrondissement de Paris (hôtel qui a vu passé Hemingway, St Exupéry, Sartre, Beauvoir, Henry Miller, Tarantino, …) : super ambiance et ondes créatives garanties !

A partir d’un simple pitch de 3 lignes, l’objectif était d’écrire ensemble un synopsis complet de roman. La première heure a été compliquée : les idées fusaient dans toutes les directions. Puis, au détour d’une anecdote, l’idée principale a pris forme…c’était parti, il ne restait plus qu’à dérouler le pelote.
Le résultat est bluffant : plus de 20 pages, chapitrage détaillé et profil psychologique des 7 personnages.
Il ne « reste » plus qu’à rédiger : expérience inédite pour moi de création collective à 8 mains ! … à suivre 🙂

Merci à Alexandra (bricabook), Nancy et Cloud pour cette bouillonante créativité.

Photo (c) Bricabook

Photo (c) Bricabook

Photo (c) Bricabook

[Anecdote d’écriture] La première version de la variante chilienne

Voici la première version du début de « La variante chilienne ». Vous constaterez qu’elle est bien différente de la version publiée (il y a eu une trentaine de versions intermédiaires). Dans ce premier jet, Margaux n’existait pas et c’était Pascal qui préparait les championnats du monde de pac-man.
Avec le recul, il est intéressant d’analyser les évolutions d’un roman au fur et à mesure de son écriture. Dans le style (ici, ça part dans tous les sens, trop d’idées condensées et pas d’effort particulier dans le style/orthographe) et dans la structure (ici, deux personnages principaux. L’histoire sera profondément remaniée avec l’introduction de Margaux (Mélody au début), à partir de la version 20).
En 2019, l’atelier d’écriture que nous organiserons avec bricabook sera probablement consacré à l’évolution d’un manuscrit. Comment ne pas se contenter du premier jet, comment et pourquoi le retravailler pour obtenir le meilleur.

C’est pendant cet été-là que je fis la connaissance de l’homme qui ramassait des cailloux.

La touffeur de la fin juin avait été difficilement supportable. Dans le salle des professeurs, la température atteignit les trente-trois degrés, ce qui alimenta jusqu’au dernier jour des conversations animées sur nos conditions de travail. Comme tous les ans, nous terminions le trimestre à genou, exténués par nos élèves surexcités par la chaleur et par l’approche des vacances. Le tourbillon frénétique de ces adolescents me paraissait de plus en plus incongru. J’oubliais peu à peu que j’avais été un des leurs et que leur ivresse printanière provenait de l’espérance excessive d’amours saisonniers.
À bientôt quarante-sept ans, j’enseignais la philosophie à des lycéens depuis près d’un quart de siècle : tâche aussi bien inutile que futile.
En début de carrière j’y croyais, comme tous les autres. Je pensais pouvoir planter des petites graines et leur faire comprendre deux ou trois choses : à défaut, tenter de les rendre plus heureux. Mais non. Rapidement, vient la routine, le cycle dévastateur des rentrées avec cette frustration de voir les quelques élèves brillants partir sans se retourner et voir débarquer des wagons d’analphabètes qui confondent Bertrand Russel et Russel Crowe. Pour se sortir de ce train-train aliénant, il faut se trouver un échappatoire, une nouvelle raison de vivre tangible, différente de nos idéaux de jeunes enseignants.

Certains élèvent des abeilles et font leur propre miel (qu’ils nous revendent fort cher en salle des professeurs), d’autres écrivent des romans qui ne seront jamais lus ou se lance dans le bénévolat pour satisfaire un besoin philanthropique.
La politique est un bon dérivatif : j’ai vu de nombreux conseillers municipaux emporter leurs copies à corriger à la mairie. Une collègue physicienne est quatrième dan d’aïkido et responsable régional de la fédération. Son mari, professeur de latin, joue tous les soirs dans un piano bar. Selon les rumeurs, il parait qu’un agrégé de biologie organisait des courses illicites de blattes et levait des paris dans le quartier nord de la ville. Du jour au lendemain, il disparut : certains pensent qu’il a fait fortune et coule des jours heureux en Thaïlande, d’autres prétendent qu’il fut la victime d’une sale affaire.
Chaque enseignant devrait avoir son violon d’Ingres.

Moi, Pascal Papadacci, normalien et agrégé de philosophie, j’ai aussi ma marotte.
Pendant mes deux mois d’été, je loue une maison à la campagne. Je cherche le plus petit village, le plus éloigné des axes touristiques. Je ne tolère que la compagnie des vaches, et des arbres la journée, et des grillons la nuit.
Je ne suis pourtant pas un sauvage. Je suis normalement introverti pour un normalien. C’est que ma passion exige une préparation mentale et physique incompatible avec la compagnie des hommes (ou des femmes) : mes journées débutent à six heures très exactemen. Je m’astreins à suivre un programme strict qui ne supporte aucune perturbation. C’est ce que mon ex-femme n’a jamais accepté, quoiqu’en dise son avocat.

Je joue à Pac-Man comme un professionnel.

– L’homme qui ramassait des cailloux, août 2013.