Le cas San-Antonio

À l’occasion du centenaire de la naissance de Frédéric Dard, Fleuves Editions a décidé de créer un concours, récompensé par le Prix San-Antonio : https://www.prixsanantonio.universpoche.fr/concours/prix-san-antonio
L’occasion de se pencher sur cette série phénomène de la littérature policière :175 ouvrages publiés entre 1949 et 2001 (soit plus de 3 par an !) dont les couverture mythiques ont suivi l’air du temps.

Particularité des San-Antonio

Frédéric Dard s’est illustré par l’emploi d’un vocabulaire fleuri de son cru. Il a créé une véritable signature en inventant des milliers de mots (le dictionnaire San-Antonio existe et je vous le conseille). En conséquent, il passe sous le radar de mon analyse sur le critère « mots grossiers ». Ma liste de 130 mots grossiers ne vaut pas tripette face à ses expressions faites maison : beurrer la coquelle, brandonner du calbar, éjaculance et autres figouses. Ce biais baisse la note d’oralité, mais c’est le jeu ! Dans le texte, il y a effectivement peu de mots grossiers, même si la thématique globale reste pas mal en dessous de la ceinture (le célèbre humour grivois).

Évolution du style

Passons quatre romans écrits à différents époques sous notre analyse aux rayons X.

Il est intéressant de constater que le style évolue avec le temps. L’écriture est moins « facile » (suivant les critères de mon algorithme, c’est à dire moins de mots banals, d’expressions toutes faites, d’adverbes). Les autres critères restent étonnamment  stables, même si l’oralité a varié sur quelques romans.

Signalons toutefois deux baisses notables au fil du temps : le taux d’expressions communes (« blanc comme neige ») et l’usage des points-virgules (le sacrifié de la littérature contemporaine).

Comparaison avec des « classiques » du policier


Comparons San-Antonio de 1953 avec deux classiques : Georges Simenon (et son célèbre inspecteur Maigret) et Maurice Leblanc (et son tout aussi fameux Arsène Lupin). Il est amusant de constater 3 styles radicalement différents.
Maurice Leblanc a le style le plus « littéraire » des trois. Simenon, un texte plus travaillé mais davantage porté sur les dialogues. San-Antonio, un style plus grand public. Encore une fois, la comparaison est purement analytique et ne compare pas la richesse du vocabulaire, l’inventivité du style ou le suspens de l’intrigue.

Comparaison avec des auteurs contemporains

Intéressant de comparer que le rythme d’un policier est visiblement une constante (avec une moyenne de mots par phrase autour de 10, ce qui est un rythme rapide, là où Proust est à 33 et Helen Fielding à 7).
Ensuite, les deux critères facilité et oralité (nombre de dialogues, taux de !, ?, … et mots vulgaires) sont vraiment différents d’un auteur à l’autre. Autant de styles que d’auteurs, c’est une bonne nouvelle pour la littérature policière qui n’est pas cantonnée dans un style imposé.

Conclusion

Il n’y en a pas 🙂 Cette analyse aux rayons X de San-Antonio montre seulement que l’on peut écrire des romans policiers avec des styles vraiment différents. Sans doute parce que le suspens, l’ambiance et l’intrigue ne se résume pas à une histoire de style. Mais ça, on le savait déjà pour notre plus grand plaisir !
Je suis par contre curieux de voir le lauréat de ce prix : est-ce que le texte sélectionné aura le même « profil » qu’un San-Antonio ? Est-ce que le jury va être influencé (inconsciemment ou consciemment) par la similitude du style ? Ou alors ne vont-ils que s’intéresser au fond ? à l’inventivité du vocabulaire ? Réponse à l’automne.

A lire aussi

L’article qui explique le fonctionnement de ce logiciel.
L’analyse des Liaisons dangereuses avec ce logiciel.

 

 

Les liaisons dangereuses aux rayons X

Le roman

Les liaisons dangereuses est un roman épistolaire écrit par Pierre Choderlos de Laclos en 1782. Selon wikipedia, « il porte à un degré de perfection la forme épistolaire : aucun élément n’est gratuit, chaque épistolier a son style et la polyphonie des correspondances croisées construit un drame en quatre étapes au dénouement moralement ambigu ».

Le pari d’un roman polyphonique est de réussir la différenciation des voix narratives. Le style, comme un support à la signature des personnages. Laclos a-t-il réussi son pari ? (spoiler : oui ! 🙂 ) Voici une bonne occasion de passer ce roman aux rayons X grâce à l’outil présenté dans un précédent article afin de vérifier tout cela.

L’analyse

Un petit programme en python a regroupé toutes les lettres par émetteur. Puis, le programme d’analyse a donné la matrice de similitudes suivante.

Valmont

Valmont et la marquise de Merteuil sont les deux grands complices de l’histoire et l’auteur les a voulus proches dans le style (3,6) : de longues phrases, beaucoup de mots de liaison, un style pour convaincre, manipuler ?
Le deuxième style le plus proche de Valmont est celui de la présidente de Tourvel, la jeune femme qu’il séduira d’abord par jeu, puis dont il deviendra amoureux. Coïncidence ? 😉

Cécile de Volanges et Le chevalier de Danceny

Cécile de Volanges est la jeunette de l’intrigue. Naïve, elle se fait abuser par Valmont, le séducteur. Son style enfantin est très différent des autres protagonistes. Très différent de sa mère comme pour mieux marquer leur opposition. Plus proche de la marquise de Merteuil, sa confidente et de Valmont, son séducteur.
Cécile abuse des points de suspension (3 fois plus que Valmont) comme si sa pensée était submergée par les émotions. Elle utilise deux fois plus de mots communs que les autres, les phrases sont courtes.

Son prétendant, tout aussi jeune, partage sa fougue : C’est lui qui a le plus grand nombre de points d’exclamation et le rythme le plus élevé. Il est pourtant très éloigné du style de Cécile et de sa mère (16,8 et 16,9). Une indication de l’auteur pour nous montrer qu’il n’arrivera pas à ses fins ?

Madame de Volanges

Dans la hiérarchie sociale, c’est la plus âgée, la plus « sage ». Cela se traduit par la plus faible note d’oralité, les plus longues phrases, le plus faible taux de mots communs (qu’elle partage avec la présidente de Tourvel, autre personnage à la réputation irréprochable et au style à l’avenant).
Madame de Volanges voit d’un très mauvais oeil que le chevalier Danceny tourne autour de sa fille Cécile. Elle s’agace du comportement de celle-ci envers ce prédendant. Coïncidence ? C’est avec ces deux personnages que son style est le plus éloigné (19,1 et 16,9 le double des autres).
En revanche, le style le plus proche est celui de la marquise de Merteuil, sa confidente (8,8).

Encore plus fort…

Allons un cran plus loin et amusons-nous maintenant à regarder la différence de style en fonction du destinataire des lettres. Cécile de Volanges écrit-elle de la même façon à sa confidente Sophie, qu’au vicomte de Valmont ? Voici deux exemples amusants.

Cécile de Volanges
Ses lettres pour ses deux confidentes (Sophie et Merteuil) sont proches (9,7).
Par contre, en prenant pour référence ses lettres à la Merteuil, ses courriers pour Danceny et Valmont sont plus éloignés (resp. 14,4 et 18,4), reflétant ainsi l’éloignement nécessaire à la bienséance.
L’axe Oralité semble bien traduire chez elle cette distanciation. (Sur ce graphe, on pourrait même deviner que Danceny est, à son grand dam, dans la « friend zone » avec Sophie ! 😀 )

Le chevalier Danceny
En prenant pour références ses lettres à sa dulcinée Cécile, les lettres pour la Merteuil sont à 14 et celles pour Valmont à 24, marquant ainsi clairement son changement de style en fonction de ses interlocuteurs.
Chez Danceny, c’est plutôt la Facilité du style qui marque sa distance avec l’interlocuteur. Plus la personne est aimée, et moins il succombe à la facilité du style. Mais nous sommes au XVIIIe, et l’amour précieux se déclamait alors avec style ! 😉

Au fil du temps ?
On pourrait même imaginer une analyse des lettres au fil de l’intrigue. Cécile écrit-elle de la même façon à Valmont avant et après la fameuse nuit ? Même question pour la Présidente de Tourvel.

Conclusions

J’aime cet outil. Il ressemble vraiment à une machine à rayons X car il nous révèle l’ossature stylistique d’une oeuvre au service de la narration. On voit ici que Choderlos de Laclos a parfaitement réussi son pari : avoir une voix différente et une proximité des styles qui sert la proximité des personnages et des interactions. Chapeau.
Je me suis amusé à faire un tel traitement dans d’autres romans plus contemporains. Disons que je comprends pourquoi Les liaisons dangereuses est un classique, enseigné encore au bout de presque 250 ans 😉

 

 

Analyse de romans

L’objectif

Imaginez un logiciel qui analyse un roman, non pas sur le fond, mais exclusivement sur la forme. Avec un tel outil:

  • Verrait-on une différence entre la littérature de « genre » et la « blanche » ?
  • Le jury Goncourt aurait-il pu déceler Romain Gary derrière Emile Ajar ?
  • Il y a-t-il un « pattern » du succès commercial ? Lequel ?
  • Les oeuvres d’un auteur sont-elles homogènes tout au long de sa carrière ?
  • Il y a-t-il des ovnis littéraires, dont le style est éloigné de tous leurs confrères ?

La réponse est oui. Voyons comment.

L’algorithme

Points de mesure et distance

J’ai développé un logiciel : certains parleront d’IA (Intelligence Artificielle), mais nous n’en sommes pas encore là. Je préfère parler d’analyses statistiques. L’algorithme mesure 14 critères sur 380 ebooks. Je vous en donne 7 : le taux de virgules, de dialogues, de points d’exclamation, d’adverbes, de mots longs, de mots grossiers, le nombre de mots par phrase.
Une fois ces critères normalisés, on peut calculer une « distance » entre chaque auteur. Cela traduit une forme de proximité dans le style. Par exemple, Balzac est proche de Stendhal (8,7), mais éloigné de Bukowski (48). L’échelle est la suivante.

Regroupement en 4 axes

Ces 14 critères sont regroupés en 4 thématiques

  • Le rythme du texte (longueur des phrases)
  • L’oralité (la présence de dialogue, de mots grossiers, de !, …, ?)
  • La facilité (présence de verbes simples conjugués au présent, nombreux adverbes, des expressions « clichés », par exemple « blanc comme neige », …)
  • La complexité (mots longs ou phrase longue articulée par des conjonctions de coordination)

On obtient des diagrammes radar de ce style, bien pratiques pour comparer 2 auteurs.

Exemple évident : nous savons tous que San Antonio n’a pas du tout le même style que Marcel Proust. Une plus grande oralité, un rythme plus rapide, une grande facilité. Mais cet exemple outrancier est important pour introduire une notion importante : cette méthode n’est pas destinée à juger de la qualité d’une oeuvre. L’analyse du style ne préjuge pas de la qualité littéraire d’un roman ou de sa puissance narrative. Avec cette méthode, Marcel Pagnol a un score important en oralité et Albert Cohen, en facilité. A titre d’illustration, voici la comparaison entre Jean Giono et Fred Vargas : deux genres différents, deux regards différents sur le monde, et pourtant, des styles très comparables selon ce logiciel.

Que peut-on faire de cet outil ?

1. Littérature de genre

Commençons par enfoncer des portes ouvertes. Qu’est-ce-qui fait la différence entre la littérature de genre (ici le polar) et la littérature « blanche » contemporaine ? Sans surprise, l’oralité et le rythme sont deux critères permettant de ségréguer très nettement nos deux échantillons représentatifs.

Notons au passage que les critères Oralité et Rythme sont bien corrélés.

2. Évolution tout au long d’une Oeuvre

Amusons-nous à étudier la proximité des romans d’un même auteur tout au long de sa carrière.

Victor Hugo : Ses oeuvres sont très proches ; même les jaunes sont proches de la limite du vert.

Bernard Werber, l’analyse chronologique montre une belle homogénéité, sauf pour son miroir de Cassandre, qui se distingue légèrement de ses premiers livres.

Contrairement à l’idée reçue que « tous les Amélie Nothomb se ressemblent », la matrice ci-dessous montre une certaine diversité dans le style que cette romancière emploie. C’est une des rares à franchir la barre du orange – sans emprunter un pseudonyme.

Une analyse plus exhaustive de la proximité des 88 romans de Balzac, montre aussi une prédominance de verts (81%) et environ 19% de jaunes. Un seul orange, Petites misères de la vie conjugale : texte écrit entre 1830 et 1846 et publié par chapitre dans plusieurs revues, ce qui peut justifier un style disparate.

Une analyse de 15 textes de Patrick Modiano montre que ses deux premiers romans (La place de l’étoile et La ronde de nuit) se démarquent du reste de sa production.
Pour illustrer, voici l’empreinte radar de ses deux premiers romans et de Rue des boutiques obscures qui lui valut le Goncourt dix ans plus tard en 1978.

Détection de pseudonymes ?

Mais alors, serait-il possible de détecter parmi les textes d’un auteur, lesquels il n’aurait pas rédigés (#JeSache), ou à l’inverse, un même romancier qui se cache derrière deux pseudonymes ?
On pense évidemment à Romain Gary qui a gagné deux fois le prix Goncourt. Une première fois en 1956 pour Les racines du ciel, une seconde fois en 1975 pour La vie devant soi signé Emile Ajar.

Rendons justice au jury : le logiciel confirme la distance importante entre ces deux textes et la difficulté de démasquer le farceur !

Moins réussie, la tentative de Boris Vian d’écrire sous la plume de Vernon Sullivan. Avec ce logiciel, la supercherie aurait été facilement dévoilée.

Une recette du succès ?

En analysant bien tous les romans et en corrélant avec leur succès commercial, pourrait-on, avec ce logiciel, trouver « la recette du succès commercial » ? Les auteurs qui vendent le plus ont-ils des points communs ?
A titre d’exemple, prenons Guillaume Musso : les 5 auteurs les plus proches de lui sont tous des poids lourds internationaux.

  • Dan Brown (6,5, ce qui est une très très courte distance !)
  • JK Rowling (8,3)
  • Collins Suzanne (9,3)
  • Tom Clancy (10,6)
  • Amélie Nothomb (10,8)

Et rien que pour vous, voici donc la recette d’un best-seller international :

Malheureusement, le recette d’un Goncourt semble plus ardue : aucune similitude des textes dans mon échantillon.

Le cas Mathias Enard

Suite à son Goncourt en 2015,  Le Nouvel Observateur a comparé Mathias Enard à Honoré de Balzac dans cet article. Comparaison soulignée par son physique, comme le montre cette étonnante illustration.

Avec ce logiciel, j’affirme haut et fort, que le style de Mathias Enard se rapproche davantage de celui de Stendhal (12,9, son plus proche score) que de celui de Balzac (16,6). Ahah ! Quel plaisir que de contredire Le Nouvel Obs (sans rancune, hein ? :-))

L’affaire HP. Lovecraft

En rajoutant HP Lovecraft dans mon analyse, je m’aperçois que Marcel Proust, qui jusque là, n’avait qu’une proximité (assez logique) avec Amin Maalouf (12,0), devient « ami » de Lovecraft avec une proximité de 11,2. Étonné, je me renseigne sur le lien potentiel entre ces deux auteurs et je découvre cette citation de Proust : « Lovecraft est passionnant quand il parle de réalisme (où il place Balzac et Tourguenev au plus haut, s’en sert d’alibi à son dédain de Dickens), et de real literature (…) Il lit les deux premiers tomes de la première traduction d’À la recherche du temps perdu (Un amour de Swann, Les jeunes filles en fleurs). Et puis il dit que « personne au XXe siècle n’est capable d’éclipser ce bonhomme-là ». Ce qui me fait plaisir à plus d’un titre. »
Lovecraft était fan de Proust, mais est-ce que cela suffit à expliquer leur proximité ?

Les deux profils se distinguent par un rythme très différent, genre oblige ! 🙂
Soulignons aussi la limite de l’exercice : comparer un texte en français avec une traduction introduit forcément un biais (il faudrait vérifier que la traduction de dénature pas le texte d’origine). Par contre, une analyse plus poussée de l’oeuvre de Lovecraft, montre une hétérogénéité non négligeable.

A noter, qu’il est aussi très proche de JL Borges (11,1) :cela semble cohérent, du point de vue du registre fantastique, mais cela ne devrait être visible sur ce genre d’analyse purement syntaxique. Intéressant. Le radar montre 2 triangles emboités, Borges est le maître de Lovecraft ! 😉

Et le Cerbère blanc dans tout ça ?

En temps qu’auteur, il est très intéressant d’analyser l’évolution d’un manuscrit au fil des versions (je suis un adepte de l’écriture itérative). Voici quelques statistiques intéressantes sur mon dernier roman Le cerbère blanc.

Quelques points de mesure évoluent nettement entre la première version (2016) et le manuscrit définitif (2020). Tandis que le rythme du récit reste constant, l’oralité diminue, signe d’un travail sur l’écriture, confirmé par la chasse aux adverbes et l’ajout de points-virgules (symptomatiques de phrases plus structurées).

Sur ce tableau, nous voyons nettement la distance du premier jet avec les versions successives. Même si on reconnait l’oeuvre écrite par un même auteur, la distance double pratiquement dans le laps de temps du projet.
Bien entendu, ce logiciel m’a permis de comparer mon style aux autres auteurs contemporains ou classiques… mais là, je garde le résultat pour moi ! 😉

Quelques distances entre auteurs

Justement, un classement intéressant : voici la proximité d’auteurs entre eux (critère : une proximité < 13).

Le cas Asimov m’amuse beaucoup. Bien que ce logiciel n’analyse ni la thématique ni le fond, on retrouve Bradbury (SF), Tom Clancy et Dan Brown (Fantastique) dans son top-3.

Certains auteurs n’ont aucun collègue proche. Ce sont des OVNI. Cela se traduit par un style bien à part. C’est le cas notamment de Bukoswki, Zweig ou Houellebecq (du moins avec mon échantillon de 85 auteurs).

Autres exemples

Dans un autre article, j’analyse le roman épistolier « les liaisons dangereuses » en utilisant cet outil sur les personnages. Ont-ils tous la même voix ? le même style ?

Conclusion

Ce logiciel a été développé pendant le confinement : j’ai pris beaucoup de plaisir à l’écrire et à observer les différents résultats. Moi qui m’intéressais, en tant qu’auteur, aux structures narratives, me voici plongé dans une autre dimension toute aussi passionnante.
Je n’ai pas encore la matière, mais il serait aussi intéressant de mesurer l’influence d’un traducteur sur l’oeuvre traduite. Le Moby Dick de Giono ressemble-t-il à un autre roman de Giono ? Quelle proximité avec les autres traductions ?
Vos commentaires sont les bienvenus.
Portez-vous bien, lisez beaucoup.

 

 

 

 

 

 

Habemus Piratam : ce qui est devenu vrai…

Habemus Piratam est un ouvrage de (presque) fiction. Ecrit en 2015-2016, il a été publié en octobre 2018. Pourtant, depuis son écriture, des histoires imaginées se sont réellement produites… Quand la réalité rejoint la fiction, cela donne ce TOP5 très étonnant :

Top 5. Les cabinets dentaires américains ciblés par des hackers (voir chapitre 9 : la dent)

TOP 4. Les hackers tentent de pirater le prochain manuscrit de Margaret Atwood, auteure à succès de La servante écarlate. (voir chapitre 6 : les portes du monastère).

TOP 3. Des hackers coupent l’électricité de Kiev, mais certainement pas pour mieux observer les étoiles ! 🙂 (voir chapitre 4 : le pic du Midi).

Top 2: des hackers russes inculpés pour avoir influé sur l’élection américaine (voir chapitre 12 : le botnet présidentiel)

Top 1: des cybercriminels compromettent la base de données notariale pour voler des appartements. (chapitre 14 : quelques mois plus tard).

30 ans plus tard…

Dans Habemus Piratam, je cite le nom de quelques pirates qui sévissaient sur Apple 2 du temps de mon adolescence (1980-1990). Ils « déplombaient » les jeux et les faisaient circuler gratuitement (sans internet : les disquettes passaient de main en main…). L’un d’entre-eux était « Godfather » (que je cite p37) :

A la sortie du roman, je l’ai retrouvé sur Facebook (la communauté Apple 2 reste encore très active, 30 ans plus tard) pour lui offrir un exemplaire dédicacé du livre.
La semaine dernière, nous nous sommes rencontrés à Paris et avons évoqué (la larme à l’oeil) nos souvenirs d’antan. Comment il avait commencé son activité, les potins du milieu, comment ses jeux, déplombés sur Paris, pouvaient-ils atteindre Martigues où j’habitais)… Jean-Philippe m’a dédicacé mon livre, à sa manière … j’adore. (Après 30 ans, il y a prescription pour ses méfaits informatiques 😉 )

C’est aussi ça la magie de l’écriture. Ecrire pour soi, écrire sur soi, faire des rencontres. J’aime.

Le livre papier, cet objet unique

Les amoureux des livres savent que, contrairement aux livres électroniques, chaque livre papier est unique. Voyons ce qui les différencient.

L’édition : souvent en dernière page, vous trouverez la date d’impression, qui vous indique l’ « édition » vous avez :

Dans le cas du broché de la Variante chilienne (sortie août 2015), vous voyez ici les 3 dates :
– première impression : avril 2015.
– avant sa sortie, la mise en place et la demande des libraires est importante : l’éditeur lance une seconde impression en août 2015.
– l’éditeur surveille attentivement les ventes. En septembre, il décide d’anticiper les ventes de Noël et commande un troisième tirage.

L’impression : l’éditeur envoie à l’imprimeur la couleur exacte Pantone qu’il souhaite pour la tranche du livre. Malheureusement, il se peut que des aléas de production ne rendent pas fidèlement les teintes souhaitées. On voit un bon exemple sur les 3 éditions de La fractale des raviolis où les roses ne sont pas exactement les mêmes.

Le texte : les fautes d’orthographes sont la hantise des éditeurs (et des auteurs). Malheureusement, malgré le travail attentif des correcteurs, la première impression en contient toujours. Une fois signalées, l’éditeur va les corriger pour les éditions suivantes. Dans le cas de La variante chilienne, un ignoble « Argentine de Pinochet » (p214) était dans le tirage d’avril 2015. Celui d’août 2015 le corrigeait par « Chili de Pinochet »… mais celui de septembre 2015 reprenait l’erreur ! Pourquoi ? Une simple inattention lors de l’envoi du fichier à l’imprimeur (non, nos amis éditeurs n’utilisent pas SVN ou Github comme les informaticients ;-))
Les « pré-print » ou « service presse ». En fonction du planning des corrections, il est possible que l’éditeur envoie aux distributeurs, médias ou libraires des exemplaires non corrigés. Ce sont des exemplaires différents de la version finale (en général moins cher à imprimer). Cela se voit clairement sur la couverture de La variante chilienne (couverture blanche non texturée avec la mention épreuves non corrigées).

Les exemplaires médiathèques. Les couvertures sont en général plastifiées et ont un code à barre. C’est assez collector quand on arrive à en récupérer un (sans le voler ! 🙂

Les versions poches : elles aussi ont leurs différentes vies. Témoin la collection folio qui a changé vers 2016 leur identité visuelle.

Les dédicaces. C’est la personnalisation ultime de votre roman, possible lors des rencontres avec les auteurs sur les salons ou dans les librairies. Voici la page dédiée à mes plus belles dédicaces.