Parlent-ils *aussi* trop du coronavirus ?

Cet article est issu de la newsletter IA Comprise et reproduit ici par commodité. Recevez toutes les lettres dans votre boîte mail au fur et à mesure de leur publication en laissant votre adresse dans le cadre à droite !


Chère lectrice, cher lecteur,

Il y a quelques semaines, je vous avais envoyé une lettre consacrée à l’apparition du mot « coronavirus » dans les titres d’articles du Monde (que vous pouvez retrouver ici).

La conclusion était sans appel : ce mot, très rarement utilisé avant 2020 [1], avait fini par trouver place dans près d’un titre d’article sur trois au cœur de l’épidémie.

Plusieurs lecteurs m’ont demandé par la suite s’il s’agissait d’un phénomène spécifique au Monde. Intuitivement cela me paraissait peu probable, restait à le vérifier en pratique.

Deux journaux, une chaîne de télé et une station de radio sont dans un bar…

S’il est difficilement envisageable d’effectuer une vaste étude exhaustive au vu du temps nécessaire pour collecter, nettoyer, traiter et mettre en forme les données, j’ai étendu l’analyse à trois autres médias :

  • 20 Minutes (France)
  • BFM TV
  • France Info

Pourquoi ces trois-là ?

D’abord pour la variété des supports : un quotidien payant (Le Monde), un quotidien gratuit, une chaîne de télévision d’information en continu et une radio d’information généraliste.

Ensuite, car leurs sites sont tous parmi les 10 sites d’information les plus consultés d’après l’ACPM, ce qui leur assure une bonne représentativité [2].

Enfin, le plus important, car ils mettent leurs archives à disposition en ligne. Ce n’est pas si courant : des quotidiens nationaux comme Le Figaro ou Libération ne le proposent pas. Quant à Ouest-France, qui aurait été un bon représentant de la presse quotidienne régionale, leurs archives sont accessibles en ligne… mais la récupération de données n’y est pas autorisée [3].

Et encore, si Le Monde propose un impressionnant accès à toutes leurs archives depuis 1945 (!), les trois autres ne remontent que jusqu’à la fin des années 2000.

10 ans de titres d’articles pour arriver au coronavirus

Sans plus attendre, je vous laisse découvrir par vous-même le résultat [4] :

Que peut-on tirer de tout cela ?

Un coronavirus qui saute au visage

30% d’articles du Monde qui contiennent le mot « coronavirus » en mars, c’était impressionnant ? Il se révèle pourtant le plus diversifié des quatre !

20 Minutes a même atteint plus de 60% d’articles dont le titre contenait « coronavirus » en avril !

Bien sûr, dans le cas de 20 Minutes, c’est la conséquence d’un choix éditorial : placer le mot « coronavirus » en tête de tous les articles en lien avec ce sujet.

Si la pratique n’est pas nouvelle (on la retrouve par exemple lors d’élections ou d’événements sportifs), jamais elle n’avait pris une telle ampleur et de loin.

Des titres d’articles plus uniformes

Si vous vous souvenez de la précédente infographie avec Le Monde, il semblait que le mot le plus fréquent du mois apparaissait de plus en plus fréquemment au cours du temps.

Ou en d’autres termes, quand le mot le plus fréquent était rarement présent dans plus de 3% des articles au début des années 2000, cette proportion pouvait atteindre plus de 10% récemment.

Non seulement ce n’est pas une impression, mais cette tendance se retrouve à l’identique dans les autres médias, même en limitant aux dix dernières années et en excluant 2020 pour ne pas tenir compte de « l’effet coronavirus » :

Évolution tendancielle de la proportion d’articles contenant le mot le plus fréquent du mois

Je relève également que 20 Minutes, mais surtout aussi France Info et BFM TV (ré)utilisent plus fréquemment leur mot le plus courant que Le Monde.

Ce qui n’est pas si étonnant : la presse écrite, en particulier payante, a des rubriques diversifiées régulières (sport, environnement, voire nécrologie…), alors que les médias d’information en continu se concentrent sur l’actualité générale.

Quelques singularités de traitement

On retrouve souvent le même « mot le plus fréquent » à travers plusieurs, voire les quatre médias.

Ce n’est évidemment pas très surprenant, mais je trouve intéressant de regarder lorsque ce n’est justement pas le cas.

Quelques exemples :

  • En mai 2011, France Info a beaucoup traité de la mort de Ben Laden, tandis que les autres médias ont davantage parlé de « l’affaire DSK » [5]
  • En avril 2013, la couverture de la Ligue 1 de football dépasse l’affaire Cahuzac [6] dans 20 Minutes
  • En septembre 2015, BFM TV parle davantage de « réfugiés » que de « migrants »
  • Fin 2016-début 2017, pendant les primaires des présidentielles françaises, Le Monde se singularise en consacrant davantage d’articles à Donald Trump
  • En février 2020, France Info parle plus souvent de COVID-19 que de coronavirus. Mais le mot « coronavirus » reprend le dessus dès le mois suivant…

Dernière minute : À mi-juin, nous sommes justement dans un « brelan » : si « coronavirus » est toujours en tête chez 20 Minutes, Le Monde et France Info, « police » l’a devancé chez BFMTV… Peut-être le début de la fin de la vague du coronavirus ?


J’ai commencé cette lettre avec en tête l’objectif de simplement étendre l’analyse des titres d’articles à quelques autres médias… et cela m’a mené bien plus loin que je ne le pensais.

Il y aurait encore tant de choses à sortir de ces données :

  • Des nuages de mots apparaissant dans les titres d’articles (20 Minutes ne rédige pas ses titres de la même façon que Le Monde par exemple)
  • Des comparaisons entre les médias (qui ressemble le plus au Monde en termes de choix de titres ?)
  • Des tendances sur l’utilisation de certains mots (à partir de quel moment les médias ont-ils commencé à parler significativement de Syrie ou de Macron ?)
  • Et bien d’autres, sur la proportion d’articles réservés aux abonnés, la fréquence ou l’heure de publication des articles, leur catégorisation (international, politique, etc.) – sans même parler du contenu des articles…

Pour ma part, je m’en tiendrai là (il y a bien d’autres sujets dont je souhaite vous parler !)… mais cela ne m’empêchera pas de lire avec plaisir vos commentaires sur le sujet !

À la prochaine,

Erwan


Inscrivez-vous gratuitement pour ne rater aucune lettre !


Références
[1] Alors que cette famille de virus n’a au fond rien de nouveau ; des coronavirus avaient déjà été à l’origine de vastes épidémies en 2002 et en 2012. Mais l’usage a plutôt consacré le nom des maladies associées, SARS et MERS. Je serais curieux de comprendre pourquoi ce n’est pas le cas cette fois.
[2] https://www.acpm.fr/Les-chiffres/Frequentation-internet/Classement-des-Sites
[3] Je vous reparlerai un jour des vertus de l’open data
[4] Précision en toute rigueur : je n’ai évidemment pas retenu tous les mots, cela n’a pas grand intérêt si le mot le plus fréquent est « le » ou « est ». J’ai donc exclu un certain nombre de mots considérés (subjectivement) comme non significatifs.
Vous relèverez d’ailleurs peut-être quelques différences avec l’infographie précédente concernant Le Monde : j’ai profité de cette nouvelle version pour retirer également les chiffres (donc les années : 2018, etc.) des « mots les plus fréquents ».
[5] Dominique Strauss-Kahn, directeur du FMI et probable candidat du Parti Socialiste, qui a été accusé d’agression sexuelle par une femme de chambre du Sofitel de New-York
[6] Jérôme Cahuzac, ministre du Budget de François Hollande, qui pratiquait l’évasion fiscale

Laisser un commentaire

Abonnez-moi à la newsletter