La modération des plateformes est-elle vouée à l'échec ?

By Hugo LassiègeDec 22, 202514 min read

Récemment je me suis lancé dans la création d'une plateforme de blog, writizzy.com, avec l'ambition de proposer une alternative européenne aux plateformes US comme Medium, Substack, Hashnode etc.

Et vous pourriez me dire, "oui mais les blogs c'est pas un peu mort depuis Youtube, Tiktok, Instagram et consorts ?" Là-dessus, je ne pense pas, mais je vais en reparler.

Par contre, les blogs ont un défaut majeur qui les pénalise par rapport à toutes les plateformes que je viens de citer : la découvrabilité.
Ce qui fait le succès des plateformes c'est... les algorithmes de suggestion de contenus.

Oui, je sais, c'est aussi ce qu'on leur reproche. Mais sans algo, personne ne découvrirait la vidéo de Jean-Pierre et sa passion pour les fourmis. Et ce serait peut-être dommage.

Sauf qu'un des sujets qui vient avec, c'est la responsabilité des plateformes sur le contenu suggéré, et donc la modération. Et pour l'instant, aucune plateforme n'est irréprochable à ce sujet. Entre le zèle puritain de Youtube, la banalisation des discours complotistes de X, les ventes de poupées sexuelles sur Shein, on voit bien que le sujet est loin d'être simple et toujours pas résolu.

Alors, comment on fait ? Est-ce que c'est voué à l'échec ?

Bref, je vais parler ici de la santé des blogs, de découvrabilité et de pourquoi c'est important, des différentes solutions de découvrabilité, des plateformes de suggestions de contenu et de modération. Et autant vous dire que j'ai pas toutes les réponses, je suis justement en train de me pencher dessus. Mais justement, ça m'intéresse qu'on en discute.

Les blogs se portent bien

Et oui, surprise, en réalité les blogs ne se portent pas si mal. En tout cas c'est ce qu'on peut lire sur optinmonster qui nous parle de plus de 600 M de blogs à travers le monde. Il y aurait plus de 409 M de personnes qui liraient plus de 20 milliards de pages chaque mois sur wordpress.com, WordPress qui continue de propulser 40 % des sites mondiaux. Sur cette autre source on peut lire que 83 % des internautes (4,4 milliards de personnes) lisent des articles de blogs régulièrement.

Bref, le blog est en réalité très vivant, même si, effectivement, il y a cependant une évolution vers une consommation plus forte de vidéo.

Aujourd'hui 82 % du trafic internet mondial concerne la vidéo et beaucoup se tournent désormais vers Tiktok, Instagram et consorts pour trouver rapidement une réponse sur un sujet, que ce soit des recettes de cuisine, des tutoriels de bricolage ou même des sujets tech. Pour autant, l'écrit se démarque par sa facilité d'accès et de mise à jour. Personnellement je fais les deux, des vidéos et des articles de blog. Et écrire est évidemment nettement plus rapide que produire une vidéo, sans parler que je peux corriger un article après mise en ligne, ce que je ne peux pas faire sur une vidéo. Et ça, pour moi, ça donne un avantage significatif à l'écrit pour beaucoup de gens qui n'ont pas l'énergie de se filmer, ou juste pas envie de montrer leur tête.

Alors oui, la vidéo va continuer de s'imposer sur du divertissement et les moments où on cherche à débrancher un peu son cerveau, mais le blog continuera d'être plus facile d'accès et pourra permettre de créer un contenu plus spécialisé, plus facile à mettre à jour.

Par contre, et c'est là où les plateformes vidéos tirent leur épingle du jeu, la grosse différence se fait sur la suggestion de contenu et c'est ça qui en fait un modèle fragile.

La découvrabilité, une question de vanity metrics ?

La découvrabilité est un sujet un peu vaste, parce qu'on pourrait se demander en premier lieu si c'est vraiment une préoccupation quand on écrit un blog.

Pour certains, la réponse est clairement oui, on parle de personnes qui ont créé un média, une newsletter payante et qui monétisent leur trafic. Exemple : Pragmatic Engineer, Ali Abdaal.

À l'opposé du spectre, l'activité n'est pas à vocation lucrative, c'est un journal personnel et advienne que pourra. À la limite, la découvrabilité est même découragée, par exemple n.survol.fr qui ne publie aucun sitemap et rend difficile l'exploration du site.

Et entre les deux il y a toute une palette de couleurs : des gens qui travaillent leur personal branding (so 2000), d'autres qui s'en servent de relais d'influence, des blogueurs du dimanche etc.

Pour ma part je navigue dans cette zone grise. Je ne monétise pas mon blog que j'alimente depuis 2001 mais j'admets que je trouverais ça un peu triste que personne ne lise. Donc j'y prête attention.
Même si je l'utilise aussi comme une sorte de mémoire numérique personnelle, ma première motivation quand j'ai démarré au début des années 2000 c'était de partager des tutoriels et des retours d'expérience. Et si c'est absolument pas lu, je mettrais sans doute moins d'effort. C'est justement pour passer à l'échelle que j'ai ajouté le format vidéo Youtube il y a un an.

Je comprends que ce ne soit pas l'objectif de tout le monde, mais pour ma part, aujourd'hui, j'essaie d'avoir de l'impact, à mon échelle, sur la compréhension de sujets tech, de son influence, dans l'entreprise et même dans la société. Je ne vends rien, et j'essaie d'apporter quelque chose.

Sauf que voilà, quand je publie une vidéo sur Youtube, j'ai en moyenne plusieurs milliers de vues avec un max personnel pour l'instant à 35k. (Exemple : au moment où j'écris cet article, j'ai publié une vidéo ce matin, elle fait déjà 3,6k vues en moins de 7h)

Sur le blog, les vues oscillent entre 50 et 12k vues. Mais la grande majorité tourne autour des 1k. Et encore, on parle d'un blog ancien avec une bonne réputation de domaine, un SEO à peu près viable, bref, ce ne sont même pas de mauvaises performances.

Encore une fois, peut-être que certains sont absolument contre le fait de regarder ces "vanity metrics", mais je ne cache pas que j'ai l'esprit joueur et je suis prêt à parier que certains blogs seraient quand même plus actifs s'ils étaient plus lus.

Or, si ce n'est pas lu, ce n'est pas que le contenu est forcément de mauvaise qualité, mais aussi qu'il est difficile à trouver. Sans relais actif, personne ne lit un article de blog. Le SEO pour un blogueur c'est un combat quasi perdu d'avance contre des plateformes et des sites pros qui bénéficient d'une meilleure autorité ou d'un budget marketing.

C'est pourquoi 90 % des blogueurs utilisent les réseaux sociaux pour promouvoir leurs articles.

Et forcément en créant Writizzy je me demande, et si on pouvait faire mieux ? Si on pouvait favoriser la découverte de contenu à travers un cercle de lecteurs ?

Les algos : la réponse apportée par les plateformes

C'est justement ici qu'interviennent les plateformes. Je pourrais citer Instagram, Youtube, Tiktok, X etc. La mécanique est la même. Ces plateformes vont créer des fils de contenus adaptés à l'utilisateur. Et elles vont chercher à maximiser le temps passé sur la plateforme par l'utilisateur en lui proposant toujours plus de contenu adapté.

Pour ça, l'idée est de reposer sur la masse de contenus produits par tous les utilisateurs de la plateforme pour déterminer ensuite la bonne audience susceptible d'apprécier une nouvelle vidéo.

Quand je publie sur Youtube je ne fais aucun effort de promotion, c'est Youtube qui s'en charge. Il va chercher à déterminer la bonne audience, leur présenter la vidéo, mesurer les réactions (clic, temps de visualisation, like, commentaires etc.), valider l'audience, recommencer etc.

Bref, c'est ce qu'on appelle un algorithme.

Sauf que ces algorithmes peuvent avoir pas mal de défauts. Ils peuvent être optimisés pour favoriser les engagements négatifs (comme X qui va diffuser davantage les contenus polémiques), voire favoriser un courant de pensée (cf. X encore une fois qui a été impliqué dans plusieurs affaires d'influence sur des élections récentes). On peut aussi leur reprocher de fabriquer des bulles de filtre qui nous enfermeraient dans des schémas de croyance, même si j'ai tendance à penser que nos propres biais de confirmation nous enferment déjà tout seuls. Ils peuvent aussi avoir un objectif néfaste de nous enfermer dans un scrolling infini, rétribué par de petits shots de dopamine histoire d'accepter passivement de la publicité insérée ici et là.

Alors oui, les algos n'ont plus bonne presse, mais dans les faits, ils restent la principale raison de rester sur ces plateformes. Ce sont eux qui nous permettent de découvrir le contenu disponible et pour les personnes qui produisent le contenu, ce sont eux qui nous permettent d'éviter l'anonymat complet.

Si je suis convaincu de l'intérêt de travailler sur la découvrabilité des blogs, une question semble émerger : comment donner le contrôle aux utilisateurs ?

Reprendre le pouvoir

Avant d'aller plus loin, évidemment il faut préciser que tous les algorithmes ne sont pas forcément opaques et complexes. Il existe des alternatives "allégées" comme par exemple sur Hacker News qui se base uniquement sur le nombre de votes et la fraîcheur du contenu. C'est le même type d'algorithme qui est utilisé sur Bearblog qui l'indique en bas de page :

# This page is ranked according to the following algorithm:
Score = log10(U) + (S / (B * 86,400))

D'autres solutions proposent un simple classement chronologique. C'est l'approche par exemple de Mastodon qui propose uniquement d'afficher les posts triés par date.
J'ai tendance à trouver cette approche trop minimaliste.

En fait surtout ce qui m'intéresse, c'est de savoir s'il existerait une approche vertueuse ? Comment préserver la qualité des recommandations sans m'imposer des choix unilatéraux ? Or c'est justement exactement le sujet de ce billet de blog et qui fait une remarque importante :

You can pay money and advertise to women of color between 40–60 in Seattle, but you can't choose to read perspectives from those women

Ce billet de blog met en avant une réponse, un projet de recherche du MIT : Gobo (malheureusement pas actif au moment où j'écris) nous permettant d'agréger de la donnée issue de plateformes pour y appliquer nos propres filtres. Dans la même veine on peut trouver aussi Youchoose, ou Tournesol, avec tous le même objectif, donner le pouvoir aux utilisateurs.

Si ces initiatives restent confidentielles, la mise en œuvre la plus aboutie et utilisée est sans doute celle de Bluesky qui permet à chacun de choisir des algorithmes qui peuvent être créés par d'autres utilisateurs.

Si je devais créer un mécanisme de recommandation de contenu dans Writizzy, ce serait sans doute l'approche qui me séduit le plus.

Cependant, en discutant du sujet avec Thomas (qui travaille aussi sur Writizzy), proposer un feed de contenu va rapidement poser deux autres problèmes :

  • comment on démarre alors qu'on a seulement 140 utilisateurs dont environ 10/15 % vraiment actifs ? C'est ce qu'on appelle le problème du Cold Start
  • la modération

Je passe sur le premier sujet, ce n'est pas l'objet de ce post. Par contre le second est assez sérieux.

La modération

À partir du moment où on crée une page dont le contenu est un agrégat venant d'une multitude d'utilisateurs, le danger d'avoir du contenu inapproprié existe. Ça peut être du contenu X, du spam, du scam, des injures à caractère raciste etc.

Writizzy a déjà une responsabilité au sens du DSA européen. Je dois fournir un mécanisme de signalement et je dois agir si on me signale un contenu illicite. Attention, je suis considéré comme hébergeur donc je ne suis pas tenu de réagir proactivement. Tant que les blogs restent séparés, ça reste encore "facile". L'impact se limite au blog de l'individu en question.

Par contre, au moment où un feed se crée, l'impact peut être démultiplié, c'est même l'effet recherché, mais ici, ça crée une pression plus importante sur la modération. Et c'est loin d'être simple parce qu'il faut juger du caractère illicite du contenu or ce caractère n'est pas forcément évident. La notion de ce qui est acceptable ou pas n'est pas universelle.

Où se situe la frontière entre satire et insulte ? Quelle est la frontière entre critique politique et diffamation ? Comment détecter et traiter les fake news ? Quelle est la frontière entre nudité pornographique et art (par exemple L'Origine du monde de Gustave Courbet) ?

J'ai essayé de recenser les différentes méthodes possibles de modération pour voir si c'était envisageable pour Writizzy :

La modération manuelle

Ici on retrouve deux grandes catégories, la modération manuelle par un ou plusieurs super administrateurs, et la modération massive et outsourcée. La modération manuelle sur des petits volumes est celle qu'on retrouve par exemple sur Mastodon avec le biais évident de la subjectivité du modérateur et également des conflits ensuite entre instances de Mastodon ayant des positions politiques parfois différentes. Je ne suis pas infaillible, je ne veux pas être responsable de la modération sur tout le contenu publié. Sans parler que ça ne passera pas à l'échelle.

En second il y a la modération de masse, souvent outsourcée dans des pays à faibles salaires par des grandes plateformes comme Meta, Tiktok ou OpenAI. C'est loin d'être un métier agréable et les abus ont été décrits dans plusieurs articles. C'est inadapté pour Writizzy, économiquement et éthiquement.

La modération communautaire.

Celle-ci repose principalement sur les signalements. On peut retrouver les Community Notes de X dans cette catégorie, ou les fils de discussion sur Wikipédia. C'est évidemment la modération la moins coûteuse mais elle peut être contournée si un ensemble d'individus se coordonnent pour censurer un contenu. Ce système peut être amélioré avec un système de points de réputation accordés par la communauté aux utilisateurs. C'est ce qu'on appelle les points de Karma sur Reddit et Hacker News, ou le score de réputation sur Stack Overflow. Sur Writizzy ce mécanisme pourrait avoir tout son sens. Cependant cette modération a aussi l'inconvénient d'être a posteriori, c'est-à-dire que le mal est déjà fait, le contenu a déjà été exposé avant d'être signalé.

La modération automatique

Ça peut être lié à une détection de mots-clés, le profil de la personne (nouvel inscrit, pattern de diffusion etc.), algos de détection de nudité sur des photos. C'est la méthode la plus simple à mettre en place. On peut régler la tolérance. Et c'est peut-être là qu'une IA peut briller pour comprendre un texte mais c'est loin d'être infaillible, on peut utiliser des détournements de mots, modifier l'orthographe, utiliser des emojis pour représenter un concept ou tout simplement avoir des algos moins performants pour une langue donnée.

Pour moi, la conclusion de cette mini étude est assez évidente, il faudrait avoir un système de détection automatique en amont, puis un système de signalement amélioré par un système de Karma en aval et en tout dernier lieu, une intervention manuelle d'un super admin.

Pour autant, ces systèmes existent et les plateformes continuent d'être décriées, parce que toutes ces modérations sont imparfaites. En effet il y a toujours la question centrale de l'interprétation : qu'est-ce qui est licite ou pas ? Cette interprétation variant selon les pays et cultures.

Et c'est là où on retrouve une autre approche, celle de Bluesky, encore elle, dont l'un des principes fondamentaux c'est la décentralisation, y compris sur la modération via des étiqueteurs (labelers).

La modération décentralisée

La modération sur Bluesky comporte 2 niveaux :

  • La modération de base, celle de Bluesky. Cette première étape de modération est faite par Bluesky lui-même via Ozone, un outil de modération open source. Cette modération est paramétrable pour indiquer quel est son propre niveau de tolérance. Cette première étape est censée détecter ce qui est universellement non admis (pédopornographie, appel à la violence etc.) et sur lesquels la plateforme peut être tenue responsable devant la justice.
  • La modération optionnelle fournie par des labelers indépendants. Ces labelers peuvent être construits avec un SDK et fournis aux utilisateurs qui les choisissent pour customiser la modération qu'ils attendent.

Bref, on en revient encore au même : donner le contrôle aux utilisateurs. (Même si sans doute 90% d'entre eux garderont la modération par défaut)

Des alternatives pour la découvrabilité

Ce qui est sûr, c'est que le sujet est ardu et je comprends largement la réticence de Thomas à s'aventurer sur ce sujet. Alors on a discuté d'autres pistes. Plutôt que de proposer une agrégation de contenu, on pourrait commencer par une curation de contenu. C'est beaucoup plus simple et nous pourrions sélectionner chaque semaine ou chaque mois le contenu à mettre en avant.

On peut aussi considérer que la suggestion de contenu peut se faire à plus petite échelle :

  • des suggestions de contenus liés en bas des articles qu'un lecteur vient de lire
  • des suggestions de newsletter similaires lorsqu'un utilisateur s'abonne.

On peut aussi considérer que le sujet c'est plutôt d'automatiser la multidiffusion : RSS et newsletter aujourd'hui, diffusion automatique sur ATProto, Bluesky, Nostr demain ?

Il y a d'autres pistes et aucune décision n'a été prise pour l'instant.

Et vous, vous feriez comment ? Si vous êtes concernés par le sujet de la découvrabilité, ce serait quoi votre solution idéale ? Est-ce que vous utilisez les suggestions Medium ou dev.to par exemple ? Est-ce que vous faites déjà de la diffusion sur des réseaux fédérés ?


Share this:

Written by Hugo Lassiège

Software engineer, ex-freelance, ex-cofounder, ex-CTO. I love building things, sharing knowledge and helping others.

Copyright © 2026
 Eventuallycoding
  •
Powered by Bloggrify