reddit est une plateforme communautaire où les utilisateurs partagent, commentent et découvrent des contenus variés sur des milliers de sujets.

EN BREF

  • Étude Minddex sur 9 286 citations Reddit dans des réponses de LLM.
  • 78 % des citations proviennent de discussions organiques, pas de contenus créés par les marques.
  • 62 % des extraits cités viennent de commentaires, souvent courts (150 à 400 caractères).
  • Les upvotes ne filtrent pas la qualité : 82 % des commentaires cités ont entre 1 et 5 upvotes.
  • Le contenu cité a une ancienneté médiane de 280 jours.
  • Le format Q&R est privilégié par les LLM, représentant 44,2 % des citations.
  • Pas de prime pour le karma de l’auteur ou pour la fraîcheur du contenu.
  • Les réponses des LLM sont principalement des paraphrases.
  • Identification des subreddits clés nécessaire pour maximiser la visibilité.
  • 65 % des citations incluent l’URL du thread cité, mesurable dans les tableaux de bord.

Une étude inédite réalisée par Minddex, portant sur 9 286 citations issues de réponses générées par des modèles de langage (LLM), révèle le rôle prépondérant de Reddit en tant que source d’information. Les résultats montrent que 78 % des citations proviennent de discussions organiques plutôt que de posts initiaux par les marques. En outre, 62 % des extraits référencés sont issus de commentaires, souvent courts, preuve que la forme concise et pertinente est privilégiée. Les upvotes n’influencent pas la sélection des contenus, avec 82 % des citations ayant peu de votes. Enfin, la pertinence temporelle est marquée : le contenu retenu a en moyenne 280 jours, indiquant la nécessité d’une approche à long terme pour une visibilité réussie.

Une étude innovante menée par Minddex a analysé un total de 9 286 citations provenant de Reddit pour évaluer comment les modèles de langage (LLM) utilisent cette plateforme comme source d’information. Les résultats révèlent des tendances surprenantes qui remettent en question de nombreuses idées reçues concernant le GEO et la stratégie de contenu. Dans cet article, nous examinerons en détail les découvertes de cette recherche, notamment l’importance des discussions organiques, le rôle prépondérant des commentaires, ainsi que les implications pour les marques cherchant à accroître leur visibilité dans un monde de plus en plus dominé par l’IA.

Contexte de l’étude

Depuis l’émergence des moteurs de recherche génératifs, la manière dont les internautes accèdent à l’information a considérablement évolué. L’un des grands défis pour les marques aujourd’hui est d’obtenir une place dans les réponses fournies par les LLM, tels que ChatGPT ou Gemini. Reddit, avec sa structure axée sur la discussion et la communauté, s’est révélé être une plateforme clé, souvent perçue comme un reflet fidèle de l’opinion publique. Minddex a voulu explorer comment ces modèles d’IA interagissent avec le contenu de Reddit, allant au-delà des simples mentions et cherchant à comprendre les dynamiques sous-jacentes à l’utilisation de cette plateforme par les LLM.

L’infiltration contre la création de contenu

L’une des conclusions les plus frappantes de l’étude est que l’infiltration, c’est-à-dire le fait de participer à des conversations déjà existantes, s’avère plus efficace que de créer de nouveaux fils de discussion. En effet, l’analyse a révélé que 78 % des citations des LLM proviennent de discussions organiques, plutôt que de contenus initiaux publiés par les marques elles-mêmes. Au lieu de chercher à imposer leur voix, les marques devraient donc s’insérer dans les dialogues déjà en cours.

Cette renaissance du dialogue authentique sur Reddit, où les marques peuvent intervenir pour répondre à des questions ou enrichir une conversation, montre une nouvelle voie. Un modèle qui privilégie les interventions pertinentes et utiles s’avère beaucoup plus fructueux que de s’attacher à une stratégie de publication purement auto-promotive.

Importance des commentaires

Un autre point essentiel de l’étude réside dans le fait que les commentaires sont souvent plus précieux que les posts originaux. En effet, 62 % des extraits cités dans les réponses LLM proviennent de commentaires, dont la longueur varie généralement entre 150 et 400 caractères. Ces extraits se révèlent souvent plus capturants que le corps du post lui-même, indiquant l’importance de porter attention à la qualité des discussions au sein des commentaires plutôt qu’uniquement aux publications initiales.

Les upvotes ne garantissent pas la visibilité

La question des upvotes est également soulevée dans cette étude. Contrairement à ce que l’on pourrait penser, les LLM ne s’appuient pas uniquement sur les commentaires les mieux notés. En fait, 82 % des commentaires séléctionnés par les LLM ont reçu entre 1 et 5 upvotes. Cela nous apprend que la valeur des contributions ne provient pas nécessairement de leur popularité parmi les utilisateurs humains, mais plutôt de la capacité des LLM à lire et analyser l’intégralité d’un thread.

L’horizon pertinent de 6 à 24 mois

L’analyse a également mis en lumière la dynamique temporelle des citations. En moyenne, l’âge médian des contenus cités est de 280 jours, montrant que le contenu plus ancien est souvent privilégié lors des citations par les LLM. Les stratégies de contenu doivent donc prendre en compte cet horizon temporel de 6 à 24 mois, étant donné que le trafic généré par une activité menée aujourd’hui ne sera visible dans les rapports que dans un avenir proche.

Formats de contenu privilégiés par les LLM

Une autre découverte clé concerne les formats des posts sur Reddit qui attirent l’attention des LLM. Les résultats montrent que le format question-réponse a le vent en poupe, représentant 44,2 % des citations dans l’étude. D’autre part, les posts de discussion classique et d’autres formats tels que les listes ou les comparatifs suivent derrière. Cela souligne l’importance de structurer les contributions de manière à répondre directement à des questions précises, augmentant ainsi les chances d’être cité par les LLM.

La dynamique de réutilisation de contenu

Un aspect fondamental de l’article concerne la façon dont les LLM réutilisent le contenu de Reddit. L’étude a abouti à la conclusion que 80 % des citations sont des paraphrases plutôt que des reproductions textuelles directes. Cela souligne l’importance de rédiger du contenu qui soit conçu pour être paraphrasé, le tout en conservant une structure claire et une formulation adaptée à l’audience de Reddit. Les superlatifs de marque et les arguments purement marketing semblent se perdre dans ce processus.

Cartographie des subreddits pertinents

Pour une marque souhaitant renforcer sa visibilité sur Reddit, il est crucial d’identifier les subreddits les plus pertinents liés à son secteur. L’étude a révélé que le subreddit r/AskFrance est d’une importance capitale pour le marché francophone, avec 669 citations et représentant un véritable levier de visibilité pour les marques. En comprenant la structure des subreddits et leurs spécificités, les marques peuvent mieux cibler leurs interventions et maximiser leur impact.

Les implications pour les stratégies de visibilité

La mise en lumière des résultats de l’étude Minddex apporte de nouvelles considérations stratégiques pour les marques et les équipes marketing concernant leur présence sur Reddit. Les enseignements montrent qu’une approche fondée sur l’engagement dans les conversations existantes, l’optimisation des contributions à travers des commentaires clairs et succincts, et une attention portée à la qualité du contenu plutôt qu’à la quantité, sont des pistes à explorer.

Actions concrètes à mettre en place

Suite à l’analyse, Minddex propose plusieurs actions concrètes que les équipes SEO et marketing peuvent adopter pour mieux intégrer Reddit dans leur stratégie de contenu, telles que :

  • Identifier 5 à 10 threads existants par mois pour y intervenir, plutôt que de créer de nouveaux threads, facilitant ainsi une visibilité accrue.
  • Se concentrer sur les commentaires stratégiques plutôt que sur les posts principaux, en s’assurant que le contenu soit aligné avec les questions soulevées dans le thread.
  • Adopter une tonalité naturelle et communautaire pour établir une connexion authentique avec les utilisateurs de Reddit.
  • Prendre en compte un horizon temporel de 6 à 24 mois pour évaluer l’impact des contributions sur les réponses des LLM.
  • Cartographier les subreddits pertinents pour identifier les espaces de conversation clés avant de construire une stratégie de présence.

Les résultats de cette étude apportent un éclairage nouveau sur l’utilisation de Reddit comme source d’information par les modèles de langage. En mettant l’accent sur l’infiltration, l’importance des commentaires, ainsi que sur le format et la structure du contenu, les marques peuvent redéfinir leurs stratégies de visibilité en ligne.

reddit est une plateforme communautaire où les utilisateurs partagent des nouvelles, des discussions et des idées sur une variété de sujets.

Témoignages sur Reddit, source incontournable des modèles de langage : Analyse de 9 286 citations par Minddex

Une étude inédite conduite par Minddex sur 9 286 citations Reddit a révélé la manière dont les modèles d’intelligence artificielle (IA) se réfèrent à cette plateforme comme source d’information. Les résultats mettent en lumière des dynamiques surprenantes qui remettent en question de nombreuses idées préconçues sur le GEO et les stratégies de contenu.

Premièrement, il est important de noter que l’infiltration l’emporte sur la création de threads. En effet, 78 % des citations Reddit intégrées dans les réponses des modèles d’IA proviennent de discussions organiques, c’est-à-dire qu’elles ne sont pas générées par les marques elles-mêmes, mais plutôt par des contributions extérieures. Cette observation incite les acteurs de la communication à réfléchir à leur implication dans des conversations préexistantes plutôt qu’à l’élaboration de contenus isolés.

De plus, il est établi que les commentaires jouent un rôle prépondérant par rapport aux posts. L’étude indique que 62 % des extraits cités émanent de commentaires, souvent brefs. Cela souligne l’importance d’intervenir subtilement dans les discussions avec des réponses concises qui capturent l’essence de la question posée, au lieu de se concentrer uniquement sur la rédaction de posts élaborés.

Sur un autre point, les upvotes ne sont pas un filtre fiable pour les citations retenues par les modèles. Avançant à l’encontre de l’usage traditionnel de Reddit, 82 % des commentaires cités reçoivent entre 1 et 5 upvotes. Les modèles d’IA scrutent l’ensemble des fils de discussion, indépendamment du niveau de popularité des commentaires, conférant de ce fait une importance première à la qualité du contenu plutôt qu’à sa viralité.

Un aspect crucial à comprendre est que l’âge du contenu joue un rôle fondamental. L’âge médian du contenu cité dans l’étude est de 280 jours, ce qui signifie que les publications récentes ne sont pas nécessairement favorisées. Les équipes marketing doivent ainsi se projeter sur un horizon de 6 à 24 mois pour évaluer l’impact de leur stratégie sur Reddit dans le contexte des réponses générées par l’IA.

Enfin, Minddex a identifié que la majorité des citations sont des paraphrases. En effet, 80 % des citations correspondent à des reformulations, et seulement 0,2 % présentent une reproduction textuelle proche. Les marques doivent donc s’efforcer de créer un contenu qui soit clair et directement lié aux questionnements des utilisateurs, plutôt que de se perdre dans des formulations promotionnelles.

Dès lors, il apparaît essentiel pour les marques de cartographier les subreddits pertinents pour leur secteur, en mettant particulièrement l’accent sur ceux qui facilitent les échanges authentiques. Cette approche pragmatique permettra d’améliorer la visibilité dans les réponses des modèles d’IA, en bâtissant des interactions solides au sein de la communauté.