Microsoft confirme que Reddit bloque la recherche Bing

Microsoft confirme que Reddit bloque la recherche Bing

Microsoft confirme que Reddit a bloqué Bing Search

Reddit

Reddit a mis à jour son fichier robots.txt, empêchant Bing et de nombreux autres moteurs de recherche de crawler le site. « Bing a cessé de crawler Reddit après qu’ils ont mis en place leur fichier robots.txt mis à jour le 1er juillet, qui interdit tout crawling de leur site », a déclaré un représentant de Microsoft à Search Engine Land.

Ce qui s’est passé

Le 1er juillet 2024, Reddit a modifié son fichier robots.txt pour empêcher plusieurs moteurs de recherche et outils d’IA d’explorer le site. Contrairement à ce que certains ont pu penser au début du mois, Google n’a pas été empêché d’explorer le site par cette mise à jour. Cependant, la plupart des autres crawlers ont été bloqués.

Ce matin-là, Mark Williams-Cook m’a informé que les résultats Reddit disparaissaient progressivement de l’index Bing Search. Ensuite, plusieurs médias ont commencé à couvrir cette nouvelle. J’ai voulu confirmer que les crawlers de Bing étaient effectivement bloqués car Reddit utilisait la détection IP pour montrer une version différente du fichier robots.txt aux moteurs de recherche et aux humains – comme je l’avais expliqué précédemment ce mois-ci.

En conséquence, Bing ne crawl plus les nouveaux contenus sur Reddit. C’est pourquoi lorsque vous filtrez les résultats Reddit dans Bing Search pour la dernière semaine, vous ne voyez rien.

Bing Index Last Week

Confirmation par Microsoft

« Microsoft respecte la norme robots.txt et nous honorons les directives fournies par les sites Web qui ne souhaitent pas que le contenu sur leurs pages soit utilisé avec nos modèles d’IA générative. Bing a cessé d’explorer Reddit après qu’ils aient implémenté leur fichier robots.txt mis à jour le 1er juillet. »

Déclaration officielle par Reddit

« Cela n’a aucun lien avec notre récent partenariat avec Google. Nous avons eu des discussions avec plusieurs moteurs de recherche mais nous n’avons pas pu parvenir à des accords avec tous car certains sont incapables ou réticents à faire des promesses exécutoires concernant l’utilisation du contenu redditien y compris son utilisation pour l’IA. » – Tim Rathschmidt, porte-parole chez Reddit

Pourquoi cela nous intéresse-t-il ?

Avec l’accord obtenu entre Google et Reddit concernant la licence du contenu AI, il semble que Reddit puisse jouer dur avec d’autres moteurs et outils AI en bloquant ainsi leur accès au contenu redditien.

Pendant ce temps-là, Google génère un trafic énorme vers Reddit ces jours-ci, incluant même des tests pour un traitement spécial dans ses résultats (comme mentionné ici : https://searchengineland.com/google-is-testing-special-snippet-treatment-for-reddit-search-results-440729).

On peut se demander si d’autres grands sites web pourraient suivre cette voie et quelles conséquences cela pourrait avoir sur les petits éditeurs et producteurs de contenus.

En attendant donc peu probable voir beaucoup nouveau contenu provenant Reddit apparaître prochainement sur Bing.

Panier
Retour en haut
Discuter
1
Besoin d'aide ?
Scan the code
Bonjour 👋

Bienvenue chez DIGITAL POWER | Votre Agence Web.
Comment pouvons-nous vous aider ?