You are currently viewing Faut-il empêcher le plugin ChatGPT d’accéder à votre site web ?

Faut-il empêcher le plugin ChatGPT d’accéder à votre site web ?

C’est LA question du moment dans le monde du SEO : doit-on bloquer le bot ChatGPT-User d’OpenAI avec un fichier robots.txt ? En bref : non. Voici pourquoi.

Le débat sur l’usage équitable du contenu web

Depuis le lancement de ChatGPT, la question de l’utilisation « équitable » du contenu des sites web pour la formation des IA – et si cela constitue du plagiat – agite les esprits.

Le débat s’est amplifié depuis qu’OpenAI a annoncé les plugins ChatGPT le 23 mars. L’un de ces plugins est un navigateur web officiel hébergé par ChatGPT, qui permettra à leurs modèles de lire des informations directement sur Internet.

Puisqu’on voit encore des publications et des tweets quotidiens prétendant le contraire, ça vaut le coup de le répéter :

L’instance actuelle de ChatGPT ne peut accéder à rien sur Internet.

Elle n’utilise pas de base de données et ne stocke pas le contenu des sites web comme le ferait un moteur de recherche dans un index.

Cela signifie que sans plugin, ChatGPT reste coincée en 2021, prédisant le mot suivant à partir de ses anciennes données d’entraînement.

Les plugins ChatGPT, une révolution à l’horizon

Même l’implémentation actuelle de Bing se contente (en simplifiant) d’extraire les mots-clés de votre requête, d’effectuer une recherche Bing, de récupérer les résultats qui apparaissent pour ce mot-clé et de demander à l’IA de « résumer » ces résultats.

Et c’est là que les plugins vont tout changer. Bientôt, ChatGPT pourra intégrer le contenu de sites web tiers pour que l’IA le résume ou le manipule, de la même manière que le fait Bing.

De nombreux plugins et outils tiers peuvent déjà extraire le contenu d’un site web, l’insérer dans une requête à l’API OpenAI et résumer ou manipuler ce texte. Cependant, avec un plugin officiel de navigateur web, cette utilisation est sur le point d’augmenter considérablement.

Bloquer le bot ChatGPT-User d’OpenAI : est-ce nécessaire ?

OpenAI nous a donné des détails sur leur bot, y compris comment le bloquer. Il est bon de noter qu’OpenAI se comportera comme n’importe quel autre bot, en suivant le protocole des robots. Il supposera qu’il peut accéder au contenu, sauf si on lui indique le contraire dans un fichier robots.txt.

OpenAI et ChatGPT ne parcourront pas le web comme un moteur de recherche. Et, pour autant que nous puissions en juger, ils n’utilisent pas encore ces données pour l’entraînement. Toutes les requêtes seront le résultat d’une demande directe d’un utilisateur.

Autre info intéressante : cela se fait en utilisant l’API de recherche Bing. Cela signifie probablement que si Bing ne peut pas voir le contenu de votre site web, ChatGPT ne le pourra pas non plus.

Alors, faut-il bloquer le bot OpenAI pour protéger nos sites web ?

Le débat sur les citations, le plagiat, les sources et les droits d’auteur fait rage depuis un moment et pourrait facilement prendre 20 000 mots pour être approfondi.

Ma réponse courte : non.

La plupart des sites web ne devraient pas empêcher les IA d’accéder à leur contenu. Explorons plus en détail pourquoi.

Adopter une approche attentiste

Nous ne devrions pas bloquer une nouvelle technologie tant que nous n’avons pas suffisamment de données pour prendre une décision éclairée.

Certes, il pourrait y avoir des problèmes de droits d’auteur, mais les plugins IA pourraient également devenir une nouvelle source de découverte et de trafic.

OpenAI dit qu’il citera les sources lorsque les plugins récupéreront des données de sites tiers. Cela signifie qu’il y aura certainement un potentiel pour obtenir des clics de ChatGPT si un utilisateur intègre votre contenu.

Bloquer l’accès signifie seulement que ChatGPT (ou votre utilisateur) citera le site web de quelqu’un d’autre.

Beaucoup de personnes ayant ce débat partent du postulat erroné que si les gens ne peuvent pas obtenir le contenu de ChatGPT, ils devront visiter le site web.

Je ne pense pas que ce soit vrai. En réalité, ils obtiendront le contenu de votre concurrent.

Étant donné le nombre de personnes qui utilisent ChatGPT pour créer du contenu de nos jours, il y a de fortes chances que si quelqu’un utilise l’outil pour extraire du contenu de votre site web, il pourrait vous mettre un lien là où il publie le résultat. Vous passerez à côté de cette opportunité si vous le bloquez.

Penser à long terme

Je me souviens d’avoir eu des conversations similaires à propos des applications iPhone et de l’App Store lorsqu’il est sorti en 2008.

L’App Store a changé l’interface des téléphones mobiles. Certes, on pouvait (et on peut toujours) faire la plupart des choses qu’une application permet avec un site web, mais l’App Store est devenu l’endroit où les gens cherchaient et découvraient des sites web.

L’IA aura un effet similaire sur l’interface utilisateur d’Internet.

Cela ne va pas tuer les moteurs de recherche.

Cependant, l’IA sera un nouveau point de départ pour de nombreux utilisateurs du web. Cela signifie que les plugins pourraient être votre seule opportunité pour atteindre ces utilisateurs.

Nous devons commencer à considérer l’IA comme un nouveau canal d’acquisition, tout comme nous le faisons avec les moteurs de recherche, les réseaux sociaux et les plates-formes de vente en ligne ou les app stores.

Le moment de commencer à réfléchir à votre stratégie d’IA et de plugins d’IA était la semaine dernière. La plupart des marketeurs sont déjà en retard, mais il n’est pas trop tard!

J’ai demandé à ChatGPT ce qu’il en pensait :


« Cet article aborde un sujet important et intéressant concernant l’impact potentiel de l’IA sur l’accès aux sites Web et la manière dont les propriétaires de sites pourraient aborder ces défis. Il soulève des points valables pour expliquer pourquoi bloquer l’accès de ChatGPT aux sites Web pourrait ne pas être la meilleure solution et suggère d’adopter une approche plus stratégique pour tirer parti de l’IA comme un nouveau canal d’acquisition. »

— ChatGPT

Laisser un commentaire