O sentimento sobre a IA generativa está passando por uma correção de curso após os erros do Google e da Microsoft na implementação de LLMs.
Os editores agora estão lidando com as implicações no mundo real de uma ferramenta que pode cuspir resmas de textos em um piscar de olhos para usuários com muito pouca experiência em escrita. As preocupações aumentam com uma enxurrada de histórias escritas por IA de baixa qualidade que inundam as mesas de envio. Enquanto isso, outros estão fazendo perguntas sérias sobre onde a IA está obtendo os dados que está redirecionando.
Ponto problemático do editor
Peter Bale, da INMA, destaca que a preocupação dos editores é dupla quando se trata de LLMs integrados à pesquisa – atribuições e pesquisas sem clique.
Os editores estão indignados com a perspectiva de a IA generativa agregar conhecimento na web para criar respostas conversacionais que não citam de onde veio essa informação. Como aponta Bale, isto levanta algumas questões sérias sobre “direitos autorais, termos, precisão, bem como a grande questão do pagamento”.
Ao mesmo tempo, existe uma preocupação real de que a IA integrada à pesquisa exacerbe o problema das pesquisas sem clique. É aqui que o usuário obtém a resposta de um recurso da Pesquisa Google – como um snippet em destaque – sem precisar clicar em um resultado de pesquisa.
A Wired já relatou como o chatbot do Bing conseguiu espiar por trás do acesso pago do Wirecutter e fornecer acesso gratuito ao conteúdo. A Wired observou que os editores estavam avaliando “se deveriam contra-atacar a Microsoft”.
O tráfego gera receita. Sim, é mais complicado do que isso, mas não muito. Escolha um modelo de monetização e, no final das contas, ele funciona ou não, com base em quantas pessoas acessam seu site.
Há pouco mais de um ano escrevi sobre como o News Showcase foi a resposta do Google à pressão regulatória global para que ele e o Facebook pagassem para vincular a artigos de notícias.
O impulso na Europa fez com que o Google não apenas assinasse acordos de News Showcase com editores (que têm sido perseguidos por críticas sobre a falta de transparência), mas também lançou uma nova ferramenta de licenciamento automatizada chamada Extended News Previews (ENP) , que agora faz parte do Google Search Console.
No final, os editores podem acabar sentindo que precisam contra-atacar os LLMs integrados à pesquisa para proteger seu conteúdo de ser canibalizado. Ainda não se sabe se isso será por meio de lobby por mudanças regulatórias ou ações judiciais.
Dada a notória luta dos governos para se manterem a par das mudanças tecnológicas, não se surpreenda se demorar anos até vermos quaisquer mudanças regulamentares significativas nesta frente.
Paredes de IA
Com isso em mente, perguntei da State of Digital Publishing (SODP) , Mahendra Choudhary, como ele imaginava que os editores poderiam responder. Choudhary sugeriu que grandes editores de notícias – e em algum momento provedores de hospedagem/até mesmo ISPs – começariam a bloquear a varredura de seus sites por bots de IA.
Choudhary disse: “Ninguém quer que seu conteúdo seja reaproveitado gratuitamente pela IA. Mas os editores de notícias cobrarão dessas IAs para rastrear seus dados ou, em primeiro lugar, impedirão que elas rastreiem seus sites. Isso tornará os resultados da IA redundantes e frustrantes.”
Conteúdo de nossos parceiros
Ele ressaltou que o Google tem vários bots para cada segmento de resultados – pesquisa, notícias, imagens, etc. – e provavelmente está usando dados de todos esses bots para seu chatbot Bard AI. O ChatGPT, por sua vez, depende principalmente do CCBot .
Choudhary disse: “Eventualmente, todas as ferramentas de IA que verificam os dados terão que publicar abertamente os nomes de seus bots e o intervalo de IP que usam para verificar a web, semelhante ao que o Google e outros mecanismos de pesquisa fazem. Isso significa que os editores da web podem bloqueá-los se quiserem.”
Embora reconheça a probabilidade de as CTRs desses sites sofrerem uma espécie de queda no tráfego, ele argumentou que é improvável que isso cause grande impacto. Ele observou que após o lançamento de recursos que geraram pesquisas com zero cliques, “os editores ainda estavam ganhando cliques”.