Google é acusado de usar de conteúdo jornalístico em buscas e IA

(Folhapress) O Conselho Administrativo de Defesa Econômica (Cade) instaurou processo administrativo contra o Google pelo uso de conteúdo jornalístico em mecanismos de busca e inteligência artificial generativa.

Com voto unânime de cinco conselheiros, o órgão transformou um inquérito administrativo em processo administrativo, que pode resultar em sanções e medidas corretivas contra o Google. Procurada, a empresa preferiu não se pronunciar.

Segundo o voto do presidente interino Diogo Thomson, há fortes indícios de que o Google comete “abuso exploratório de posição dominante” ao raspar conteúdo jornalístico online (copiar usando robôs) para alimentar seus resultados de busca usando inteligência artificial. Isso sem oferecer uma opção para que os veículos de mídia se neguem a autorizar o uso do conteúdo (opt-out) sem que isso implique a exclusão dos veículos dos resultados de busca.

Abuso exploratório é a conduta pela qual uma empresa dominante se vale de sua posição de força para extrair, de consumidores ou parceiros comerciais, valor econômico em termos injustos ou desproporcionais.

No caso do Google, o Cade investigará se a empresa está abusando de sua posição dominante no mercado de buscas (mais de 90%) para se beneficiar de conteúdo jornalístico sem remunerar os veículos de imprensa, o que teria gerado queda no tráfego e na receita com anúncios. A situação teria se agravado com o uso do conteúdo jornalístico para modelos de IA generativa e resultados da busca que utilizam IA (AI Overviews).

O caso, aberto em 2018, começou investigando se o Google fazia “scraping” (raspagem) de conteúdo jornalístico. A plataforma estaria exibindo trechos de matérias de jornais sem direcionar os internautas aos sites dos veículos que as produziram. Mas o processo administrativo do órgão ampliou a investigação para incluir uso para IA.

“A decisão do Cade é um marco histórico para os produtores de conteúdo jornalístico, porque, pela primeira vez, se investigará a fundo no Brasil o abuso de poder ou dependência econômica digital”, diz Marcelo Rech, presidente da ANJ (Associação Nacional de Jornais), autora da petição inicial.

“Com o resultado do julgamento, o Cade demonstra que está na linha de frente de uma preocupação que não se limita a uma mera questão econômica. O tema de fundo é a sustentabilidade da informação de qualidade, do jornalismo que atende, sem substitutos, as comunidades locais e a pluralidade de visões fundamental em sociedades democráticas.”

O Cade avalia se há condutas exploratórias e exclusionárias por parte do Google. Como a plataforma apresenta trecho ou resumo dos conteúdos jornalísticos nas buscas, muitos usuários se satisfazem com esses resultados e não clicam nos sites dos veículos, o que reduz a audiência e, consequentemente, publicidade. Os veículos também acusavam o Google de privilegiar seu próprio conteúdo nos resultados de busca.

No voto de Thomson, são apresentados estudos indicando queda ainda mais pronunciada no tráfego dos sites jornalísticos com os resultados de IA de busca.

Em petição enviada ao Cade em março deste ano, o Google afirma que a queda de tráfego de veículos de notícias teria ocorrido anos antes da implementação do AI Overviews, que o tráfego distribuído pelo Google Discover teria compensado e até mesmo aumentado o anteriormente repassado e haveria outras razões para a diminuição de cliques em sites jornalísticos, como mudanças de comportamento dos usuários após a pandemia de Covid.

“O AIO (AI Overviews) funciona como uma inovação que aprimora a experiência do usuário, ao mesmo tempo em que continua a apoiar os fluxos de tráfego e as oportunidades de descoberta para os veículos em toda a open web”, disse a empresa na petição.

Stella Caram, diretora jurídica da Foxglove, organização que contribuiu com estudos e subsídios para o caso, afirma que “a decisão reflete o que reguladores na União Europeia e no Reino Unido já reconheceram: sinais claros da posição dominante abusiva do Google nos mercados digitais de notícias que justificam uma investigação”.

Em seu voto de 184 páginas, Thomson recomenda que o Google permita às empresas jornalísticas optar por não ter seus dados usados em IA e não serem excluídos dos resultados do Google, o que implica sérios prejuízos ao tráfego dos sites jornalísticos.

Também indica que uma possível medida corretiva seria os veículos jornalísticos poderem escolher se querem que seus dados sejam usados apenas para resultados de busca, para geração de conteúdo de IA ou outros.

Algumas empresas jornalísticas, entre elas a Folha, já fecharam acordos de licenciamento de conteúdo com o Google e outras empresas. O acordo da Folha com o Google prevê que o jornal disponibilize conteúdo jornalístico de qualidade para ajudar a gerar e melhorar as respostas dadas pelo Gemini, aplicativo de inteligência artificial da empresa de tecnologia.

Pelo acertado, consolidado em 2025, a Folha fornece acesso a parte de seu acervo de notícias e a um feed de textos em tempo real. O material serve como base de dados para a composição de resultados mais atualizados para os usuários da ferramenta.

Os dados da decisão do Cade e da conclusão do processo administrativo podem ser usados como precedente em negociações futuras e para veículos que ainda não têm acordos.

“A decisão de abrir um processo reposiciona as forças e abre um debate sobre quais são as garantias que o jornalismo deve ter nessa relação com motores de busca, especialmente quando aplicam soluções de IA generativa”, diz o advogado Francisco Brito Cruz, professor do IDP.

Os processos administrativos do Cade levam de 3 a 10 anos para serem concluídos.

No entanto, para a advogada Camila Pires da Rocha, sócia do Brolio Gonçalves Advogados, esse caso tende a tramitar mais rápido, “por causa da dinamicidade do mercado, diante dos avanços tecnológicos, e a ameaça iminente de prejuízo ao jornalismo”.

Clique aqui para acessar a Fonte da Notícia