Google usa classificadores para barrar spam de IA em massa

Existe um problema que qualquer sistema de moderação encontra quando o adversário usa IA para criar spam: cada peça de conteúdo gerada é tecnicamente única. Metadados diferentes, assinatura digital diferente, pixels diferentes, mas o mesmo golpe ou a mesma desinformação, repetidos dezenas de milhares de vezes.

É exatamente esse cenário que levou pesquisadores do Google a mudar a pergunta central da moderação. Em vez de “esse conteúdo é spam?”, o sistema passou a perguntar: “esse grupo de contas está operando como uma rede coordenada de spam?”

O resultado é o S-CTS (Scalable Cluster Termination System), um sistema publicado pelo Google Research em 2026. Poucos dias depois do paper vir a público, o Google lançou o Spam Update de junho de 2026, encerrado em 26 de junho. Os dois acontecimentos não têm conexão confirmada pela empresa, mas a proximidade de timing é difícil de ignorar. O que mudou, afinal, e o que isso significa para quem trabalha com SEO?

O que o Google apresentou

O paper completo se chama Scalable Detection of Adversarial Synthetic Slop and Coordinated Media Abuse: A LoRA-Enabled Multimodal Defense System, com quatro pesquisadores assinando: Birant Orten, Claire Liu, Kelvin Tan e Yifei Liu.

O termo AI slop, que o documento usa sem cerimônia, é a expressão que o mercado anglófono adotou para descrever conteúdo gerado em volume por IA, sem valor editorial, criado para encher plataformas com spam ou desinformação. Em português, ainda não existe um equivalente consolidado; alguns falam em “conteúdo sintético em escala”, mas o termo em inglês já circula bastante por aqui.

Antes de ir para os detalhes técnicos, vale deixar o escopo claro: o S-CTS foi construído para plataformas de vídeo online (o paper usa a sigla OVP, de online video platform), com características típicas de YouTube: ritmo de upload de canal, sinais de áudio e imagem combinados, análise de comportamento de conta ao longo do tempo. Não há menção no documento a aplicação direta na busca orgânica de texto. Esse detalhe importa, e voltamos a ele mais adiante.

Como os classificadores identificam clusters de spam

O S-CTS opera com dois classificadores de machine learning trabalhando em conjunto. Um analisa contas, o outro analisa conteúdo.

O primeiro, Coordinated Bot-Net Detector, é o detector de redes de bots. Ele lê sinais de infraestrutura (a forma como as contas interagem com os sistemas do Google por baixo dos panos) e séries temporais de comportamento. Com isso, o sistema consegue identificar com alta confiança quando um conjunto de contas está sendo operado pela mesma pessoa ou pelo mesmo script automatizado. O paper chama esses grupos de Generation Clusters: aglomerados de contas que compartilham a mesma origem.

O segundo classificador, Synthetic Pattern Classifier, avalia o conteúdo propriamente. Ele usa embeddings de texto (representações matemáticas de palavras e frases que capturam semântica, não só palavras exatas) para detectar narrativas roteirizadas e repetitivas. No lado visual, são aplicadas técnicas de extração de características para identificar artefatos típicos de produção gerada por IA.

A decisão de punir um cluster só acontece quando os dois sinais aparecem juntos: comportamento coordenado entre contas e presença expressiva de conteúdo sintético. Isso é o que torna o sistema mais preciso do que abordagens que analisam uma peça de conteúdo isolada ou uma conta isolada: duas estratégias que os operadores de spam já sabem contornar há tempos.

O papel dos LLMs nessa arquitetura

A camada mais recente do sistema é o que o paper chama de Synthetic Content Rater, e é aqui que os modelos de linguagem (os LLMs, na sigla em inglês, que funcionam basicamente como cérebros de linguagem treinados em enormes volumes de texto) entram no fluxo de decisão.

Em vez de analisar vídeo pixel por pixel ou texto palavra por palavra, o sistema primeiro compila um resumo textual compacto: sinais multimodais (imagem, áudio, texto do conteúdo) mais sinais comportamentais (como o ritmo de publicação do canal). Esse resumo vai para um modelo de linguagem que faz a análise semântica final e devolve uma pontuação de sinteticidade.

Para viabilizar isso em escala, o Google usa duas técnicas de otimização. A LoRA (Low-Rank Adaptation) é um método que permite especializar um modelo de IA grande sem retreiná-lo do zero, reduzindo o custo computacional de forma expressiva. A APO (Automatic Prompt Optimization) ajusta rapidamente os comandos enviados ao modelo conforme surgem novas tendências de spam. Na prática, o Google consegue atualizar sua capacidade de detecção para um novo modelo de geração de conteúdo sem precisar de meses de treinamento, o que é relevante num ambiente onde modelos de IA novos aparecem o tempo todo.

Os números operacionais que o paper divulga: em seis meses de operação, o S-CTS terminou 50 mil clusters e encerrou 130 mil canais de spam sintético. A automação por LLM economizou cerca de 83 horas de revisão humana e reduziu em 50% a necessidade de moderação manual.

O que muda para quem trabalha com conteúdo

A primeira coisa que vale esclarecer é que isso não é uma ação direta contra SEO textual ou contra quem usa IA como ferramenta editorial. O escopo declarado é vídeo, e o critério de punição é coordenação em massa, não o uso de IA em si.

Esse ponto é relevante porque existe uma leitura apressada que circula sempre que o Google publica algo sobre detecção de conteúdo sintético.

O sistema não foi desenhado para penalizar quem usa ChatGPT ou Gemini para apoiar a produção. Ele foi desenhado para identificar redes que criam variações do mesmo golpe ou esquema em volume industrial, usando IA para driblar sistemas de detecção baseados em hash, que comparam a “assinatura digital” de arquivos e são enganados quando cada versão é ligeiramente diferente.

O critério central é o comportamento coordenado em escala. Um site que publica conteúdo com apoio de IA, com revisão editorial e perspectiva própria, está fora do perfil que o S-CTS foi desenhado para capturar. Já mostramos o impacto da ofensiva do Google contra o conteúdo automatizado no tráfego orgânico, e o padrão que leva a punição lá é o mesmo que emerge aqui: volume sem curadoria, não uso de ferramenta.

Sites legítimos que usam IA ficam no fogo cruzado?

Essa é a tensão que o próprio Google admite no paper. Os pesquisadores chamam o risco de drift de definição, a possibilidade de o sistema acabar interpretando como spam criadores legítimos que usam IA de forma criativa e não coordenada.

A salvaguarda do S-CTS é justamente exigir comportamento coordenado e em massa como condição para terminar um cluster. Um site ou canal individual, mesmo que use IA intensamente, não se enquadra no padrão que o sistema foi treinado para reconhecer como ameaça.

O que o paper não resolve (e que o próprio Google reconhece) é a zona cinzenta das operações de médio porte: grandes o suficiente para ter algum padrão detectável, pequenas o suficiente para não disparar os alertas mais óbvios. Esse é o espaço onde a imprecisão do sistema é maior, e onde, no contexto da busca orgânica de texto, a linha entre produção editorial e spam de escala ainda não é tão nítida quanto no vídeo.

Limitações e o que o sistema ainda não resolve

O paper é honesto sobre o que ainda não funciona bem, e essa parte costuma sumir nas coberturas mais rápidas do tema.

O dado mais sensível está nos números de precisão por categoria. Enquanto a maioria das decisões automáticas do S-CTS fica entre 88% e 95% de precisão, a categoria de conteúdo envolvendo segurança infantil (na decisão de aprovação automática) registrou 72%. Uma queda expressiva justamente na vertical mais crítica do sistema.

Outro ponto é o déficit de dados de treinamento para os modelos generativos mais recentes. A LoRA e a APO permitem adaptação rápida, mas os próprios autores admitem que a eficácia para detectar conteúdo gerado pelos modelos mais novos ainda não foi totalmente validada. Isso cria uma janela de vulnerabilidade para quem está sempre usando a última geração de ferramentas de geração.

O risco de viés também está na lista de limitações declaradas. Como a LoRA faz um ajuste fino leve sobre um modelo-base muito maior, ela pode preservar distorções já presentes nesse modelo, exigindo monitoramento contínuo, mas o paper não detalha o mecanismo de mitigação além de sinalizá-lo como necessário.

E há uma limitação estrutural que pesquisadores independentes levantaram na cobertura do paper: o S-CTS depende de comportamento coordenado para agir. Um ator malicioso suficientemente paciente, que distribua o volume de publicação ao longo do tempo e entre contas menos relacionadas entre si, fica abaixo do limiar de detecção por mais tempo. A sofisticação dos atacantes tende a acompanhar a sofisticação dos sistemas de defesa.

O Spam Update de junho chega na sequência

Poucos dias depois da publicação do paper, o Google anunciou o Spam Update de junho de 2026. O rollout começou em 24 de junho e foi concluído em 26 de junho, um dos mais rápidos do ano, comparável ao update de março de 2026 que encerrou em menos de 20 horas.

A atualização se aplica globalmente e em todos os idiomas. O foco declarado pelo Google é o aprimoramento do SpamBrain, o sistema de prevenção a spam baseado em IA que opera de forma contínua na busca. Já detalhamos aqui as novidades do Spam Update de junho e o que elas significam para a operação de SEO.

O Google não confirmou conexão direta entre o S-CTS e o Spam Update. São sistemas e contextos diferentes: o S-CTS é pesquisa aplicada em plataformas de vídeo, o SpamBrain opera na busca orgânica. Mas ambos apontam na mesma direção: o Google está usando mais IA para combater spam de IA, em múltiplas frentes ao mesmo tempo. E o timing entre os dois anúncios reforça que isso não é movimento isolado.

Para a operação do dia a dia: spam updates não anunciam mudanças de política. As regras continuam as mesmas; o que muda é a capacidade dos sistemas de identificar quem as viola. Se houve variação de tráfego no período de 24 a 26 de junho, essa janela é o primeiro ponto a verificar no Search Console.

O que fica no radar daqui para frente

O movimento mais importante aqui não é o S-CTS em si, é a lógica por trás dele. Em vez de avaliar se uma peça de conteúdo é boa ou ruim de forma isolada, o sistema pergunta se há um padrão coordenado de abuso. Isso muda o tipo de sinal que importa monitorar.

A camada de análise textual do S-CTS (embeddings semânticos, detecção de narrativas repetitivas, identificação de templates) é tecnicamente aplicável a conteúdo de texto, não só a vídeo. O Google não confirmou planos de implementação na busca orgânica, mas a infraestrutura existe e é transferível. Quem quiser entender como os modelos de linguagem já leem e interpretam o conteúdo da web tem uma boa base de partida neste artigo do blog.

Para a estratégia prática, o critério que emerge do paper é simples: voz editorial própria, diversidade de abordagem e comportamento orgânico de publicação são os sinais que separam uso criativo de IA do tipo de operação que esses sistemas foram desenhados para encontrar. Não é coincidência que o Google venha reforçando esse tipo de sinal em múltiplas frentes, do SpamBrain ao novo guia técnico de SEO lançado depois do Google Marketing Live 2026.

O jogo de detecção de spam de IA vai se tornar mais sofisticado nos próximos meses. A melhor posição para quem está construindo audiência orgânica de forma consistente é a de sempre: conteúdo com perspectiva real, estrutura técnica limpa e canais de aquisição diversificados.

Quer entender como construir presença orgânica num ambiente onde IA detecta IA e os critérios de qualidade ficam cada vez mais ligados a padrão de comportamento? Conheça os programas e mentorias da EducaSEO, especialmente o programa ao vivo de GEO, feito por quem está no centro desse debate.

Referências

Google Research. Scalable Detection of Adversarial Synthetic Slop and Coordinated Media Abuse: A LoRA-Enabled Multimodal Defense System. Disponível em: https://research.google/pubs/scalable-detection-of-adversarial-synthetic-slop-and-coordinated-media-abuse-a-lora-enabled-multimodal-defense-system/
Search Engine Journal. Roger Montti. Google Research Shows How AI Spam Can Be Detected. Disponível em: https://www.searchenginejournal.com/google-generated-ai-detected/579987/
Search Engine Land. Barry Schwartz. Google releases June 2026 spam update. Disponível em: https://searchengineland.com/google-releases-june-2026-spam-update-481002
Search Engine Journal. Matt G. Southern. Google Finishes Rolling Out The June 2026 Spam Update. Disponível em: https://www.searchenginejournal.com/google-begins-rolling-out-the-june-2026-spam-update/580424/
SEO Happy Hour. Karine Sales. Google lança sistema de defesa contra conteúdo de IA gerado em massa. Disponível em: https://www.seohappyhour.com/noticias/google-sistema-combate-conteudo-ia-s-cts/

Google Trends agora compara períodos direto no gráfico: veja o que muda na prática

Estratégia GEO multiplataforma: como preparar seu conteúdo para ser citado por ChatGPT, Gemini, Claude e Perplexity

Google lança sistema de classificadores para identificar e punir conteúdo de IA produzido em escala

O que o Google apresentou

Como os classificadores identificam clusters de spam

O papel dos LLMs nessa arquitetura

O que muda para quem trabalha com conteúdo

Sites legítimos que usam IA ficam no fogo cruzado?

Limitações e o que o sistema ainda não resolve

O Spam Update de junho chega na sequência

O que fica no radar daqui para frente

Referências

Todas as notícias

Google Trends agora compara períodos direto no gráfico: veja o que muda na prática

CRO com IA: como o cruzamento de dados está elevando a conversão no e-commerce

Estratégia GEO multiplataforma: como preparar seu conteúdo para ser citado por ChatGPT, Gemini, Claude e Perplexity

Menções pagas em GEO: quando a corrida por visibilidade nas IAs vira manipulação

Google lança sistema de classificadores para identificar e punir conteúdo de IA produzido em escala

Produção de conteúdo SEO: o que realmente sustenta um ranking

O Google quer ditar as regras da própria IA nos Estados Unidos, mas Reino Unido e Brasil seguem outro caminho

Google encerra o FAQ rich result na Busca, mas o schema FAQPage continua valendo a pena (inclusive para a IA)

Estudo da Ahrefs mostra que tráfego de IA generativa dispara e Google cai abaixo de 27%

As novidades do spam update do Google e os reflexos para quem trabalha com SEO

Como o Google transforma autores e publishers em entidades de busca

O Google terá que abrir a caixa-preta: Reino Unido exige critérios de ranqueamento claros e objetivos

O Bing avança nas métricas de GEO com novos relatórios de inteligência artificial

O novo guia oficial do Google reconfigura as prioridades técnicas após o Google Marketing Live 2026

Como fazer sua empresa ser recomendada pelo Google Gemini

Como os modelos de linguagem (LLMs) leem e indexam o conteúdo da web?

EducaSEO abre inscrições para programa ao vivo de GEO com especialistas de peso

O Google Lighthouse agora audita seu site para agentes de IA: o que muda na prática

Copywriter SEO: escreva para ranquear, engajar e converter

Na contramão do Google: DuckDuckGo lança versão que rejeita respostas por IA

O avanço do ChatGPT para 900 milhões de usuários semanais e a nova era da busca fragmentada

O Google vai punir domínios que manipulam o botão voltar: saiba como proteger seu site

Claude cresce 750% no Brasil: avanço global de 386% reforça fragmentação nas buscas por inteligência artificial

O impacto da nova ofensiva do Google contra o conteúdo automatizado no tráfego orgânico

Corrida das IAs no Brasil: ChatGPT ainda reina, mas Gemini dispara e Claude cresce 750%

Instagram Plus: conheça o novo plano premium da rede

Google testa AI Mode no Chrome: o que muda no SEO

Novas ferramentas da Semrush medem visibilidade em IA

Google Search Profiles: Guia para construir autoridade na Busca

Busca de imagens com IA no Bing: o que muda para SEO e GEO?

JavaScript e SEO: como funciona?

Search Console expande o relatório de IA generativa e adiciona controle de exclusão

Qual a importância do relacionamento em um negócio?

Rastreabilidade Avançada SEO

Google Search Console: principais funções e como usar na sua estratégia de SEO

Ecossistema educacional mais avançado de marketing orgânico do Brasil