A premissa parecia simples: se ChatGPT, Claude ou Google AI recomendam marcas, alguém precisa medir quem aparece mais e em que posição. Afinal, foi assim que construímos toda a indústria de SEO nos últimos 25 anos. Rastreie a posição, otimize até subir, repita. O problema é que inteligência artificial generativa não funciona assim. E agora temos números que provam.

Um estudo conduzido por Rand Fishkin, CEO da SparkToro, e Patrick O’Donnell, CTO da Gumshoe.ai, testou algo que parecia óbvio mas ninguém tinha medido com rigor: o quanto as respostas de IA são consistentes quando pedimos recomendações de marcas ou produtos.

Seiscentos voluntários fizeram o mesmo conjunto de 12 perguntas idênticas para ChatGPT, Claude e Google AI quase 3.000 vezes. Cada resposta foi normalizada em uma lista ordenada de marcas. Depois compararam: quantas vezes a mesma lista apareceu? As chances de obter a mesma lista duas vezes ficaram abaixo de 1 em 100. As chances de obter a mesma lista na mesma ordem caíram para algo próximo de 1 em 1.000. Se você não gostou da resposta que recebeu, a solução mais eficaz, segundo os dados, é simplesmente perguntar de novo.

Por que isso não é um bug e sim a arquitetura do sistema

Essa volatilidade não é falha. Modelos de linguagem são motores de probabilidade, construídos para gerar variação, não para retornar um conjunto estável e ordenado de resultados. Tratá-los como se fossem os links azuis do Google é um erro categórico que produz métricas inúteis e decisões estratégicas equivocadas.

Dentro desse contexto, porém, algo inesperado emergiu dos dados: enquanto as posições desmoronavam sob escrutínio, a frequência com que certas marcas apareciam se mostrou surpreendentemente consistente. Algumas marcas foram citadas repetidamente em dezenas de execuções diferentes, mesmo que sua posição variasse sem padrão. Em determinados nichos, como prestadores de serviços regionais ou ferramentas B2B específicas, nomes concretos surgiram em 60% a 90% das respostas para uma mesma intenção. Presença repetida significa algo real. Posição exata não significa nada.

O tamanho do mercado determina a estabilidade dos resultados

Esse achado ganha mais peso quando o estudo cruzou volatilidade com tamanho de mercado. Quanto menor o nicho, mais estáveis as respostas. Em espaços apertados, os resultados de IA se agruparam em torno de poucos nomes. Em categorias massivas, como agências criativas ou romances, os resultados se dispersaram em caos quase total. Mais opções disponíveis no mercado criam mais aleatoriedade nas respostas.

A implicação prática é direta: empresas em nichos específicos têm vantagem estrutural em visibilidade para IAs. Competir em mercados saturados exige uma estratégia baseada não em “estar sempre em primeiro”, mas em aparecer com frequência suficiente ao longo de múltiplas interações para que a presença se torne estatisticamente relevante.

Prompts caóticos, intenções reconhecíveis

O estudo também testou prompts reais escritos por humanos, e o resultado foi uma bagunça semântica: quase nenhum prompt se parecia com outro, mesmo quando as pessoas queriam exatamente a mesma coisa. A surpresa foi que, apesar de frases completamente diferentes, as IAs ainda retornaram conjuntos de marcas semelhantes para a mesma intenção subjacente. Para recomendações de fones de ouvido, centenas de prompts únicos ainda trouxeram os mesmos grandes nomes na maioria das vezes. Quando a intenção mudava para gaming ou cancelamento de ruído, o conjunto de marcas mudava junto.

Isso reforça a tese central do GEO: o que os sistemas avaliam não é a palavra-chave exata, é o cluster de intenção. As pessoas não fazem perguntas padronizadas, fazem perguntas humanas, cheias de imprecisão e contexto pessoal. A IA interpreta através dessa variação. Mas só eleva marcas cujos sinais são fortes o suficiente para sobreviver à tradução semântica.

A métrica que substitui a posição

Partindo desse princípio, o que a pesquisa propõe no lugar do rank tracking é rastrear com que frequência uma marca aparece em muitos prompts diferentes, executados muitas vezes. Isso exige escala, repetição e a compreensão clara de que o que se está medindo são tendências probabilísticas, não rankings determinísticos. É menos limpo do que um número de posição. É mais honesto do que uma ficção bem formatada.

Os próprios autores apontam lacunas que o estudo não fecha: quantas execuções são necessárias para tornar os números de frequência confiáveis? As chamadas via API se comportam como usuários reais? Quantos prompts distintos representam com precisão um mercado inteiro? Essas perguntas ficam abertas. Mas a direção está traçada. Qualquer produto vendendo rastreamento de posição em respostas de IA está vendendo algo que os dados contradizem.

A mudança que o estudo exige não é só de ferramenta, é de pergunta. Em vez de “em que posição estamos?”, a pergunta passa a ser “em que porcentagem das conversas relevantes somos mencionados?”. Essa distinção reorganiza toda a lógica de medição, e com ela, a lógica de otimização.

Perguntas e respostas

  • Quem são Rand Fishkin e Patrick O’Donnell no contexto deste estudo?
    • Rand Fishkin é CEO da SparkToro, empresa de pesquisa de audiência, e um dos analistas mais citados do setor de marketing digital. Patrick O’Donnell é CTO da Gumshoe.ai, plataforma focada em visibilidade de marcas em IA. O estudo foi desenvolvido com metodologia aberta e dados de 600 voluntários.
  • Por que posição em respostas de IA é estatisticamente sem sentido?
    • Porque a mesma pergunta, feita nas mesmas condições, gera listas diferentes em quase 99% das repetições. Com esse nível de volatilidade, mover de quarta para segunda posição em uma resposta não representa nenhuma mudança real, apenas variação aleatória do sistema.
  • O que é visibilidade probabilística e como medi-la na prática?
    • É a frequência com que uma marca aparece em um conjunto amplo e repetido de prompts relacionados a uma mesma intenção. Para medir, é preciso rodar dezenas ou centenas de variações do mesmo tipo de pergunta e calcular em que porcentagem das respostas a marca foi mencionada, independentemente da posição.
  • Por que nichos menores têm resultados mais estáveis em IAs?
    • Porque com menos opções disponíveis no mercado, há menos candidatos para preencher uma lista de recomendação. A IA tem menos de onde escolher e tende a convergir nos mesmos nomes. Em mercados saturados, a aleatoriedade aumenta proporcionalmente ao número de alternativas.
  • O que significa otimizar para cluster de intenção em vez de palavra-chave?
    • Significa garantir que sua marca esteja associada ao conjunto de contextos, problemas, casos de uso e perfis de usuário que cercam uma intenção, não a uma frase específica. Uma empresa de software de projetos não otimiza para “software de gestão de projetos”, mas para as múltiplas formas como diferentes pessoas expressam a necessidade de organizar trabalho remoto, controlar prazos ou centralizar comunicação de equipe.
Uma corrente tecnológica futurista com elos translúcidos azuis e luzes internas rosa, representando dados e conexões digitais em um fundo escuro.
Link building em 2026: a era dos relacionamentos chegou e as velhas táticas morreramSEO

Link building em 2026: a era dos relacionamentos chegou e as velhas táticas morreram

Julia de AlmeidaJulia de Almeida26/04/2026
Um smartphone branco exibe uma floresta exuberante com árvores que parecem sair da tela, mostrando o texto "UMIQ" em um ambiente claro com sombras.
Como estruturar seu ecossistema digital para máxima encontrabilidadeAI SearchSEO

Como estruturar seu ecossistema digital para máxima encontrabilidade

Julia de AlmeidaJulia de Almeida26/04/2026
O logo do Google Ads, com um ícone colorido e o texto "Google Ads", está em um círculo branco centralizado sobre um fundo laranja e amarelo.
Google Ads remove Display e Vídeo do Planner: o que muda?Plataformas

Google Ads remove Display e Vídeo do Planner: o que muda?

Julia de AlmeidaJulia de Almeida26/04/2026

Deixe uma resposta