TENDENCIAS

Solo el 50% de las páginas rastreadas por ChatGPT son citadas en sus respuestas, revela estudio

Marketing digital e inteligencia artificial

Un nuevo estudio revela la complejidad detrás de la citación de fuentes en modelos de lenguaje como ChatGPT y su impacto en el marketing digital

Viernes 01 de mayo de 2026

Un estudio de Ahrefs revela que solo el 50 % de las páginas rastreadas por ChatGPT son citadas en sus respuestas, a partir de un análisis de 1,4 millones de prompts y 25,5 millones de URLs. La investigación destaca que ChatGPT rastrea el doble de lo que cita, lo que implica que la optimización del contenido es crucial para mejorar la visibilidad. Las URLs con patrones de búsqueda tienen una alta tasa de citación del 88,46 %, mientras que Reddit, aunque es ampliamente rastreado, tiene una baja tasa de citación del 1,93 %. Además, se señala que la alineación semántica entre el título y la consulta del usuario influye significativamente en las citas. Para mejorar la presencia en IA generativa, se recomienda optimizar títulos y slugs de URLs y monitorizar menciones con herramientas como Brand Radar.



Un exhaustivo análisis que abarca 1,4 millones de prompts y más de 25,5 millones de URLs ha puesto de manifiesto los elementos que influyen en la visibilidad de las marcas dentro del ámbito de la inteligencia artificial generativa.

La búsqueda impulsada por IA se ha establecido como un nuevo canal crucial para que las marcas aumenten su visibilidad. La inclusión en las respuestas de modelos de lenguaje como ChatGPT se ha convertido en un campo estratégico para el marketing digital. Sin embargo, hasta ahora había escasa información empírica sobre lo que determina que una página sea citada o ignorada por estos sistemas.

Resultados del estudio

Ahrefs, reconocida plataforma en marketing digital y SEO, ha divulgado los hallazgos de su investigación sobre la citación en ChatGPT. Este estudio revela que, de todas las páginas rastreadas por el modelo para generar respuestas, únicamente el 50 % es finalmente citada como fuente.

Principales conclusiones del análisis

1. ChatGPT rastrea el doble de lo que cita
Promediando, ChatGPT analiza cerca de 16,57 URLs que termina citando y 16,58 URLs que desestima por cada prompt procesado. Esto indica que, aunque el modelo examina una cantidad considerable de fuentes para cada respuesta, solo la mitad logra ser citada. Para las marcas, esto significa que ser rastreado no garantiza visibilidad; la optimización del contenido es esencial.

La herramienta Brand Radar de Ahrefs permite identificar qué páginas han sido utilizadas por ChatGPT para generar respuestas y cuáles han sido enlazadas.

Análisis detallado

2. Dominio de URLs tipo "búsqueda"
Las páginas con URLs que siguen un patrón de búsqueda (como aquellas generadas por motores internos o directorios) alcanzan una tasa de citación del 88,46 %. Este dato resalta la necesidad de que las marcas se posicionen adecuadamente en este grupo selecto para ser citadas por ChatGPT. Entre estas fuentes también se incluyen plataformas como Reddit y YouTube.

3. Reddit: gran volumen pero baja citación
Reddit representa el 67,8 % de todas las URLs no citadas en el estudio, a pesar de contar con 16,1 millones de registros. Su tasa de citación es apenas del 1,93 %. Este hallazgo demuestra que aunque ChatGPT consume grandes cantidades de contenido generado por usuarios, no siempre lo considera como fuente en sus respuestas.

4. Importancia de la alineación semántica
El estudio evalúa la similitud semántica entre el título de una página y el prompt del usuario. En las URLs citadas, esta similitud promedio es de 0,602 comparada con 0,484 en aquellas no citadas. Esta diferencia se amplía aún más al considerar consultas derivadas (fan-out queries), donde la similitud asciende a 0,656. En términos prácticos, las páginas cuyos títulos reflejan con precisión la intención del usuario tienen mayor probabilidad de ser citadas.

Estrategias recomendadas para marcas

5. Influencia positiva de slugs legibles
Las URLs con slugs redactados en lenguaje natural —es decir, aquellas compuestas por palabras descriptivas— muestran una tasa de citación del 89,78 %, frente al 81,11 % correspondiente a URLs sin estructura legible. Esta diferencia subraya la relevancia del SEO técnico incluso en el contexto actual dominado por IA generativa.

A partir del análisis realizado se sugieren varias acciones concretas para mejorar la presencia en las respuestas generadas por ChatGPT:

  • Optimizar contenido para consultas fan-out: Alinear contenido actualizado con subconsultas generadas para cada prompt; aquellas páginas que coincidan serán citadas mientras que las que no lo hagan serán ignoradas. Brand Radar incluye datos sobre consultas fan-out en su informe sobre ChatGPT.
  • Ajustar títulos a la intención del usuario: Alinear semánticamente los títulos con las consultas más frecuentes del público objetivo.
  • Estructurar URLs legibles: Utilizar slugs descriptivos y comprensibles para aumentar la probabilidad de ser citados.
  • Monitorear presencia en IA generativa: Herramientas como Brand Radar permiten rastrear cuándo y cómo una marca es mencionada por modelos AI, facilitando respuestas estratégicas oportunas.

Puedes acceder al informe completo aquí.

Acerca de Ahrefs
Ahrefs es una plataforma integral destinada a mantener cualquier marca visible tanto en buscadores como en entornos web e inteligencia artificial. Con presencia en más de 180 países, su suite ofrece herramientas para SEO, análisis web impulsado por IA, creación y gestión de contenido y redes sociales; todo respaldado por quince años acumulando datos y siendo uno de los rastreadores web más activos después de Google. Con un impresionante volumen de backlinks y keywords indexados, Ahrefs se erige como referencia esencial para marketers dentro del 44% empresas incluidas en Fortune 500.

La noticia en cifras

Descripción Cifra
Total de prompts analizados 1,4 millones
Total de URLs analizadas 25,5 millones
Porcentaje de páginas citadas por ChatGPT 50 % (de las rastreadas)
Tasa de citación de URLs tipo "búsqueda" 88,46 %
Tasa de citación de Reddit 1,93 % (67,8 % de URLs no citadas)
Similitud semántica media en URLs citadas 0,602
Tasa de citación para slugs legibles 89,78 % (vs 81,11 % sin estructura legible)

Preguntas sobre la noticia

¿Qué porcentaje de páginas rastreadas por ChatGPT son citadas en sus respuestas?

Solo el 50 % de las páginas rastreadas por ChatGPT son citadas como fuente en sus respuestas.

¿Cuántas URLs analiza ChatGPT por cada prompt?

De media, ChatGPT extrae aproximadamente 16,57 URLs que termina citando y 16,58 URLs que descarta por cada prompt procesado.

¿Qué tipo de URLs tienen una mayor tasa de citación?

Las URLs de tipo «búsqueda» alcanzan una tasa de citación del 88,46 %, lo que sugiere que las marcas deben posicionar su contenido para ser citadas por ChatGPT.

¿Cuál es la tasa de citación de Reddit según el estudio?

Reddit constituye el 67,8 % de todas las URLs no citadas en el estudio, con una tasa de citación de apenas el 1,93 %.

¿Cómo influye la alineación semántica entre título y consulta en la citación?

Las páginas cuyos títulos reflejan con precisión la intención de búsqueda del usuario tienen una probabilidad significativamente mayor de ser citadas.

¿Qué importancia tienen los slugs legibles en la visibilidad?

Las URLs con slugs en lenguaje natural obtienen una tasa de citación del 89,78 %, lo que subraya la importancia del SEO técnico incluso en el contexto de la IA generativa.

¿Qué acciones pueden tomar las marcas para mejorar su presencia en las respuestas de ChatGPT?

Las marcas pueden optimizar su contenido para consultas fan-out, alinear títulos con la intención del usuario, estructurar URLs de forma legible y monitorizar su presencia en IA generativa.

TEMAS RELACIONADOS:


Noticias relacionadas