Un estudio de Ahrefs revela que solo el 50 % de las páginas rastreadas por ChatGPT son citadas en sus respuestas, a partir de un análisis de 1,4 millones de prompts y 25,5 millones de URLs. La investigación destaca que ChatGPT rastrea el doble de lo que cita, lo que implica que la optimización del contenido es crucial para mejorar la visibilidad. Las URLs con patrones de búsqueda tienen una alta tasa de citación del 88,46 %, mientras que Reddit, aunque es ampliamente rastreado, tiene una baja tasa de citación del 1,93 %. Además, se señala que la alineación semántica entre el título y la consulta del usuario influye significativamente en las citas. Para mejorar la presencia en IA generativa, se recomienda optimizar títulos y slugs de URLs y monitorizar menciones con herramientas como Brand Radar.
Un exhaustivo análisis que abarca 1,4 millones de prompts y más de 25,5 millones de URLs ha puesto de manifiesto los elementos que influyen en la visibilidad de las marcas dentro del ámbito de la inteligencia artificial generativa.
La búsqueda impulsada por IA se ha establecido como un nuevo canal crucial para que las marcas aumenten su visibilidad. La inclusión en las respuestas de modelos de lenguaje como ChatGPT se ha convertido en un campo estratégico para el marketing digital. Sin embargo, hasta ahora había escasa información empírica sobre lo que determina que una página sea citada o ignorada por estos sistemas.
Ahrefs, reconocida plataforma en marketing digital y SEO, ha divulgado los hallazgos de su investigación sobre la citación en ChatGPT. Este estudio revela que, de todas las páginas rastreadas por el modelo para generar respuestas, únicamente el 50 % es finalmente citada como fuente.
Principales conclusiones del análisis
1. ChatGPT rastrea el doble de lo que cita
Promediando, ChatGPT analiza cerca de 16,57 URLs que termina citando y 16,58 URLs que desestima por cada prompt procesado. Esto indica que, aunque el modelo examina una cantidad considerable de fuentes para cada respuesta, solo la mitad logra ser citada. Para las marcas, esto significa que ser rastreado no garantiza visibilidad; la optimización del contenido es esencial.
La herramienta Brand Radar de Ahrefs permite identificar qué páginas han sido utilizadas por ChatGPT para generar respuestas y cuáles han sido enlazadas.
2. Dominio de URLs tipo "búsqueda"
Las páginas con URLs que siguen un patrón de búsqueda (como aquellas generadas por motores internos o directorios) alcanzan una tasa de citación del 88,46 %. Este dato resalta la necesidad de que las marcas se posicionen adecuadamente en este grupo selecto para ser citadas por ChatGPT. Entre estas fuentes también se incluyen plataformas como Reddit y YouTube.
3. Reddit: gran volumen pero baja citación
Reddit representa el 67,8 % de todas las URLs no citadas en el estudio, a pesar de contar con 16,1 millones de registros. Su tasa de citación es apenas del 1,93 %. Este hallazgo demuestra que aunque ChatGPT consume grandes cantidades de contenido generado por usuarios, no siempre lo considera como fuente en sus respuestas.
4. Importancia de la alineación semántica
El estudio evalúa la similitud semántica entre el título de una página y el prompt del usuario. En las URLs citadas, esta similitud promedio es de 0,602 comparada con 0,484 en aquellas no citadas. Esta diferencia se amplía aún más al considerar consultas derivadas (fan-out queries), donde la similitud asciende a 0,656. En términos prácticos, las páginas cuyos títulos reflejan con precisión la intención del usuario tienen mayor probabilidad de ser citadas.
5. Influencia positiva de slugs legibles
Las URLs con slugs redactados en lenguaje natural —es decir, aquellas compuestas por palabras descriptivas— muestran una tasa de citación del 89,78 %, frente al 81,11 % correspondiente a URLs sin estructura legible. Esta diferencia subraya la relevancia del SEO técnico incluso en el contexto actual dominado por IA generativa.
A partir del análisis realizado se sugieren varias acciones concretas para mejorar la presencia en las respuestas generadas por ChatGPT:
Puedes acceder al informe completo aquí.
Acerca de Ahrefs
Ahrefs es una plataforma integral destinada a mantener cualquier marca visible tanto en buscadores como en entornos web e inteligencia artificial. Con presencia en más de 180 países, su suite ofrece herramientas para SEO, análisis web impulsado por IA, creación y gestión de contenido y redes sociales; todo respaldado por quince años acumulando datos y siendo uno de los rastreadores web más activos después de Google. Con un impresionante volumen de backlinks y keywords indexados, Ahrefs se erige como referencia esencial para marketers dentro del 44% empresas incluidas en Fortune 500.
| Descripción | Cifra |
|---|---|
| Total de prompts analizados | 1,4 millones |
| Total de URLs analizadas | 25,5 millones |
| Porcentaje de páginas citadas por ChatGPT | 50 % (de las rastreadas) |
| Tasa de citación de URLs tipo "búsqueda" | 88,46 % |
| Tasa de citación de Reddit | 1,93 % (67,8 % de URLs no citadas) |
| Similitud semántica media en URLs citadas | 0,602 |
| Tasa de citación para slugs legibles | 89,78 % (vs 81,11 % sin estructura legible) |
Solo el 50 % de las páginas rastreadas por ChatGPT son citadas como fuente en sus respuestas.
De media, ChatGPT extrae aproximadamente 16,57 URLs que termina citando y 16,58 URLs que descarta por cada prompt procesado.
Las URLs de tipo «búsqueda» alcanzan una tasa de citación del 88,46 %, lo que sugiere que las marcas deben posicionar su contenido para ser citadas por ChatGPT.
Reddit constituye el 67,8 % de todas las URLs no citadas en el estudio, con una tasa de citación de apenas el 1,93 %.
Las páginas cuyos títulos reflejan con precisión la intención de búsqueda del usuario tienen una probabilidad significativamente mayor de ser citadas.
Las URLs con slugs en lenguaje natural obtienen una tasa de citación del 89,78 %, lo que subraya la importancia del SEO técnico incluso en el contexto de la IA generativa.
Las marcas pueden optimizar su contenido para consultas fan-out, alinear títulos con la intención del usuario, estructurar URLs de forma legible y monitorizar su presencia en IA generativa.