Cómo hacer una Auditoría de Indexabilidad o indexación

En este artículo abordaremos todo lo que necesitas saber para realizar una auditoría de indexabilidad y cómo afecta el comportamiento de tus contenidos al momento de aparecer en los motores de búsqueda
Cómo hacer una auditoría de indexabilidad

Escrito por

Compartir

¿Te has preguntado por qué algunas páginas de tu web no aparecen en los resultados de búsqueda y otras si? o ¿Por qué no logras aparecer en los resultados de búsqueda?

La respuesta a esas preguntas puede estar en la indexación, una de las tres fases en la búsqueda de Google y quizás una de las más determinantes a la hora de lograr que tus contenidos se encuentren en los motores de búsqueda.

En este artículo podrás conocer algunas de las técnicas que aplico al momento de realizar una auditoría de indexabilidad y cuales son los errores más comunes que he encontrado en sitios web en Colombia.

Qué es indexación o indexabilidad

La indexación o indexabilidad en SEO se refiere al proceso mediante el cual los motores de búsqueda, (como Google, bing, yahoo, etc…) analizan y almacenan el contenido de un sitio web en su índice.

Cuando un motor de búsqueda indexa un sitio web, significa que ha recopilado información sobre el contenido de ese sitio, lo ha clasificado y lo ha agregado a su base de datos para poder mostrarlo en los resultados de búsqueda.

¿Por qué es importante una auditoría de indexabilidad?

Durante un proceso de auditoría de indexabilidad, se busca encontrar factores que ayuden a los motores de búsqueda a utilizar la información que tiene un sitio web para clasificarlo, por eso son importantes tanto los aspectos técnicos que permiten la indexación, como el contenido.

Algunos de los aspectos más importantes a evaluar con una auditoría de indexabilidad son:

  • Visibilidad en los motores de búsqueda: Esta auditoría busca determinar si tu página está bien indexada. Si no lo está, simplemente no aparece o aparece parcialmente en los resultados de búsqueda. Si no aparece en los resultados de búsqueda, perderás tráfico, clientes y ventas.
  • Optimización del rastreo o crawl budget: Los motores de búsqueda tienen un presupuesto limitado para rastrear sitios web. Si tu sitio no está bien estructurado o tienes información poco relevante, puede que los motores de búsqueda gasten demasiado tiempo rastreando páginas de poco valor y se pierdan las que realmente importan.
  • Identificación de problemas técnicos: Una auditoría de indexabilidad puede ayudarte a identificar problemas técnicos en tu sitio que estén impidiendo una correcta indexación e incluso una incorrecta rastreabilidad.

¿Cómo realizar una Auditoría de Indexabilidad?

Una auditoría de indexabilidad requiere de un poco de conocimiento de SEO técnico, la disciplina de SEO que se enfoca en mejorar su visibilidad y posicionamiento en los motores de búsqueda a través de los aspectos de desarrollo del sitio web.

Lo primero que debes saber es que, aunque hay herramientas que permiten realizar una auditoría de indexación automatizada, el analista SEO es quien determina si algunos de estos resultados ocurren como parte de una estrategia o como consecuencia de algún problema en particular.

Realizar una auditoría de indexabilidad es la primera parte del trabajo para identificar posibles errores en el proceso de indexación, sin embargo la rastreabilidad, tema del que hablamos en otro artículo, también podría afectar la manera en que estan llegando los contenidos a los motores de búsqueda.

Por el momento nos vamos a concentra entonces en la auditoría de indexabilidad, veamos que puntos son los que debemos evaluar para poder tener una correcta indexación de nuestro sitio web:

Revisión de la estructura del sitio

El primer paso en una auditoría de indexabilidad es revisar la estructura de tu sitio.

Con estructura nos referimos a la manera en que estar organizados los contenidos y si están correctamente diseñados para que los usuarios ingresen a cada uno de ellos durante su navegación en el sitio a través de enlaces, ya sea en el menú o en el mismo contenido.

Durante la auditoría de estructura lo primero que hace el especialista en SEO es determinar si el menú o las secciones de las páginas principales del sitio si llevan a los contenidos internos a través de enlaces que puedan ser rastreados por los motores de búsqueda, de esta manera aseguramos que Google pueda encontrar toda la información que tiene tu sitio web.

La estructura del sitio también puede y debe evaluarse desde la arquitectura del desarrollo, y si, acá ya ahondamos en cosas mucho más técnicas pero vamos a mantenerlo lo más simple posible.

Mientras la estructura del sitio nos habla de las secciones, categorías, subcategorías y páginas de contenido (taxonomía) y el enlazado entre ellas, la arquitectura de desarrollo nos indica cómo se están construyendo las urls del sitio, que información tienen y cómo se están presentando a los motores de búsqueda.

Errores comunes en la estructura del sitio que afectan la indexabilidad

Para auditar si tu sitio web tiene problemas en su estructura o arquitectura puedes evaluar los siguientes puntos:

  • URLs demasiado largas o complejas de entender.
  • URLs con jerarquía confusa o no pertenece a la navegación que hace el usuario.
  • URLs dinámicas, que cambian con tipos de contenidos.
  • Enlaces internos rotos, con redirecciones o inexistentes.
  • Contenidos basados en Javascript con problemas de renderizado de lado de servidor.
  • Sitios de una sola página conocidos como SPA.
  • Códigos de respuesta incorrectos.
  • No utilizar certificado de seguridad.

Uno de los errores más comunes en sitios web de Colombia es dejar que los CMS creen contenido irrelevante para el usuario debido a malas configuraciones.

Podrás evidenciar este tipo de contenido cuando se generan parámetros en la URL o cuando las urls no sean semánticas o describan lo que estás viendo. Normalmente esas URLs se reconocen porque empiezan por un signo de interrogación o tienen palabras extrañas como «index» o «home».

Análisis de la velocidad de carga

Los motores de búsqueda, especialmente Google, valoran la velocidad de carga de un sitio web como uno de los aspectos más importantes en la experiencia de usuario y para ello han establecido un sistema de calificación llamado Core Web Vitals.

Aunque tener una mala calificación en Core Web Vitals no va a hacer que desaparezcas de los resultados de búsqueda por si mismos, los contenidos con mejor calificación tienden a tener un mejor posicionamiento y una mejor indexabilidad que otros que no lo tienen.

Cada aspecto de Core Web Vitals representa una faceta distinta de la experiencia del usuario y para ello utiliza 3 métricas principales:

  • Largest Contentful Paint (LCP) : Mide el tiempo que se demora en cargar el contenido más extenso en una página, para tener una buena puntuación debe ocurrir 2,5 segundos desde que la página comienza a cargarse.
  • First Input Delay (FID): Mide el tiempo que se demora en cargar el contenido hasta estar listo para que el usuario interactue, para lograr la mejor puntuación la página debe ser interactiva en menos de 100 milisegundos.
  • Cumulative Layout Shift (CLS): Mide la manera en que se organizan los elementos de diseño en la página, si el diseño salta o los elementos cambian de lugar durante la carga del sitio. Para lograr una buena puntuación debe ser menor a menos de 0,1.

Métricas de core web vitals en una auditoría de indexabilidad

Ten en cuenta que cada calificación se asigna de manera individual a cada página de tu sitio web.

Como puedes ver solo 2 de los 3 elementos evaluados hablan de velocidad de carga medida en segundos o milisegundos pero, aunque el tercer elemento (Cumulative Layout Shift) habla de diseño, también afecta la velocidad de carga de manera indirecta.

Cuando hay un mal CLS el usuario debe esperar a que todos los elementos estén ordenados para poder interactuar con ellos y en ocasiones, que se muevan los elementos puede causarle frustración.

Si tu página tarda mucho en cargar o los aspectos evaluados en Web Vitals dan mala calificación, tu página podría ser penalizada en los resultados de búsqueda perdiendo su indexación.

 

Haz una auditoría de Core Web Vitals con Google Page Speed

Verificación de la existencia de mapas del sitio XML

Los mapas del sitio XML son una especie de «índice» de tu sitio web que los motores de búsqueda utilizan para rastrearlo más eficientemente. En el se incluyen las páginas que queremos que los motores de búsqueda indexen y dejamos por fuera las páginas que no son importantes para el usuario.

Para auditar el archivo del mapa del sitio puedes ingresar a tu dominio y agregar sitemap.xml, en el caso de este sitio sería: https://tudominio.com/sitemap.xml

Si cuentas con un CMS es posible que encuentres un archivo con un índice de varios sitemap, en este caso, las urls terminar en xml y debes ingresar a cada uno de ellos.

En cada sitemap podrás encontrar las páginas que quieres sean indexadas. Debes asegurarte de tener un mapa del sitio XML actualizado y correctamente configurado.

Asegúrate que el sitemap también este incluido en el archivo robots, un archivo que le permite saber a los motores de búsqueda que directorios o archivos debe rastrear para luego determinar su indexación.

Allí también debes verificar que tu sitio web no esté desautorizado para el rastreo a través de algún lineamiento Disallow.

Para verificarlo ingresa la dirección de tu sitio web de esta forma: https://tudominio.com/robots.txt , debes encontrar algo como:

User-agent: *
Allow: /

https://tudominio.com/sitemap_index.xml

El lineamiento Allow: / permite que todos los directorios sean rastreados, y tener el sitemap te asegura que los motores de búsqueda estan encontrando las páginas de tu sitio.

Revisión de las etiquetas meta y de los enlaces internos

Las etiquetas meta son bastante importantes en el proceso de indexación, de hecho, hay dos etiquetas que ayudan a los motores de búsqueda a entender la manera como tu sitio web debe ser indexado. A continuación revisaremos las dos más importantes.

Etiqueta meta Robots

La etiqueta meta robots es una meta etiqueta que se utiliza en la sección de encabezados del html de tu página, dentro del <head>. Sirve para indicarle a los motores de búsqueda si un contenido debe o no ser indexado bajo 2 lineamientos específicos.

  • Index: Permite que el contenido sea indexado. Si no existe la etiqueta es index por defecto.
  • Noindex: Bloquea la indexación y debe ser declarado por la etiqueta.

Para probar si la etiqueta robots esta bloqueando la indexación de tu sitio web puedes utilizar el inspeccionador de código de tu explorador para encontrar la siguiente etiqueta:

  • <meta name=»robots» content=»noindex»>

Si tu sitio web cuenta con la etiqueta anterior en los encabezados, habla con tu desarrollador web para que pueda quitarla de allí, esto permitirá en algunas semanas que tu sitio web sea indexado.

Etiqueta Canonical

La etiqueta canonical es una etiqueta bastante relevante desde hace algunos años, su función principal es evitar el contenido duplicado o de bajo valor en un sitio web. Esta etiqueta le indica los motores de búsqueda, cual es el contenido preferido de una página web para ser el principal.

Supongamos que tienes dos libros iguales en una biblioteca, A y B. El libro A es una edición normal de biblioteca, el libro B es una edición limitada con ilustraciones y referencias de autor que ayudan de mejor manera a quien lo lee.

En este ejemplo, cada que alguien quiera leer este libro (para nosotros una página de nuestro sitio), la bibliotecaria (el motor de búsqueda) querrá entregar el libro con mejor valor para el usuario.

La etiqueta canonical nos permite decirle a los motores de búsqueda que B es el contenido que queremos que indexe porque es más completo y relevante, y cuando encuentre el contenido A, le dice que es B el contenido principal y que por ese motivo no debe indexarlo.

¿Si tengo contenidos repetidos los puedo borrar y soluciono?

No, no todos los casos en los que se usa la etiqueta canonical es porque los contenidos estan repetidos por gusto del  desarrollador.

Puede ocurrir que en ocasiones tengamos artículos o contenidos que con el tiempo hayan sido actualizados, entonces, utilizamos la etiqueta canonical para decirle a los motores de búsqueda cual es el contenido más nuevo o el principal, pero, también hay casos en que se pueden generar URLs dinámicas de contenidos específicos debido a los lenguajes de programación o CMS utilizados.

Este es un caso muy común en los ecommerce dónde tenemos el mismo producto con variaciones de color en la URL. En este caso la etiqueta canónica debería existir sobre la página principal y no sobre las variaciones de color o talla. Ejemplo:

  • tuecommerce.com/hombre/camisas/hawaiana   (principal –  canónica)
  • tuecommerce.com/hombre/camisas/hawaiana?color=verde
  • tuecommerce.com/hombre/camisas/hawaiana?color=azul
  • tuecommerce.com/hombre/camisas/hawaiana?color=amarilla

En cada variación de color deberías encontrar una etiqueta canónica con la dirección de la URL principal.

Para revisar la etiqueta canónica de tus contenidos puedes inspeccionar el código y buscar la etiqueta dentro de los encabezados de tu página ubicados en la etiqueta <head>>

  • <link rel=«canonical» href=«aca-la-url-principal»>

En caso de que tu sitio web cuente con contenido sindicado, es decir, tu contenido se está mostrando en otros sitios web o en canales de distribución de contenido, estos deberían tener la etiqueta noindex. Según el centro de búsqueda de Google, la etiqueta canónica ya no es recomendada para el contenido sindicado y noindex es la única manera de evitar el contenido duplicado para tus artículos de blog o productos.

¿Cómo puedo saber si mi sitio web está bien indexado?

Hay varias maneras de saber si tu sitio está bien indexado o está apareciendo en los motores de búsqueda.

Debes tener en cuenta que aunque algunos contenidos puedan aparecer indexados, otros pueden estar teniendo problemas, entonces, trata de identificar que los contenidos más relevantes del sitio si están apareciendo en las búsquedas o en los informes de indexación de Google Search Console de la siguiente manera:

Utiliza Google Search Console

Si ya estás utilizando Google Search Console para monitorear el desempeño de tus contenidos en los motores de búsqueda podrás encontrar un informe sobre las páginas indexadas y no indexadas. En caso de que no lo estés usando, debes instalarlo para tu sitio y dejar que te de un informe sobre su estado.

Para ver el informe de indexación en Google Search Console sigue los siguientes pasos:

  1. Ingresa a tu propiedad en Google Search Console.
  2. Ve a «descripción general» en el menú izquierdo.
  3. Elige la opción «Indexación» y a continuación haz clic sobre «informe completo»
  4. en la gráfica podrás ver la cantidad de páginas indexadas vs las no indexadas.

En la parte inferior de la gráfica podrás encontrar un módulo llamado «¿porqué hay páginas que no se indexan?» revisa principalmente estos 3 aspectos:

  • No se ha encontrado (404): son las páginas qué los motores de búsqueda rastrearon y no encontró información sobre ellas en tu sitio.
  • Excluida por una etiqueta «noindex»: son las páginas que cuentan con una etiqueta noindex. Acá deben estar sólo las que no quieres que los usuarios encuentren, si encuentras tu página de inicio, productos o categorías importantes, debes tomar acción rápidamente.
  • Rastreada: actualmente sin indexar: Son páginas que Google ha rastreado, las encontró, pero no las indexó. Debes poner especial atención a estas páginas, si son de valor para tu negocio, debes identificar porque están sin indexar.

También puedes verificar si la url de tu contenido está obteniendo impresiones o clics, para ello debes seguir los siguientes pasos:

  1. Ingresa a tu propiedad en Google Search Console.
  2. Ve a «Rendimiento» en el menú izquierdo
  3. Selecciona la opción «Páginas» el la parte inferior de la gráfica.
  4. Busca la URL que quieres indexar.
  5. Analiza la gráfica

Si en la gráfica tiene impresiones y/o clics durante los últimos días, esta está indexada..

Utiliza comandos de búsqueda avanzados

Específicamente Google tiene unos comandos de búsqueda que te permiten saber si tu sitio web está indexado o no. El más importante para esta tarea es el comando site:

  • Comando site: Ingresa en tu explorador de Google tu sitio web anteponiendo la palabra «site:»  ejemplo:  site:https://seoenmedellin.com

Si después de realizar esta búsqueda los contenidos de tu sitio web aparecen listados en las SERPs, puedes estar seguro que tu contenido se está indexando.

Puede ocurrir que algunas de las páginas de tu sitio se indexen por algunos días, sin embargo, pueden desaparecer de los resultados de búsqueda rápidamente. Debes saber que, aunque le demos lineamientos de rastreabilidad o indexación a Google, sus bots puede llegar a ignorarlos por múltiples razones.

¿Con qué frecuencia debo realizar una auditoría de indexabilidad?

La frecuencia de las auditorías de indexabilidad puede variar dependiendo de varios factores:

  • Tamaño del sitio web
  • Frecuencia de cambios o actualización de contenido
  • Frecuencia de publicación de nuevos contenidos

Como regla general es una buena idea realizar una auditoría de indexabilidad al menos una cada 3 meses y estar corrigiendo los principales errores de indexación que arrojen las herramientas de monitoreo.

Conclusión

La «Auditoría de Indexabilidad» es un proceso esencial para garantizar que tu sitio web sea visible para los motores de búsqueda. Sin una correcta indexación, todo el esfuerzo que pones en crear contenido de calidad y en optimizar tu sitio para SEO puede ser en vano.

No aparecer en los motores de búsqueda puede afectar tu visibilidad en internet, afecta la cantidad de usuarios que llegan a tu sitio web y por consecuencia, las ventas.

Realiza una auditoría de indexabilidad regularmente, resuelve los problemas que encuentres y mantén tu sitio web en la mejor forma posible para los motores de búsqueda.

 

También puedes leer

Continua leyendo sobre SEO

logo-endupla-seo-growth-partners-medellin

¿Necesita una Agencia de SEO y posicionamiento en Medellín?

En Endupla contamos con un equipo de consultores SEO con más de 10 años de experiencia en posicionamiento web y estrategias de marketing digital. Aumentar tus ventas y atraer nuevos clientes por medio de una estrategia SEO si es posible.