Problemas de indexación más comunes

Es realmente doloroso comprobar cómo una página que tienes posicionada con alta visibilidad en el buscador, desaparece de repente. En este tema, vamos a ver los casos comunes de problemas de indexación del contenido para identificar aquellos motivos por los que nuestra página no se muestra en la SERP del buscador.

Configuración del archivo Robots.txt

El archivo Robots.txt nos ayuda a indicarle a los rastreadores que visitan nuestra página dónde pueden y no pueden entrar. Qué contenido indexar y cuál no. Deberías asegurarte de que tu archivo robots.txt está bien configurado para evitar que los buscadores eliminen contenido esencial de tu página en sus resultados.

Desde la consola de Google, puedes comprobar el contenido bloqueado por Google a través de la versión del archivo robots.txt que está cargando.probador de robots

Configuración del servidor (.htaccess)

La mayoría de servidores de alojamiento usan la tecnología Linux y manejan desde apache las redirecciones y reescrituras de las URL dinámicas. Debes asegurarte de que tu servidor está bien configurado y no incluye redirecciones con varios saltos (de una a otra URL), redirecciones de páginas que queremos mantener, etc.

Tu contenido ha sido baneado o eliminado por Spam

Directamente relacionado con el punto 8 de este tema. Google bloquea el contenido de páginas web que hacen spam. Puedes hacer spam sin tener conocimiento de ello si tu página web ha sido hackeada.

La URL no se encuentra (error 404)

Este es un problema habitual en sitios web que son migrados de un servidor a otro, o bien cuando se publica una nueva página web que no mantiene la misma nomenclatura de las URL que lo contienen. La consola de Google te ayudará a identificar las URL no encontradas para darle solución.

Carga de la página

Vamos a hablar de este asunto en reiteradas ocasiones. La carga de la página es un factor fundamental  a la hora de indexar el contenido y, en consecuencia, el posicionamiento SEO de la página.

velocidad de carga

Tiempos de carga que se recogen en los informes de Google Analytics.

Rel=Canonical mal configurada

La etiqueta “rel=canonical” te ayuda a marcar el contenido original de tu sitio web. En ocasiones, al usar CMS como WordPress y plugins como Yoast SEO, puedes configurar por error como canonical una url que no lo es, la consecuencia es que la página original es eliminada.

Contenido irrelevante

La calidad marca la pauta. Es el comienzo de todo. Si publicas contenido irrelevante o duplicado en tu web, es probable que no sea indexado.

Tu web ha sido hackeada

Este va a ser el más común de los problemas de indexación. Sobre todo si usas un CMS y no lo tienes actualizado. Los hackers elaboran scripts para acceder a tu sitio web, cambiar tu archivo .htaccess, robots.txt, etc. con el objetivo de perjudicar tu sitio web, incluso obtener beneficios por ello.

¿Sabes cómo se configura una URL canonical? Aprende a configurar URLs canonical. Regístrate gratis