¿Qué es el contenido duplicado?

Las técnicas de web scraping o duplicar contenido bien sea de tus competidores o de tu propia web puede jugarte una mala pasada y acabar llamando la atención de Google con una penalización por querer pasarte de listo. También existe la posibilidad de que ese contenido duplicado se haga de manera automatizada, para mostrarlo luego en páginas que contienen publicidad, consiguiendo con esta técnica los primeros puestos y asegurándose grandes beneficios publicitarios. Puede estar incluso por encima de la página que muestra el contenido original, confundiendo al buscador entre el contenido plagiado y el original.

¿Cómo evitar el contenido duplicado?

Cuando hablamos de contenido duplicado podemos hablar de diferentes formas de generar dicho contenido. La más frecuente se da por spammers que lo hacen de forma automática en diferentes dominios que han hackeado y cuyo dueño, en la mayoría de los casos, no tiene todavía ni la menor idea de que eso estaba sucediendo, también nuestra competencia puede usar este tipo de técnicas para perjudicarnos y a su vez obtener ella mejores resultados.

Esta forma de generar contenido duplicado se puede evitar con una serie de pasos:

  • Indexar el contenido justamente al publicarlo. Sabemos que Google tarda un tiempo en indexar páginas de forma automática, por lo que si le facilitamos un poco su trabajo, antes apareceremos en sus páginas. Si desde Google Search Console nos dirigimos al apartado de Explorar como Google, ponemos nuestra URL con el contenido nuevo y damos clic en obtener para ver los detalles, podemos comprobar que la página no tiene ningún tipo de error de tipo http o está siendo bloqueada por el robot, y podremos solicitar la indexación de esta. Así forzaremos a Google a la indexación de dicha página de forma instantánea.
  • Alertas de Google. Si creamos alertas en Google este podrá enviarnos una notificación cuando haya en internet una copia de la alerta que tu hayas creado.

Si hemos detectado contenido duplicado deberíamos primeramente ponernos en contacto con el responsable del sitio web, con el hosting del dominio que tiene el contenido duplicado e informar a Google a través de esta ayuda de dicho contenido.

Otra forma por la que podemos caer en un castigo de Google por contenido duplicado, pero menos usual, es que nosotros mismos dupliquemos nuestro contenido o bien en diferentes dominios o en un subdominio. Si haces esto creyendo que así vas a posicionar más páginas de tu web y en una posición mejor, permíteme decirte que vas a conseguir justo lo contrario. A estas alturas debemos saber que para Google el usuario es lo primero, y va a ofrecerle siempre lo mejor, posicionar varias páginas con el mismo contenido es como ofrecerle al usuario un único resultado, y eso es lo que Google quiere evitar, si nosotros queremos aparecer en Google también debemos hacerlo. El usuario busca diferentes resultados, Google le ofrecerá siempre resultados diferentes, nosotros debemos mostrarle a Google que nuestro sitio es original y contiene información de interés para el usuario.

¿Qué hacer cuando nos duplican el contenido? Caso práctico

Si descubrimos de pronto que nuestro sitio web ha sido duplicado al completo, cómo fue el caso que nos sucedió en el blog de javirodriguez.com, debemos actuar para evitar que esto pueda acarrearnos consecuencias desastrosas. Aunque debes saber que anteriormente los algoritmos de Google penalizaban el contenido duplicado, actualmente este suele ser ignorado por los robots, por lo que se puede convertir en un arma de doble filo (o bien no nos afecta, o incluso el dominio que está duplicando el contenido, puede obtener verse beneficiado). Así que, lo interprete como lo interprete Google, debemos solucionar esto para evitar problemas mayores.

Ante una situación así, tenemos varios consejos sobre cómo debemos actuar.

Empezemos viendo las acciones más lógicas a realizar:

  • Contactar con el webmaster que nos está duplicando contenido y comunicarle que ese contenido es tuyo, y que amablemente lo retire.

Esto es obvio, pero muchos webmasters cuando son comunicados de esta manera suelen aceptar y eliminar el contenido sin generar mayores problemas.

  • Enviar la página a Google para que la revise por contenido duplicado

Google cuenta con una función a  través de la cual podemos enviarles una URL en caso de que estén copiando nuestro contenido, por norma general no tardan mucho tiempo en actuar y finalmente, eliminan la URL duplicada si lo consideran realmente una duplicidad de contenido. Si no es el caso, deberemos tomar acción nosotros mismos.

  • En caso de que estén haciendo hotlinking sobre nuestras imagenes, podemos cambiar la imagen de las URLs enlazadas y poner otra clase de contenido (Indicando que el contenido no es original, que es de tu autoría por ejemplo) Recordemos que si Google no desindexa la web, el único que va a poder actuar va a ser el webmaster que nos está duplicando contenido, por lo tanto solo podemos “molestarlo” hasta que decida eliminarlo. Desde nuestro archivo .htaccess podemos evitar que nos hagan hotlinking con el siguiente código:

# evitar el hotlinking y mostrar otro contenido alternativo
<IfModule mod_rewrite.c>
RewriteEngine on
RewriteCond %{HTTP_REFERER} !^$
RewriteCond %{HTTP_REFERER} !^http://(www\.)?javirodriguez\.com/.*$ [NC] RewriteRule .*\.(gif|jpg)$ http://www.dominio.es/contenidoalternativo.jpg [R,NC,L] </ifModule>

Sustituye “javirodriguez” por tu dominio, y el nombre de la imagen de ejemplo por el nombre de tu imagen.

  • Si nos han hecho una copia completa de todos los archivos de nuestra web en un dominio extranjero (Mirroring) existe un truco muy sencillo que nos evitará mayores problemas. Al ser una copia de todos los archivos, incluye nuestro archivo de verificación de Google Search Console, solo debemos verificar la propiedad y desindexarla de Google.