¿Sabes cómo detectar contenido duplicado?

El contenido duplicado es uno de los factores fundamentales a la hora de trabajar el posicionamiento SEO de un sitio web, ya que la existencia del mismo influye negativamente y puede ser motivo de penalización por parte de Google. No olvidemos que Google “premia” el contenido original y de calidad que sea relevante para los usuarios.

Pero, ¿Qué se considera contenido duplicado?

Existen 2 tipos de contenido duplicado:

  • Contenido duplicado interno: El contenido duplicado interno se genera cuando hay varias páginas de nuestro sitio web que tienen el mismo contenido o cuando se puede acceder a una misma página de nuestra web a través de dos o más URLs. El caso más frecuente de contenido duplicado se produce en los ecommerce, ya que es muy habitual que haya productos de las mismas características en distintas páginas, sobre todo aquellos productos que presentan distintas referencias para simplemente cambios de color, de talla …, y cada una de estas referencias está asociada a una URL distinta.
  • Contenido duplicado externo: El contenido duplicado externo es el más perjudicial y penalizado por Google y entre las causas más comunes podemos destacar dos:
    • Cuando enviamos nuestro RSS a sitios de blogs o directorios para que publiquen un fragmento de algún post y así obtener mayor visibilidad y en lugar de copiar sólo un fragmento copian el post completo.
    • Cuando otros sitios web nos copian el contenido “descaradamente”, palabra por palabra. En este caso el problema está en que Google puede indexar antes el contenido copiado y no el nuestro, de forma que consideraría el primero como el original y el nuestro como el copiado 🙁 🙁 Por esto es muy importante enviar a Google nuestro contenido tan pronto como lo publiquemos, de esta forma nos aseguraremos de que nuestro contenido aparecerá siempre como el original y aquellos que nos lo copien serán los penalizados.

Pero, ¿Cómo podemos detectar el contenido duplicado?

contenido-duplicado-3

Disponemos de una serie de herramientas que nos permiten detectar tanto el contenido duplicado interno, como el externo.

Vamos a ver 3 de cada.

Detectando contenido duplicado interno:

1.- Siteliner

Es una herramienta online que analiza de forma gratuita hasta 250 páginas de un sitio web.

contenido-duplicado-7

No hace falta registro y nos proporciona un interesante análisis de nuestro contenido que incluye una relación de aquellas páginas con contenido duplicado

contenido-duplicado-9

Y un estudio comparativo con otros sites de variables como: tamaño medio de la página, tiempo medio de carga, número de palabras por página, número de links internos por página, …

contenido-duplicado-8

2.- Google Search Console

Google search Console nos informa de los meta title y meta descripciones que tenemos duplicadas en nuestro sitio web.

Para acceder a esta información tenemos que ir a la pestaña de Aspecto de la búsqueda y dentro de ella a “Mejoras de HTML”.

contenido-duplicado-10

También nos proporciona información acerca de que contenido del sitio no es indexable.

3.- Screamingfrog

Esta herramienta dispone de una versión gratuita que nos permite analizar hasta 500 URLs.

Se trata de una herramienta de escritorio que cuenta con versiones para Windows, Apple y Linux.

Entre sus funcionalidades, además de detectar contenido duplicado, nos permite obtener información sobre otro tipo de errores en nuestro sitio web como, por ejemplo, la existencia de enlaces rotos, generar el archivo Sitemap XML que luego podemos enviar a Google …

contenido-duplicado-11

Detectando contenido duplicado externo:

1.- Copyscape

Se trata de una herramienta que rastrea la red en busca de contenido duplicado.

La versión gratuita de la herramienta nos permite realizar hasta diez búsquedas diarias.

Basta con que insertemos la url que queremos comprobar y la herramienta se encargará de buscar y mostrarnos los resultados de aquellos sitios web que pueden estar copiando contenido de nuestro sitio.

contenido-duplicado-12

2.- Plagium

Se trata de otra herramienta gratuita que nos ofrece la posibilidad de analizar, sin registro previo, cualquier texto que tengamos en nuestra web de hasta 5.000 caracteres y ver si está siendo utilizado en otro sitio web.

Previo registro podemos analizar también una URL o un texto en formatos Word o PDF.

La herramienta nos proporciona también un plugin para wordpress que nos puede ayudar a no “utilizar” contenido de otros 🙂 🙂

contenido-duplicado-13

3.- Plagiarisma

También gratuita, si nos registramos podemos utilizarla sin límite. El registro lo podemos hacer también a través de nuestra cuenta de Facebook, Twitter, Google + o Linkedin.

Permite detectar contenido duplicado bien a partir de un texto, de una URL o de un archivo.

Los rastreos los lleva a cabo en los buscadores de Google, Bing o Yahoo! y en más de 190 idiomas.

contenido-duplicado-14

A partir de aquí, si detectas que te han “copiado” contenido, lo mejor es dialogar y pedirle al “copión” que lo retire.

Si esto no surte efecto, siempre podemos pedirle a Google que haga una revisión.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *