5 tipos de contenido que Google no indexa y cómo lograr que lo haga

googlebot 2

Cuanto más contenido de valor crees y más relevante sea éste para tus usuarios, más posibilidades tendrás de que Google indexe la información de tu sitio web y, por consiguiente, de optimizar tu posicionamiento dentro del buscador.

Pero por muy bien que lo hagas, hay cierto tipo de contenido que Google, de momento (nunca se sabe con que nos va a sorprender), no indexa.

1.- Los archivos PDF encriptados o con password:

Los  pdfs encriptados o con acceso limitado mediante password son inaccesibles para los robots de indexación de Google o “Googlebots”.

La solución para que Google pueda indexar este contenido pasa por copiarlo y pegarlo de forma correcta en un editor de textos, de forma que los robots pueden acceder a él.

Lo mismo sucede con las imágenes que puedan estar incluidas en el pdf, no serán indexadas a no ser que tengan una página separada para ellas en html y, por supuesto, con un atributo descriptivo “Alt”.

 

2.- Los iframes:

La etiqueta <iframe> puede ser muy útil en determinadas ocasiones, ya que permite insertar un documento HTML dentro de otro documento HTML.

Un iframe puede considerarse como un agujero que se abre en una página web a través del cual se muestra otra página web. Es una de las maneras más populares de integrar contenido interactivo y multimedia dentro de un sitio web.

Su uso habitual es para mostrar publicidad o Webs de colaboración, introducir un contenido de Google Maps…

Pero no se considera parte de la página principal por lo que el contenido dentro de un iFrame no se indexará.

Una solución seria incluir dentro del iframe enlaces de texto que direccionen al contenido de la página de origen, de tal modo que al robot de Google le sea posible rastrear y luego indexar este contenido.

 

3.- Las etiquetas Meta Description duplicadas:

Google utiliza las metaetiquetas, primordialmente, para conocer la descripción y palabras clave de una página y es la información que puede mostrar junto con la URL en los resultados de búsqueda.

Si escribes muchas palabras clave duplicadas o si la misma metadescription aparece en más de una página, Google lo considerará contenido duplicado y no lo indexará.

Cada descripción debe ser única y relativa a la página a la cual hace mención.

Por ello, lo ideal es elaborar las metadescripciones para cada artículo, categoría y página principal.

 

4.- Vídeo:

El robot de Google no puede rastrear el contenido de los archivos de vídeo, por lo que es importante que proporciones información sobre los vídeos que incluyas.

Una solución es la creación de una transcripción del vídeo que quieras incluir, o bien proporcionar una descripción detallada del vídeo dentro de tu código HTML.

 

5.- Lo que está indicado en el archivo Robots:

Un archivo robots.txt es un archivo de texto que impide que un rastreador web como, por ejemplo, Googlebot, rastree páginas determinadas de tu sitio.

Este archivo solo es necesario si tu sitio incluye contenido que no deseas que ni Google ni otros motores de búsqueda indexen.

Para que Google indexe el sitio entero, no crees un archivo robots.txt, ni siquiera uno que esté vacío.

googlebot 1

 ¡Que no te pique la araña!

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *

Puedes usar las siguientes etiquetas y atributos HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>