SEO en WordPress: Cómo indexar archivos

Anteriormente comenté que existen meta etiquetas con unas directivas para indicar a los motores de búsqueda que páginas indexar o cómo tratarlas. En el caso de indexar archivos (o no) o contenido no-(X)HTML, las meta etiquetas directivas de robots no sirven.

A un archivo, como un pdf, no puedes añadirle meta etiquetas ni tampoco a documentos de Word, Excel, archivos de texto o cualquier otro contenido no basado en (X)HTML. La solución a este problema sería empleando etiquetas X-robots (x-Robots-Tag) en las cabeceras HTTP.

Los parámetros permitidos

Las etiquetas X-robots emplean los mismos parámetros que las meta etiquetas robots. Por ejemplo:

  • index – Indexa la página
  • noindex – No indexa la página
  • follow – Seguir los vínculos de la página
  • nosnippet – No mostrar descripción o vínculos cacheados
  • nofllow- No seguir los links de la página
  • noarchive – No cachear la página
  • none – No hagas nada, ignora la página
  • all – Haz lo que quieras, comportamiento por defecto

Todas estas directivas en las meta etiquetas hacen posible controlar exactamente el comportamiento de los motores de búsqueda en tus páginas con contenido (X)HTML. Y de la misma forma sucede con la cabecera X-Robots, es posible extender el control del SEO sobre cualquier otro tipo de contenido cómo PDFs, documentos de word, flash, audio, video…

Cómo implementar X-Robots-Tag

Pueden implementarse de 2 maneras. Una de las formas es si se da el caso de que el archivo (PDF, video, audio…) se genera en una página de contenido dinámico como PHP. En ese caso basta con introducir el siguiente código en la parte más alta del documento

De esta forma hacemos que los archivos sean indexados y cacheados por el motor de búsqueda.

La otra manera sería en caso de archivos no-PHP (u otra página de contenido dinámico) como los documentos de word, videos PDF etc. En ese caso habría que cambiar las cabeceras vía .htaccess. Para cambiar el .htaccess debes ir a la ráiz de tu hosting/servidor. Si se diera el caso de no tenerlo siempre puedes crearlo.

Para aplicar las cabeceras X-Robots basta con añadir el siguiente código en tu .htaccess

De esta manera todos los archivos con extensión doc, pdf y swf se les establecerá un cabecera X-Robots con el cuál el motor de búsqueda los indexará y cacheará.

Y hasta lo referido a indexar archivos, espero que os sea de utilidad. A seguir picando 🙂