Indexación de contenidos paginados  Google cambia las reglas – http://www.humanlevel.com/articulos/indexacion-de-contenidos-paginados-google-cambia-las-reglas.html obligada lectura si eres #seo”

14 Noviembre 2011 – Fernando Maciá Páginas de un libro.

Google ha anunciado recientemente cambios y nuevas funcionalidades para mejorar la forma en que indexa una serie de contenidos distribuidos a lo largo de una serie de páginas en un sitio Web.

La presentación de contenidos en una serie de distintas páginas se produce con frecuencia en los sitios Web ante la imposibilidad de presentar toda la información en una única página: por ejemplo en largos artí­culos que se subdividen en varias páginas o, más frencuentemente, en listados de productos.

Hasta ahora, esta situación planteaba numerosos retos ante la dificultad de incluir titles y metas description únicos para cada una de las páginas de la serie, además de la distribución de la popularidad en cada una de las páginas. Muy habitualmente, Google sólo indexaba la primera o primeras páginas de la serie, lo que impedí­a que pudiera acceder, por ejemplo, a fichas de producto desde los enlaces de las últimas páginas de la serie.

 

Soluciones aplicadas hasta ahora

Una de las formas en que desde las consultoras de posicionamiento en buscadores habí­amos atacado esta situación consistí­a en incluir una meta ROBOTS con la instrucción “NOINDEX, FOLLOW” en la sección <head> a partir de la segunda página de la serie. Con la meta ROBOTS configurada de esta manera, lo que tratábamos de conseguir era:

  1. Que Google indexara la primera página de la serie y que fuera esta la que mostrara en sus resultados para las búsquedas pertinentes.
  2. Que Google no viera las siguientes páginas de la serie –habitualmente con el mismo title y meta description que la primera– como contenido duplicado de la primera. Al incluir “NOINDEX”, estas páginas no deberí­an indexarse.
  3. Que Google siguiera los enlaces en cada una de las páginas de la serie hacia las páginas detalle de fichas de producto. Al incluir “FOLLOW”, estos enlaces deberí­an ser seguidos por Google para indexar dichas páginas.

Una segunda forma consistí­a en incluir un rel=”canonical” apuntando a la primera página en cada una de las páginas de la serie para que Google indexara exclusivamente la primera como resultado para toda la serie.

Soluciones a aplicar a partir de ahora

Ninguna de estas dos soluciones, por razones obvias, era óptima. Por lo que Google ha propuesto dos nuevas alternativas para solventar esta situación:

    1. Crear una página única con todo el contenido de la serie, enlazada con un enlace del tipo “Ver todo” en la primera página de la serie. En opinión del buscador, esta página es la que puede resultar en la mejor experiencia del usuario, salvo cuando el tiempo de carga o algún otro problema impida que se pueda presentar todo el contenido en una única página o haga esta presentación muy poco usable. En caso de poder implementar esta solución, entonces Google recomienda añadir rel=canonical en todas y cada una de las páginas de la serie apuntando a la URL con la versión de “Ver todo”. (Hacer click sobre la imagen para verla a tamaño completo)

Google pagination con rel=canonical

Human Level Communications recomienda implementar esta solución en los casos de contenidos tales como artí­culos periodí­sticos, reportajes o pequeños listados repartidos en unas pocas páginas.

  1. Especificar la relación entre las distintas páginas de una serie añadiendo rel=”next” y rel=”prev” en la sección <head> de las páginas correspondientes.

Es decir, si tenemos una serie de páginas cuyas URL son del tipo:

http://www.sudominio.com/productos?tipo=abc&page=1

http://www.sudominio.com/productos?tipo=abc&page=2

http://www.sudominio.com/productos?tipo=abc&page=3

http://www.sudominio.com/productos?tipo=abc&page=4

En la primera página, http://www.sudominio.com/productos?tipo=abc&page=1, incluiremos dentro de la sección <head> lo siguiente:

<link rel=”next” href=”http://www.sudominio.com/productos?tipo=abc&page=2″ />

En este caso, no incluimos ninguna referencia anterior con rel=”prev” porque se trata de la primera página de la serie.

En la segunda página, http://www.sudominio.com/productos?tipo=abc&page=2, incluiremos dentro de la sección <head> lo siguiente:

<link rel=”prev” href=”http://www.sudominio.com/productos?tipo=abc&page=1″ />

<link rel=”next” href=”http://www.sudominio.com/productos?tipo=abc&page=3″ />

Es decir, la referencia tanto a la página anterior a la 2, como la página siguiente.

En la tercera página, http://www.sudominio.com/productos?tipo=abc&page=3, incluiremos dentro de la sección <head> lo siguiente:

<link rel=”prev” href=”http://www.sudominio.com/productos?tipo=abc&page=2″ />

<link rel=”next” href=”http://www.sudominio.com/productos?tipo=abc&page=4″ />

Es decir, la referencia tanto a la página anterior a la 3 –página 2– como la página siguiente –página 4.

En la página 4, que es la última, http://www.sudominio.com/productos?tipo=abc&page=4, incluiremos dentro de la sección <head> lo siguiente:

<link rel=”prev” href=”http://www.sudominio.com/productos?tipo=abc&page=3″ />

En este caso, no incluimos ninguna referencia anterior con rel=”next” porque se trata de la última página de la serie (hacer click sobre la imagen para verla a tamaño completo).

Google: paginación con rel="next" y rel="prev"

Human Level Communications recomienda implementar esta solución en los casos de largos listados de productos, listados de hoteles, restaurantes, etc. que ocupan muchas páginas.

Recapitulando:

  • La primera página de la serie sólo incluye rel=”next” y no rel=”prev”.
  • La última página de la serie sólo incluye rel=”prev” y no rel=”next”.
  • Las páginas segunda a penúltima de la serie incluyen tanto rel=”prev” como rel=”next”.
  • Las URL especificadas para rel=”prev” y rel=”next” pueden ser tanto absolutas como relativas. Nosotros recomendamos, para el caso en que el contenido pueda ser plagiado, que los enlaces se especifiquen de forma absoluta. Así­ seguirán apuntando a nuestras páginas salvo que el plagiador los edite especí­ficamente. Si existe un enlace <base> en la página, las URL relativas se resuelven de acuerdo con la URL base especificada por esta etiqueta.
  • rel=”next” y rel=”prev” sólo se declaran en la sección <head> y NO en los enlaces de la sección <body> de la página.
  • rel=”next” y rel=”prev” son independientes de rel=”canonical” y, en algunos casos, pueden funcionar juntos sin problemas, por ejemplo, para eliminar la indexación de URL con parámetros de sesión.
  • De momento, rel=”next” y rel=prev” son pistas para Google, y no directivas absolutas.
  • Si no se especifican, Google seguirá rastreando la serie de páginas como hasta ahora, intentando identificar la relación entre ellas y escogiendo en cada caso la más relevante como resultado.
  • ATENCIí“N: si la primera página de la serie es accesible a través de dos URL distintas, por ejemplo, como primera página de listado sin parámetro de paginación –http://www.sudominio.com/productos?tipo=abc– y como primera página de listado desde el resto de páginas incluyendo parámetro de paginación –http://www.sudominio.com/productos?tipo=abc&page=1–, debemos incluir un rel=”canonical” especificando la URL que queremos indexar para evitar contenido duplicado: <link rel=”canonical” href=”http://www.sudominio.com/productos?tipo=abc” />

Leave a Reply