Contenido Duplicado

En primer lugar, recapitulando, os hablaba de que en el Google Webmaster Tools me aparecían más de 800 páginas de contenido duplicado, pero curiosamente, cada una de las referencias aparecían dos veces. Ésto era debido a que Google interpretaba como páginas distintas las que terminaban en barra lateral o trailing slash ("/") y las que no lo hacían.

Por ejemplo:

  • http://bocabit.com/publicidad/
  • http://bocabit.com/publicidad

Para arreglar este problema de contenido duplicado -en principio- tenemos 3 opciones.

Editar archivo .htaccess

La primera de todas es poner el siguiente código en el archivo .htaccess del directorio en el que tenemos instalado nuestro blog. Dependiendo de si utilzamos el "www" para acceder a nuestro blog o no, deberemos elegir una u otra versión:

Si utilizamos "www":

Options +Indexes
Options +FollowSymLinks
RewriteEngine on
RewriteCond %{HTTP_HOST} ^myblog\.com
RewriteRule ^(.*)$ http://www.myblog.com/$1 [R=permanent,L]

RewriteBase /
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_URI} !(.*)/$
RewriteRule ^(.*)$ http://www.myblog.com/$1/ [L,R=301]

Si NO utilizamos "www":

Options +Indexes
Options +FollowSymLinks
RewriteEngine on
RewriteCond ${HTTP_HOST} .
RewriteCond %{HTTP_HOST} !^tudominio\.com
RewriteRule (.*) http://tudominio.com/$1 [L,R=301]

RewriteBase /
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_URI} !(.*)/$
RewriteRule (.*) http://tudominio.com/$1/ [L,R=301]

Vía | Adseok

Si después de introducir el código, no podemos acceder a nuestro blog, posiblemente sea que algún cambio hemos hecho mal o que hay algo que no es compatible con el servidor, por lo que en ese caso recomiendo probar con las siguientes opciones.

Redirección 301 con PHP

La segunda opción consiste en añadir una redirección 301 (Permanently Moved) en la parte superior de la página header.php de nuestra plantilla o template (Arriba del todo). Mediante esta redirección, estaremos comprobando que se accede de la manera que queremos a la página (en este caso queremos que aparezca un "/" al final de la URL) y redireccionaremos a la correcta automáticamente.

El código es el siguiente:

<?php
$queryString = $_SERVER['QUERY_STRING'];
if(!$queryString){
    $requestUri = $_SERVER['REQUEST_URI'];
    $uriArr = explode('#', $requestUri);
    $requestUriFragment = $uriArr[1];
    $requestUriBase = $uriArr[0];
    $uriArr = explode('?', $requestUriBase);
    $requestUriBase = $uriArr[0];
    if ( substr($requestUriBase, strlen($requestUriBase) -1, 1) != '/' ) {
         $canonicalUrl = 'http://'.$_SERVER['SERVER_NAME'];
       $canonicalUrl .= $requestUriBase .'/'
      @header('HTTP/1.1 301 Moved Permanently', TRUE, 301);
      @header('Location:'.$canonicalUrl);
        exit;
    }
}
//include(”pagefunctions.php”);
?>

Vía | Big Bucks Blogger

Plugins de Wordpress

Existen varios plugins de Wordpress para solucionar el problema de las URL's duplicadas, aunque únicamente voy a nombrar uno, por el simple hecho de que todos (en teoría) realizan la misma función de la misma manera. Se llama Permalink Redirect, y sirve para obligar al servidor a servir páginas que acaben en "/".

Conclusiones

Hay que tener en cuenta que Google Webmaster Tools no es un sistema infalible, y mucho menos rápido, por lo que los cambios que hagamos no los veremos hasta pasadas unas semanas o incluso unos meses, pero es realmente útil para conocer las precariedades de nuestras páginas.

Yo, de hecho, sigo arrastrando problemas de contenido duplicado de cuando tenía instalado el plugin Global Translator, ya que éste generaba muchísima basura si no se tenía la opción llamada "Prevent Google Ban" activada (¡Cuidado con los plugins!).