Imagen FeedTodos los COMO | COMO aprender a besar mejor (dar besos)

Cómo hacer un robots.txt para Wordpress (actualizado)

por The-RockeR el 12 Agosto, 2007

A raíz de este artículo de Sigt, se me ha ocurrido hablar sobre cómo debería ser un robots.txt para un blog de Wordpress, analizando un poco cómo son los de algunos de los blogs de más éxito que leo asiduamente.

Al crear un archivo robots.txt, estamos indicando a los diferentes bots de los buscadores qué archivos o rutas deben seguir e indexar y cuales no. Por ejemplo, si tenermos una carpeta con información privada sobre nosotros, y no nos interesa que se pueda acceder a ella por medio de buscadores, debemos desabilitarla ("Disallow") en el archivo robots.txt, ya que por defecto los buscadores recorren todo el sitio. En Wordpress, por ejemplo, las carpetas wp-admin o wp-includes sólo contienen información sobre el panel de administración y el funcionamiento interno del CMS, por lo que podrían estar perfectamente "desabilitadas" para la indexación, como tienen hecho en AlexSeo de la siguiente manera:

Disallow: /wp-admin/
Disallow: /wp-includes/

En Sigt van un paso más allá, y llegan a la conclusión de que todos los archivos o carpetas que empiecen por "wp-", el problema de ésto es que haciéndolo así estás vetando también la entrada a wp-content, que podría contener elementos que queremos que sean indexados, como por ejemplo las imágenes. Para ello tenemos que permitir ("Allow") la indexación de los archivos de un determinado tipo de ciertas carpetas (En este caso uploads):

Allow: /wp-content/uploads/*.gif
Allow: /wp-content/uploads/*.png
Allow: /wp-content/uploads/*.jpg

El método de Sigt es bastante más restrictivo que el de AlexSeo, aunque la elección de uno u otro depende de lo que el blogger considere más cómodo.

Puede que quieras que el buscador de Google indexe tus imágenes (En LaMatePorUnYogur tienen desactivada la indexación, mientras que en otros sitios la tienen activada, por lo que depende de cada uno), por lo que sería recomendable que añadieras una línea para permitir la entrada al bot de Google Images:

User-agent: Googlebot-Image
Allow: /

No se hasta qué punto es necesario o eficiente añadir un par de líneas para Google Images si ya tienes puesto "User-agent: *" (Que actúa para todos los bots de buscadores), así que si alguien me puede explicar este punto mejor que mejor.

Wordpres tiene un problema bastante considerable de cara al contenido duplicado, ya que por defecto se indexan todos los feeds y trackbacks. Para evitar ésto hay que añadir unas cuantas líneas al robots.txt, que tienen en común prácticamente todos los blogs (Inkilino, LaMatePorUnYogur o Sigt):

Disallow: /?s=
Disallow: /?ref=
Disallow: /feed
Disallow: /comments/feed
Disallow: /feed/$
Disallow: /*/feed/$
Disallow: /*/
feed/rss/$
Disallow: /*/trackback/$
Disallow: /*/
*/feed/$
Disallow: /*/*/feed/rss/$
Disallow: /*/*/trackback/$
Disallow: /*/*/*/feed/$
Disallow: /*/*/*/feed/rss/$
Disallow: /*/*/*/trackback/$

Por último lugar, pero no menos importante que lo anterior, es facilitar el acceso al Sitemap de nuestro blog (Deberíamos tener uno, sí), indicando la ruta del archivo de la siguiente forma:

Sitemap: http://bocabit.com/sitemap.xml

De esta manera, juntando todo lo anterior, el resultado final que debería funcionar a todo el mundo podría ser como el siguiente:

User-agent: *
Disallow: /wp-
Allow: /wp-content/uploads/

Disallow: /?s=
Disallow: /?ref=
Disallow: /feed
Disallow: /comments/feed
Disallow: /feed/$
Disallow: /*/feed/$
Disallow: /*/
feed/rss/$
Disallow: /*/trackback/$
Disallow: /*/
*/feed/$
Disallow: /*/*/feed/rss/$
Disallow: /*/*/trackback/$
Disallow: /*/*/*/feed/$
Disallow: /*/*/*/feed/rss/$
Disallow: /*/*/*/trackback/$

User-agent: Googlebot-Image
Allow: /

Sitemap: http://tuSitio.com/sitemap.xml

Algo que me ha llamado la atención es que algunos sitios como, como Inkilino, han añadido un par de líneas para permitir la entrada del bot de Adsense a todo el sitio:

User-agent: Mediapartners-Google
Allow: /

Y hasta aquí llega la lección de hoy, aunque aún me quedan algunas dudas, como por ejemplo si las etiquetas Allow tienen más importancia que las Disallow en el sentido que anulen algunos valores de estas últimas, y agradecería que si estoy equivocado en algo, que se me corrija ;)

PDTA: Me sorprende que Helektron no tenga un robots.txt ;)

EDITADO: Si queremos que nuestro blog salga en Google Blog Search, deberemos añadir la siguiente línea, pero en este caso hay que tener en cuenta que Google lo podría considerar como contenido duplicado, por lo que sería recomendable añadirla un par de meses después de que el blog tenga ya cierto "prestigio" para que tenga un PageRank superior al del feed de las entradas:

Allow: /feed/$

Hazme ping nena: Mi lista de pings

por The-RockeR el 2 Julio, 2007

Todo aquel que tenga un blog y no sepa lo que es hacer ping debería aprendérselo cuanto antes. Hacer ping, consiste en notificar a determinadas páginas web que has actualizado tu blog, y, en algunos casos, puede llegar a aparecer en las portadas de esas páginas como 'últimas noticias', permitiendo una mayor afluencia de visitantes.

Cuando empecé con mi blog en Blogger, realizaba ping de manera manual en servicios como Pingoat y Ping-o-Matic!, ya que Blogger no disponía (aunque creo que ahora dispone de algo, unque desconozco su calidad) de algún metodo para hacer ping automático, y sólo lo hacía con Webblogs.com.

En Wordpress, existe una opción en el panel de administración, Opciones > Escritura, para escribir todas las direcciones ping que queramos. El problema de escribir muchas direcciones, será que la página tardará muchísimo tiempo en enviar toda la información, impidiendo realizar otras acciones. Para ello existe un plugin que se llama No Ping Wait, que gestiona todos los pings.

Continuar Leyendo »


Cómo instalar Compiz Fusion en Ubuntu Feisty

por The-RockeR el 28 Junio, 2007

Logo de CompizHace tiempo hablaba de cómo había conseguido instalar Beryl en Ubuntu Edgy Edft, pero ahora los proyectos Beryl y Compiz se han fusionado en uno sólo, dando lugar a Compiz Fusion. He buscado en internet distintos tutoriales de cómo hacerlo funcionar y al final he tenido que hacer un híbrido con dos tutoriales para que todo me funcione correctamente y pueda añadir Compiz Fusion al inicio de sesión. A continuación explico cómo hacerlo funcionar instalándolo desde los repositorios de Treviño.
Continuar Leyendo »

Quitar los vídeos relacionados de Youtube

por The-RockeR el 9 Junio, 2007

Parece que el "apañero" q256 está en todo. Navegando por Pixel y Dixel me he encontrado sin quererlo con la solución perfecta para quitar los molestos vídeos relacionados de Youtube, que han acompañado a la nueva apariencia del reproductor (Que, por cierto, si no llegara a ser por estos vídeos, no me habría dado cuenta).Para eliminar los vídeos relacionados hay que añadir "&rel=0" al final de la dirección del video, quedando así:

embed src=" http://www.youtube.com/v/dGAL2wWctII"&rel=0 ” (Sin relacionados)
embed src=" http://www.youtube.com/v/dGAL2wWctII" (Con relacionados)

Para los que utilizamos Wordpress, y ya tenemos demasiados vídeos como para ir cambiándolos uno a uno, podemos utilizar el plugin Search and Replace y desde el panel de administración (Se creará una opción llamada Search and Replace tras activar el plugin), buscar:
type="application/x-shockwave-flash" wmode="transparent"
y se reemplaza por esto:
&rel=0" type="application/x-shockwave-flash" wmode="transparent"

Así conseguiremos que no aparezcan los vídeos relacionados.
A mí de momento no me molestan, pero en cuanto reciba una queja de alguien (maca, tu no vales) o me molesten a mí, los quitaré. ¿A tí te resultan molestos?


EDITADO: También hay otra forma de quitar el virus, supuestamente efectiva al 100%. En “El morro de Murray” nos dicen cómo quitar el virus del Messenger tan molesto que envía mensajes automáticos diciendo que te descargues unas fotos, que en realidad es un archivo .bat comprimido. Si estás infectado con este virus, deberías leer el artículo. (57)

Actualizar a Wordpress 2.2 con K2 y no morir en el intento

por The-RockeR el 16 Mayo, 2007

Tras un rato de incertidumbre tras el estrepitoso error de K2 al actualizar a Wordpress 2.2 vuelvo a tener el blog como antes. Lamentablemente perdí todos los elementos de la barra lateral, por lo que tuve que volver a ponerlos (uno a uno). Por suerte no perdí tiempo al actualizar gracias al plugin Instant Upgrade, del que ya hablé hace tiempo (Enlace para descarga al final de post).

El error de la línea 189 del archivo info.php de K2 ocurría debido a que los "sidebar modules" entraban en conflicto con la nueva implementación de widgets que viene de serie con Wordpress. Por ello, hay que desabilitarla creando un archivo desabilitarWidgets.php (El nombre no importa con tal de que sea .php) e introduciendo el siguiente código:

<?php
/*
Plugin Name: Disable WordPress Widgets
Plugin URI: http://schulte.mn/
Description: This plugin overrides WordPress Widgets and will allow K2 Sidebar Modules to function.
Author: Darrell Schulte
Version: 1.0
Author URI: http://schulte.mn/
*/

remove_action('plugins_loaded', 'wp_maybe_load_widgets', 0 );
?>

Una vez hecho eso, se copia en el directorio de plugins y se activa desde el menú de Wordpress. ¿Ahora te salen más errores? En ese caso posiblemente debas desinstalar K2 desde su panel de opciones (Perdiendo así todos los elementos de la barra lateral, como yo).

Fuente | K2 Forums (Inglés)

Descarga | Wordpress 2.2

Descarga | Plugin InstantUpgrade