SENIOR SEO 2011 - 2025 SEO / UX / CRO

ACTUALMENTE NO DISPONIBLE PARA PROYECTOS COMO FREELANCE

¿Hablamos?

Validador y Editor de robots.txt

Analiza, edita y valida tu robots.txt para garantizar un correcto indexado.

Resultado

Introduce el dominio o url

Introduce el dominio o introduce directamente la url de tu archivo robots.txt

Edita manualmente

Si lo prefieres puedes pegar tu robots.txt y validar una url

Optimiza tu robots

Testea urls, comprueba las reglas, recibe consejos. Una vez lo tengas puedes copiar o guardarte el contenido

Guía completa de robots.txt

Fundamentos de robots.txt

¿Qué es un archivo robots.txt?

El archivo robots.txt es un archivo de texto simple que se coloca en el directorio raíz de un sitio web para comunicar a los robots de los motores de búsqueda (como Googlebot, Bingbot, etc.) qué páginas o secciones del sitio pueden o no rastrear e indexar.

Este archivo forma parte del Protocolo de Exclusión de Robots, un estándar usado por los sitios web para comunicarse con los rastreadores web y otros robots.

¿Dónde se coloca el archivo robots.txt?

El archivo debe colocarse en el directorio raíz de tu dominio:

https://example.com/robots.txt

¿Cómo afecta a la indexación de mi sitio?

Es importante entender que:

El archivo robots.txt solo proporciona directrices, no órdenes. Algunos bots podrían ignorarlo.
Bloquear una URL en robots.txt no garantiza que no aparezca en los resultados de búsqueda. Para eso deberías usar meta noindex o encabezados HTTP.
El robots.txt afecta al rastreo, no necesariamente a la indexación.

¡Atención! Un error en tu robots.txt podría bloquear accidentalmente a los motores de búsqueda de rastrear páginas importantes de tu sitio, afectando negativamente tu SEO.

Directivas principales

User-agent

Especifica a qué robot de búsqueda se aplican las reglas siguientes.

Sintaxis: User-agent: [nombre del robot]

Ejemplos:

User-agent: * → Aplica a todos los robots
User-agent: Googlebot → Aplica solo a Google
User-agent: Bingbot → Aplica solo a Bing

Mejores prácticas:

Coloca siempre User-agent al inicio de cada sección de reglas
Puedes tener múltiples secciones User-agent con diferentes reglas
El orden importa: define primero las reglas específicas, luego las generales

Disallow

Indica a los robots qué páginas o directorios no deben rastrear.

Sintaxis: Disallow: [ruta]

Ejemplos:

Disallow: /admin/ → Bloquea el directorio /admin/ y todo su contenido
Disallow: /checkout → Bloquea la página /checkout
Disallow: / → Bloquea todo el sitio web
Disallow: (vacío) → Permite rastrear todo

Casos de uso comunes:

Bloquear áreas administrativas
Bloquear páginas de carrito/checkout
Bloquear archivos temporales o en desarrollo
Bloquear scripts y recursos innecesarios

Allow

Permite a los robots rastrear páginas o directorios específicos, incluso si están dentro de un directorio bloqueado por Disallow.

Sintaxis: Allow: [ruta]

Ejemplos:

Allow: /admin/public/ → Permite rastrear la carpeta public dentro de admin (que podría estar bloqueada)
Allow: /products/featured → Permite rastrear la página featured dentro de products

Cuándo usarla:

Para crear excepciones dentro de directorios bloqueados
Cuando necesitas bloquear un directorio pero permitir páginas específicas dentro de él

Sitemap

Indica la ubicación del archivo sitemap XML.

Sintaxis: Sitemap: [URL del sitemap]

Ejemplo:

Sitemap: https://example.com/sitemap.xml

Mejores prácticas:

Usa URLs absolutas (con https://)
Puedes incluir múltiples directivas Sitemap
La directiva Sitemap es independiente de los grupos User-agent

Crawl-delay

Especifica el tiempo mínimo (en segundos) que un robot debe esperar entre solicitudes sucesivas.

Sintaxis: Crawl-delay: [segundos]

Ejemplo:

Crawl-delay: 10 → El robot debe esperar 10 segundos entre solicitudes

Nota importante: No todos los motores de búsqueda respetan esta directiva.

Host

Especifica el dominio canónico preferido. Esta directiva es usada principalmente por Yandex.

Sintaxis: Host: [dominio]

Ejemplo:

Host: example.com

Patrones y sintaxis avanzada

Errores comunes y soluciones

FAQS

Buenas prácticas

Mantén tu archivo robots.txt lo más simple posible
Bloquea recursos innecesarios para ahorrar cuota de rastreo
Prueba tus reglas antes de implementarlas
Incluye la ubicación de tu sitemap
Elemento de lista

SENIOR SEO 2011 - 2025 SEO / UX / CRO

Validador y Editor de robots.txt

Resultado

Introduce el dominio o url

Edita manualmente

Optimiza tu robots

Guía completa de robots.txt

¿Qué es un archivo robots.txt?

¿Dónde se coloca el archivo robots.txt?

¿Cómo afecta a la indexación de mi sitio?

¡Atención! Un error en tu robots.txt podría bloquear accidentalmente a los motores de búsqueda de rastrear páginas importantes de tu sitio, afectando negativamente tu SEO.

User-agent

Disallow

Allow

Sitemap

Crawl-delay

Host

Uso del comodín *

Uso del símbolo $

Directivas case-sensitive

Jerarquía y orden de reglas

Bloquear todo el sitio accidentalmente

Usar espacios incorrectamente

No comenzar las rutas con /

Usar reglas redundantes

No considerar subdominios

¿Puedo usar robots.txt para eliminar páginas de los resultados de búsqueda?

¿Qué sucede si no tengo un archivo robots.txt?

¿Es obligatorio tener un archivo robots.txt?

¿Cómo afecta robots.txt a mi SEO?

¿Robots.txt afecta a todos los robots?

Buenas prácticas

Lo que debes evitar