El sitemap.xml, ese mapa del sitio de una web del que se habla tanto en SEO y que prácticamente todas las webs lo tienen… pero, ¿deben tenerlo? Ésta es una pregunta que resolveré en este post. También muchas otras como por ejemplo, cuánto de importante es el sitemap en una web, cómo optimizarlo, cómo crearlo de diferentes formas, etc.

El artículo que vas a leer (o no) es bastante extenso y completo. El sitemap puede ser un elemento al que se le haga poco caso o mucho, que puede tener mucha importancia en una web o poca. Considero que siempre hay que conocerlo y saber qué hacer con él. Entorno al sitemap.xml, que no confundir con el sitemap HTML, hay mucho de lo que hablar e intentaré aclararlo aquí mismo.

¿Qué es el sitemap.xml?

Voy a empezar por lo básico, sobre todo por si estás empezando en el mundo del SEO y no te queda claro el concepto.

Un sitemap.xml es un archivo que se encuentra en la web, bajo el dominio, y da información a los motores de búsqueda sobre las páginas o también archivos (PDF, imágenes, videos) que son importantes para el webmaster. Todo ese contenido, esas URLs son las que en principio son importantes, las que quieres que se rastreen y por lo tanto, indexen y clasifiquen.

Digo «en principio» porque en muchas ocasiones, cuando un sitemap no está optimizado o bien creado, se incluyen páginas que no tienen valor, no aportan nada a la estrategia SEO e incluso no deberían ser rastreadas por los bots.

Más adelante te contaré cómo optimizar un sitemap.xml. Sigue leyendo.

En resumen, el sitemap.xml sirve para que los motores de búsqueda tengan un listado de URLs que consideras importantes. También pueden ofrecer otro tipo de información como por ejemplo cuándo una página se ha actualizado por última vez, cada cuando se actualiza o si hay versiones en diferentes idiomas. También en el caso de imágenes se puede incluir qué tipo de imagen es, el tema y la licencia.

Un sitemap ayuda a los bots a descubrir las urls que le indicamos en él, y por lo tanto puedes aprovecharlo para priorizar o hacer que Google vea lo que tú quieres que vea. Aunque ojo, aquí entrarían otros elementos como el robots.txt para bloquear el acceso de bots a ciertas páginas. Por otra parte Google dice que no garantiza que todos los elementos que hay en un archivo sitemap se vayan a rastrear e indexar.

Que una URL esté en el sitemap no es garantía de que se vaya a rastrear e indexar. Entran en juego otros factores.

Los sitemaps de las webs podríamos decir que son «públicos», es decir, siempre que sepas cómo es la URL puedes acceder y verlo, igual que ocurre con el robots.txt

En muchos casos la URL del sitemap.xml es:

dominio.com/sitemap.xml

Aunque dependerá de con qué herramienta esté generado el sitemap, el CMS, el nombre que se le ha puesto al guardarlo… No es algo importantísimo, ni mucho menos.

En casos como en WordPress y con plugins como Yoast o Rank Math, la dirección del sitemap es:

dominio.com/sitemap_index.xml

Y si intentas ir a /sitemap.xml hace una redirección a la URL correcta.

Más allá de esto, cuando entras a un sitemap de una web puede ser así:

O puede ser así:

ejemplo sitemap de rank math

Sitemap generado con Rank Math

El formato de un sitemap XML depende de cómo se haya generado. Aquí puedes ver los diferentes tipos de formatos y lo que significa cada uno de los parámetros.

Cabe decir, antes de que te vuelvas loco dedicándole tiempo, que los campos «lastmod», «priority» y «changefreq», no son tenidos en cuenta por Google y no tienen mayor importancia.

¿Cómo de importante es el sitemap.xml?

Aunque sea una respuesta que nunca gusta, hay que decirlo… «depende». Así es, amigo, amiga, depende, pero voy a argumentarlo en condiciones, tranqui.

Un mapa de sitio puede ser muy importante, puede ser de importancia media o puede tener muy poca importancia.

En general a un sitemap se le suele dar más importancia de la que tiene. ¿Están los sitemaps sobrevalorados?

Partimos de la base de que un sitemap nunca debería de perjudicar a una web que lo tiene. Ahora bien, puedes tener un sitemap que más que beneficiar, te perjudique.

¿En qué casos es importante tener un sitemap.xml?

Si no te identificas con alguno de estos casos, sigue leyendo, además de que lo entenderás todo mejor hay más cosas importantes para ti.

👉Cuando tu site es muy grande.

Si tu web cuenta con cientos de miles de URLs, seguramente necesitarás un sitemap para guiar mejor a los bots y priorizar aquello que quieres rastrear, lo que es relevante para ti. Es decir, optimizar el presupuesto de rastreo de la mejor manera posible. También por supuesto para que Google vea cuanto antes aquellas páginas nuevas o que se actualizan.


👉Cuando la estructura de tu web y el enlazado interno no son buenos.

Pongamos que hay ciertas páginas de tu web que por el motivo que sea, bien porque la estructura actual no permite enlazarlas bien, porque tienen una profundidad de rastreo muy alta o porque son páginas que apenas cuentan con enlaces internos, incluso páginas huérfanas. Aquí el sitemap puede ayudar bastante a que Google descubra y/o vuelva a rastrear páginas que para ti puedan ser relevantes.


👉Cuando tienes una web nueva, apenas tienes enlaces externos y necesitas que sea rastreada.

Una de las formas que tienen los bots de encontrar y rastrear páginas es a través de enlaces internos y externos y en el caso de que no tener estos últimos porque sacaste tu web ayer, hace unas semanas, un mes… el sitemap te puede ayudar.


👉Si tu web contiene mucho contenido multimedia o aparece en Google News. 

En este caso los sitemaps pueden ayudar a que Google tenga información adicional de todos estos archivos como imágenes o videos.


¿En qué casos podrías no necesitas sitemap.xml?

En mi opinión personal te diría que una web debería tener un sitemap SIEMPRE. No obstante, hay casos en los que no va a tener un papel importante, ni diferenciador:

Cuando tienes una web pequeña, con menos de 500 páginas “indexables”, si tu web está creada en servicios tipo blogger o si tu enlazado interno es el mejor que puedes tener o cuando no tienes necesidad de que imágenes o videos subidos a tu web se indexen.

En estos casos no es tan necesario un sitemap, pero ya te digo, te puede ayudar siempre, en todos los casos y cuesta tan poco tenerlo y tenerlo bien optimizado que sería ya cuestión de dejadez no tener un sitemap alegando cualquiera de estas excusas que te acabo de contar (¡vago!).


¿Cómo crear un sitemap.xml?

Para explicarte cómo crear un sitemap voy a hacerlo en dos partes. En primer lugar te voy a enumerar lo que debes tener en cuenta para que esté creado y optimizado correctamente. Luego te explicaré cómo crearlo teniendo en cuenta diferentes herramientas, plugins, CMS…

Pero antes de ponerte a crearlo sin más… 👇👇

Cómo debe ser un sitemap optimizado

Un sitemap bien optimizado es aquel que contiene únicamente las URLs, páginas y archivos que son importantes, relevantes para el SEO, para tu negocio. Páginas que tienes claro que quieres que sean rastreadas e indexadas. Todo lo demás está de más.

Para tener un sitemap optimizado te voy a decir los tipos de páginas que no deberían incluir.


  • Páginas o archivos que no quieres que sean rastreados ni indexados, bien porque no tienen ni valor SEO, ni para el negocio ni para el usuario. Evita en la medida de lo posible rastreos inútiles.
  • Páginas marcadas con un «noindex»: si has marcado ciertas páginas con la etiqueta noindex, la que le indica a Google que no quieres que dicha página sea indexada, esa página no debe estar en el sitemap. Es incoherente, de hecho Google a través del informe de Rendimiento de Search Console puede advertirte de que esto ocurre y no tiene mucho sentido. Por suerte algunos plugins si utilizas WordPress, como Yoast o RankMath, cuando marcas una página, tipo de contenido, o taxonomía con «noindex» directamente lo retiran de sus sitemaps.
  • Páginas bloqueadas por robots.txt. Si tienes una página o cierta parte de tu web bloqueada con un disallow en el robots.txt, dicha página no debe estar en el sitemap, piensa que tampoco es coherente. Aquí debes tener en cuenta que si utilizas Yoast o RankMath para crear tu sitemap no quitarán del sitemap una página bloqueada con disallow.
  • Páginas con estado 3XX, 4XX o 5XX. Páginas que tengan una redirección por ejemplo 301 o 302 hacia otra, no deben estar en el sitemap, debería estar la url con estado 200, la buena, hacia la que redirigen. Ni mucho menos debes tener en un sitemap páginas con errores tipo 404, estado 410 o páginas con errores de servidor, como los errores 500. Esto es de cajón de madera de roble.
  • Páginas canonicalizadas: tampoco es coherente tener en el sitemap una página de tu web que su canonical es otra, es decir, la relevante o principal, esa página no debe estar en el sitemap, debería estar la que es relevante o importante, la canonical.

Características técnicas que debe cumplir un sitemap XML


  • Incluye URLs coherentes, es decir, si las URL de tu web son https://www.tudominio.com/ no incluyas https://tudominio.com/ (sin las www) ni tampoco URLs relativas.
  • No incluyas identificadores de sesión de URLs en tu sitemap para evitar que esas URL se rastreen dos veces.
  • El tamaño máximo de los sitemaps deben ser de 50MB o de 50000 URLs. Si sobrepasa esto deberás dividir el sitemap en archivos más pequeños. Estos diferentes sitemaps deben listarse en un índice de sitemaps. Ésto es lo que puedes ver en el ejemplo anterior del sitemap generado con Rank Math, que del índice sale dos: Page y Post.
  • Los archivos de sitemap deben tener la codificación UTF‑8.
  • Si tienes otros tipos de contenido para incluir como vídeos, imágenes o noticias,  hazlo usando extensiones de sitemaps.
  • Si tienes una web con diferentes idiomas y regiones y haces uso de la etiqueta hreflang, puedes indicar las URL alternativas con un atributo hreflang en un sitemap o con etiquetas HTML.
  • Informa a Google sobre las versiones de URLs en otros idiomas mediante anotaciones hreflang.
  • Si tu web tiene diferente versiones para móviles y ordenadores, es recomendable que incluyas solo una versión (recomendable móvil).

Crear un sitemap.xml en WordPress con plugins


Yoast SEO

El plugin SEO más instalado en WordPress tiene una función propia para crear un mapa de sitio.

En los Ajustes de Yoast: General > Características hay una opción que permite activar el sitemap.

crear sitemap yoast seo

En el momento que activas esta opción, tu sitemap tendrá esta dirección:

tudominio.com/sitemap_index.xml

¿Y cómo lo configuras? Poco puedes hacer más si tienes el sitemap creado con Yoast. Automáticamente cuando marcas algún contenido, página, archivo con «noindex» desde el propio plugin, se quita del sitemap porque se entiende que no es coherente.

Hay otros casos en los que una página puede seguir en el sitemap.xml y no deba, pero tampoco puedas hacer mucho, como es el caso de que una página bloqueda por robots.txt. Aunque estés utilizando el robots.txt propio de Yoast, esa página si no tiene un «noindex» no se va a eliminar del sitemap. Esta es una de las desventajas que para mí tiene Yoast frente a Rank Math.

Te recuerdo las diferencias entre el «no index» y el Robots.txt


Si en algún momento el sitemap de Yoast se te queda corto de personalización, puedes desactivarlo y recurrir a otra forma de crearlos.


Rank Math


Si utilizas Rank Math como «plugin SEO» crear y optimizar el sitemap es bastante sencillo.

El que crea este plugin también lo encontrarás en:

tudominio.com/sitemap_index.xml

y dentro del sitemap principal encontrarás los diferentes sitemaps por Tipos de Contenido y Taxonomías, por ejemplo:

tudominio.com/post-sitemap.xml

En los ajustes > Ajustes del mapa del sitio encontrarás bastantes opciones pero muy fáciles de entender y configurar.

En la sección de ajustes generales del sitemap encontrarás estos 6 apartados:

sitemap con rank math

1- Enlaces por mapa del sitio: aquí indicas cuántas URLs como máximo habrá por mapa. Es recomendable que lo dejes en 200.

2- Imágenes en los mapas del sitio: si quieres que las imágenes de las páginas y los contenidos se envíen al sitemap, actívalo.

3- Incluir imágenes destacadas: si quieres que las imágenes destacadas de los post y las páginas, aunque no estén en el contenido, se puedan incluir en los sitemaps.

4- Excluir entradas: si quieres eliminar del sitemap URLs concretas por el motivo que sea puedes hacerlo a través del ID de cada página y puedes añadir los que quieras separándolo por comas.

Por ejemplo:

excluir entradas del sitemap con ID

Para encontrar el ID de cada página puedes ir a la edición de la que quieras excluir y fijarte en la URL de la página en modo Edición.

encontrar id página wordpress

En este caso el ID sería: 11633

5- Excluir términos: igual que el punto 4, pero en este caso para excluir taxonomías como Etiquetas o Categorías. Del mismo modo, debes ir añadiendo los diferentes IDs, los cuales puedes encontrar haciendo lo mismo que en el punto 4.

6- Hacer ping a los motores de búsqueda: no está de más tenerlo activado. Rank Math notifica a los motores de búsqueda de Google y Bing que el sitemap se ha actualizado.

sitemap con rank math

Además de los ajustes generales verás que puedes configurar por cada tipo de Contenido o Taxonomía.

En estos ajustes sobre todo utilizarás la opción de «Incluir en mapa del sitio». Esto sirve para incluir o eliminar el sitemap de determinados tipos de contenido como Entradas, Páginas, Categorías, Productos, etc.

Es decir, si no incluyes un tipo de Contenido o Taxonomía, no aparecerá ninguna en el sitemap.

configuracion-sitemap-rankmath

Aclaración: si ves que tu página de Rank Math no es igual que esta en cuando a las opciones de Tipos de Contenidos o Taxonomías, es normal. En esta sección aparecen aquellos Contenidos o Taxonomías que tiene una web en base a los plugins o funcionalidades que tiene. Si tuviera Woocommerce instalado aparecerían «Productos» y «Categoría de producto», por ejemplo.


Google XML Sitemaps para WordPress

Este es el plugin para crear y configurar sitemaps que más me gusta de WordPress, por la sencillez, capacidad de personalización y simplicidad.

google-xml-sitemap-plugin-wordpress

Importante: si haces uso de este plugin para generar el sitemap y a la vez utilizas un plugin como Yoast, Rank Math o similar, deberás desactivar el sitemap de estos plugins. No generes 2 sitemaps.

Una vez que lo instalas y activas, toda la configuración se hace desde una misma página. De todas las opciones, las verdaderamente importantes son estas:

-Lo que quieres incluir en el sitemap: elige los Tipos de Contenido que se incluye y los que no, así como las Taxonomías.

Página principal, artículos del blog, páginas estáticas es obvio que las querrás enviar al sitemap. Categorías de blog, archivos, paginas de autor o etiquetas, es probable que no, ¿por qué? lee esta guía sobre desindexación.

crear sitemap con google xml sitemaps

-Si quieres excluir páginas individualmente o categorías: igual que hemos visto arriba, en la parte de Rank Math, puedes excluir páginas o entradas, una a una indicando su ID y separando por comas.

crear sitemap con google xml sitemaps


Otras formas de crear un sitemap.xml para cualquier CMS o tipo de web

Si no utilizas WordPress o pasas de plugins, porque prefieres hacerlo a mano (allá tú), existen diferentes opciones para hacerlo.


Crear un sitemap.xml con Screaming Frog

Una de las múltiples funciones de SF es la creación de sitemaps a partir de los crawleos|rastreos que hace la herramienta.

👉Lo primero que debes hacer es un rastreo completo de tu web

Para ello, incluye tu dominio y pulsa en «Start» y espera a que la ranita acabe su trabajo.

rastreo screaming frog

Rastreo finalizado:

rastreo screaming frog

NOTA IMPORTANTE: la versión gratis de Screaming Frog únicamente permite el rastreo de un máximo de 500 URL. Puede que no sea suficiente para rastrear tu sitio completo. Dentro de estas 500 URL se incluyen también imágenes, javascript, css…

Cuando se haya rastreado el 100%, busca la función «Sitemaps» en el menú y luego XML Sitemap.

crear sitemaps con screaming frog

Ahora tendrás que establecer la configuración del sitemap, que es similar a lo que he comentado más arriba, a la hora de configurarlo en WordPress.

crear sitemap.xml con screaming frog

En la pestaña «Pages» es donde está lo importante.

No queremos incluir páginas con «noindex», tampoco canonicalizadas, ni paginaciones, por lo que no lo marcamos. En el caso de que quieras incluir en el sitemap los PDFs, márcalo.

Tampoco queremos páginas que no respondan, ni bloqueadas por robots, ni con estados 3XX, 4XX ni 5XX, por lo que no marcamos nada de eso.

En el caso de que quieras añadir imágenes o páginas con hreflang, puedes hacerlo en sus correspondientes pestañas.

Cuando hayas terminado la configuración, pulsa en «Siguiente» y ya solo tendrás que decir dónde quieres guardar el archivo en formato .xml que luego deberás subir a tu web.

Una vez creado y guardado, el archivo con extensión .xml deberás subirlo al archivo raíz de tu web, para que aparezca de esta forma:

 https://tudominio.com/sitemap.xml

xml-sitemaps.com

Este generador online de sitemaps tiene una versión gratis que te puede ser suficiente (hasta 500 URLs), aunque para mi no es ni mucho menos la mejor opción. Si bien es cierto que no te va a incluir URLs con «noindex» ni tampoco redirecciones, sí puede incluir canonicalizadas y no te deja elegir que tipos de contenido o taxonomías se incluyen.

Lo primero que debes hacer es incluir el dominio del que quieras hacer el sitemap.

Tras un rato rastreando (dependerá del tamaño de tu web) tendrás el resultado de las URLs encontradas.

En este ejemplo se han «escaneado» 349 y se han añadido al sitemap 238. Esta diferencia es porque ciertas URLs no se añaden.

crear sitemap xml

Además podrás ver más datos sobre los resultados:

crear sitemap xml

 

Y por supuesto, qué URLs compondrá el sitemap que puedes descargar:

crear sitemap xml

 

Si estás de acuerdo con el resultado es momento de descargar el sitemap. Pulsas en el botón, obtienes el archivo y lo debes subir a la carpeta de tu web, al raíz del dominio.

crear sitemap xml


Una vez creado, ¿qué debo hacer?

Cuando ya tienes creado y optimizado el sitemap no debes hacer mucho más. Ten en cuenta que si has creado el sitemap con plugins, se actualiza automáticamente tanto si creas como si eliminas páginas, como si indexas o desindexadas contenidos (todo esto depende, claro, de cómo hayas generado el sitemap).

Si has creado el sitemap con otros métodos como Screaming Frog, no se actualiza automáticamente, deberás hacerlo tú cada cierto tiempo, actualizando el archivo o volviéndolo a generar y subiéndolo a tu web.

Además de esto, te cuento algunas cosas que son recomendables que hagas:


Enviar el sitemap.xml a Google

En el momento que lo has generado y sabes cuál es la URL debes enviar el mapa del sitio a Google a través de Search Console. Es muy fácil.

Lo primero que debes hacer es entrar en tu Propiedad de Search Console e ir a la sección Índice > Sitemaps:

enviar sitemap a google en search console

Aquí dentro verás un espacio donde puedes añadir la URL relativa de tu sitemap. Recuerda que la dirección del tuyo no tiene que ser igual que la de la foto, puede ser por ejemplo /sitemap.xml», a secas.

Pulsa en «Enviar» y listo. Ya lo habrás enviado a Google y lo irá procesando y mostrándote información en otros informes de Search Console.

enviar sitemap a google en search console


Incluirlo en el robots.txt

Otra cosa que también es recomendable hacer es incluir una línea en el robots.txt con la dirección del sitemap.

Puedes añadirlo al final del archivo robots.txt, por ejemplo en mi caso sería así:

Sitemap: https://alexserrano.es/sitemap_index.xml

Por si lo necesitas, te dejo aquí un video tutorial sobre cómo editar el archivo robots.txt


Analiza el estado del sitemap en Google Search Console

Una vez enviado el sitemap a Google mediante Search Console y cuando es procesado, empezarás a ver datos y podrás analizar lo que ocurre con tu mapa de sitio.

Esta información la tenemos en el Informe de Rendimiento, aunque si accedes a través de la pestaña de GSC «Sitemaps»y haces clic en el sitemap enviado verás esto:

-En primer lugar la última lectura del archivo y cuántas URLs se han descubierto en él.

-Verás también un botón para ver la Cobertura del índice (lo explico un poco más abajo).

-Más abajo verás los sitemaps leídos. En este caso hay 2 sitemaps que están dentro del índice (recuerda que esto lo hace así por defecto Rank Math). Última lectura, estado del sitemap y URLs descubiertas en cada uno de ellos.

analizar sitemap en search console

 

Cuando accedes a ver la Cobertura de Índice entras al Informe de Cobertura, pero únicamente del Sitemap enviado.

Podrás ver el estado de las URLs enviadas una a una y ver si son válidas, está excluidas, son válidas pero con advertencias o si tienen errores.

No voy a explicar aquí qué significada cada estado, qué implica y cómo se soluciona porque lo expliqué detalladamente en este post que te animo a que leas después de éste.

 

Como ves, si has leído casi todo el post está bastante claro y está en tu mano tener un sitemap optimizado y controlado. Ahora es el momento que revises el tuyo o si todavía no lo tienes creado o no tienes ni idea de si lo tienes creado, te pongas manos a la obra.

Aquí te dejo además un video de mi canal que grabé hace tiempo pero que te sigue pudiendo ayudar:


2 Comments

Leave a Reply

Uso de cookies

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies, pinche el enlace para mayor información.plugin cookies

ACEPTAR
Aviso de cookies