Hay algo que suele desconcertar bastante cuando revisas un proyecto WordPress con cierto recorrido.
Abres el sitemap… y te encuentras URLs que no deberían estar ahí.
Páginas en noindex.
Taxonomías irrelevantes.
Resultados de filtros.
Custom post types que nadie quería indexar.
Y lo más curioso es que muchas veces el plugin SEO está “bien configurado”.
Esto es bastante habitual. De hecho, aquí es donde suelen empezar los problemas: cuando el sitemap deja de ser un reflejo limpio de lo que quieres indexar y pasa a ser una mezcla de decisiones automáticas del sistema.
Entender por qué ocurre esto es clave para no quedarse en soluciones superficiales.
Por qué es un problema que el sitemap incluya páginas incorrectas
El sitemap no es una orden directa para Google. Pero sí es una señal importante.
Le estás diciendo al buscador:
“Estas son las URLs que considero relevantes”
Si ahí incluyes páginas que:
- no deberían indexarse
- tienen poco valor
- o generan contenido duplicado
estás enviando señales confusas.
No es que Google vaya a indexarlas todas automáticamente. Pero sí puede:
- rastrear más de lo necesario
- perder foco en páginas importantes
- o interpretar mal la estructura del sitio
En proyectos grandes esto se nota más, porque el crawl budget empieza a dispersarse.
Cómo funciona realmente el sitemap en WordPress
Aquí es donde conviene separar teoría de práctica.
Quién genera el sitemap
En WordPress el sitemap puede venir de:
- el core (desde versiones recientes)
- un plugin SEO (Yoast, RankMath, SEOPress…)
- plugins adicionales
En la mayoría de proyectos, el sitemap real lo controla el plugin SEO.
Qué lógica siguen los plugins SEO
Los plugins suelen decidir qué incluir en el sitemap en base a:
- tipos de contenido (post, page, CPT…)
- taxonomías
- estado de publicación
- ajustes de indexación
Pero aquí hay un matiz importante.
El plugin no siempre “piensa en SEO”.
Piensa en estructura de WordPress.
Y eso no siempre coincide.
Por qué el sitemap no siempre refleja la intención SEO
Esto en la práctica lo veo mucho.
Sobre el papel:
- el plugin incluye todos los posts publicados
- incluye taxonomías activas
- incluye CPT visibles
Tiene sentido desde una lógica técnica.
Pero no desde una lógica SEO.
Porque muchas de esas URLs:
- no aportan valor
- no deberían indexarse
- o forman parte de estructuras internas
El sitemap acaba siendo más un reflejo del sistema que de la estrategia.
Cómo detectar páginas que no deberían estar en el sitemap
Aquí es donde conviene hacer una revisión un poco más crítica.
Revisar el sitemap manualmente
Sí, parece obvio. Pero muchas veces no se hace.
Abres el sitemap y empiezas a mirar:
- tipos de URLs
- patrones repetidos
- secciones inesperadas
Ahí ya suelen aparecer cosas interesantes.
Cruzar sitemap con indexación real
Un paso más útil.
Comparar:
- lo que aparece en el sitemap
- con lo que realmente está indexado
Y también con lo que debería estarlo.
Aquí suelen aparecer incoherencias claras.
Detectar incoherencias con meta robots y canonical
Este es uno de los puntos más importantes.
Es bastante común encontrar:
- páginas en
noindexdentro del sitemap - URLs con canonical hacia otra página
- contenidos que no deberían posicionar pero están incluidos
Esto no rompe el SEO automáticamente, pero sí genera ruido.
Causas reales de un sitemap WordPress mal configurado
Aquí es donde empieza lo interesante.
Páginas en noindex que siguen en el sitemap
Este es un clásico.
Muchos plugins permiten marcar páginas como noindex, pero eso no siempre implica que se eliminen del sitemap automáticamente.
Depende del plugin… y de cómo esté configurado.
Resultado:
- páginas que no quieres indexar
- pero que sigues enviando a Google en el sitemap
Custom post types mal definidos
Cuando se crean CPT sin una estrategia clara, el sitemap suele incluirlos todos.
El problema es que muchos CPT:
- no están pensados para posicionar
- son estructuras internas
- o no tienen contenido suficiente
Pero el plugin los trata como contenido indexable.
Taxonomías sin control SEO
Otro foco habitual.
Categorías, etiquetas o taxonomías personalizadas que:
- se generan automáticamente
- no tienen contenido optimizado
- o simplemente no aportan valor
Y aun así aparecen en el sitemap.
Plugins SEO y configuraciones por defecto
Los plugins SEO suelen venir configurados para cubrir muchos casos.
Pero eso no significa que encajen con tu proyecto.
Por defecto pueden:
- incluir taxonomías
- incluir archivos
- incluir tipos de contenido no relevantes
Esto funciona “bien” en general… pero no siempre es lo óptimo.
Conflictos entre plugins o migraciones
Este es más técnico, pero ocurre.
Por ejemplo:
- migraciones de Yoast a RankMath
- plugins antiguos que siguen activos
- modificaciones en el theme
Esto puede provocar:
- sitemaps duplicados
- URLs heredadas
- estructuras inconsistentes
Un error común: pensar que el sitemap controla la indexación
Aquí hay un punto importante.
El sitemap no controla qué se indexa.
Solo sugiere.
Lo que realmente influye es:
- meta robots
- canonical
- enlazado interno
- contenido
Pero si el sitemap está mal, introduces incoherencias.
Es como tener una arquitectura bien pensada… pero enviar un mapa confuso.
Cómo limpiar y controlar el sitemap en WordPress
No se trata de desactivar cosas sin más.
Se trata de alinear el sitemap con la intención SEO.
Algunas decisiones que suelen tener sentido:
- excluir taxonomías irrelevantes
- revisar qué CPT deben indexarse
- eliminar contenido thin o duplicado del sitemap
- comprobar coherencia con meta robots y canonical
Y sobre todo, entender que el sitemap es una consecuencia del sistema, no algo aislado.
Conclusión
Cuando un sitemap en WordPress indexa páginas que no debería, el problema rara vez es solo del sitemap.
Es un síntoma.
De cómo están definidos:
- los tipos de contenido
- las taxonomías
- los plugins
- y la lógica SEO del proyecto
El error más común es intentar arreglarlo desde el panel del plugin sin entender qué está pasando por debajo.
Cuando analizas WordPress desde dentro —hooks, generación de URLs, comportamiento de plugins— empiezas a ver que el sitemap no es más que el resultado final de muchas decisiones técnicas.
Y ahí es donde tiene sentido intervenir.
9. FAQs
¿Por qué mi sitemap incluye páginas en noindex?
Depende del plugin SEO. Algunos no excluyen automáticamente las páginas en noindex del sitemap si no se configura explícitamente.
¿El sitemap afecta directamente al SEO?
No directamente, pero influye en el rastreo y en cómo Google interpreta la estructura del sitio.
¿Debo eliminar todas las taxonomías del sitemap?
No necesariamente. Solo aquellas que no aportan valor SEO o que generan contenido pobre o duplicado.
¿Puedo tener varios sitemaps en WordPress?
Sí, pero no es recomendable si generan estructuras distintas. Puede crear confusión en el rastreo.
¿Cómo sé qué páginas deben estar en el sitemap?
Las que realmente quieres posicionar y que aportan valor. El sitemap debe reflejar tu estrategia, no solo tu estructura.