Thin Content SEO: qué es y cómo eliminarlo de tu web

Thin Content: qué es y cómo eliminarlo de tu web para mejorar tu SEO

El thin content, o contenido delgado, es cualquier página de tu sitio web que ofrece poco o ningún valor a los usuarios: textos demasiado cortos, páginas duplicadas, contenido autogenerado o secciones que no responden realmente a ninguna intención de búsqueda. Google identifica este tipo de páginas como señales negativas de calidad y las penaliza rebajando el posicionamiento de la URL afectada o, en casos graves, de todo el dominio.

Para las empresas con presencia digital, el thin content es un problema más común de lo que parece. Una web corporativa típica acumula durante años páginas de categorías vacías, fichas de producto sin descripción, páginas de etiquetas del blog o landing pages creadas para campañas antiguas que nunca se retiraron. Cada una de estas páginas erosiona la autoridad total del sitio y puede estar arrastrando hacia abajo a páginas que sí merecen posicionarse.

En este artículo aprenderás qué tipos de thin content existen, cómo detectarlos con herramientas accesibles, qué decisiones tomar con cada tipo de página problemática y cómo implementar un proceso de limpieza que mejore visiblemente tu rendimiento orgánico.

Qué es exactamente el thin content y por qué Google lo penaliza

Google define la calidad de una página por su capacidad de satisfacer la intención de búsqueda del usuario. Una página que no lo consigue —porque tiene 50 palabras, porque es una copia de otra, o porque no ofrece información sustancial— no merece posicionarse. Es así de directo.

La Panda Update de 2011 fue el primer gran algoritmo de Google orientado específicamente a penalizar el contenido de baja calidad. Desde entonces, ese sistema se ha integrado en el algoritmo principal y se actualiza de forma continua. Las Google Quality Rater Guidelines, el documento interno que guía a los evaluadores humanos de Google, dedican un capítulo específico a identificar páginas con "poco contenido principal" como señal negativa.

El impacto del thin content en SEO se manifiesta de dos formas: directa, cuando la propia página afectada no consigue posicionarse para ninguna keyword relevante; e indirecta, cuando la acumulación de páginas de baja calidad rebaja la percepción global de autoridad del dominio y perjudica a las páginas que sí tienen contenido sólido.

La regla del presupuesto de rastreo

Existe un efecto adicional menos visible pero igualmente dañino. Los rastreadores de Google tienen un presupuesto de rastreo limitado por dominio: solo pueden visitar un número determinado de URLs en un periodo dado. Si tu sitio tiene centenares de páginas de thin content, el bot desperdicia ese presupuesto en páginas que no aportarán valor al índice, dejando sin rastrear páginas nuevas o actualizadas que sí merece la pena indexar.

Tipos de thin content más frecuentes en webs empresariales

No todo el thin content tiene la misma forma. Reconocer cada tipo es el primer paso para saber cómo tratarlo.

Páginas con muy poco texto: la longitud por sí sola no define la calidad, pero una página con 80 palabras raramente puede satisfacer la intención de búsqueda de forma completa. Las fichas de producto sin descripción, las páginas de servicio genéricas o las categorías de ecommerce con solo el nombre y un grid de imágenes son ejemplos típicos.

Contenido duplicado interno: cuando el mismo texto aparece en varias URLs de tu dominio —porque tienes parámetros de URL, versiones con y sin "www", páginas de paginación o productos con variantes—, Google no sabe qué versión priorizar y puede rebajar la autoridad de todas ellas.

Páginas de taxonomía vacías: en blogs y tiendas online, las páginas de etiquetas, categorías o archivos de autor suelen generarse automáticamente y contener solo un listado de entradas sin descripción propia. Si no aportan nada más allá de un índice, son thin content.

Contenido raspado o reescrito superficialmente: replicar contenido de otras fuentes con cambios mínimos es thin content aunque el texto sea largo. Google detecta la originalidad y la profundidad editorial.

Páginas de afiliados sin valor añadido: páginas que simplemente agregan descripciones de producto del fabricante con un enlace de afiliado, sin análisis propio ni información complementaria, son un caso clásico de thin content en el modelo de negocio de afiliación.

Landing pages obsoletas: páginas creadas para campañas pasadas, eventos ya celebrados o productos descatalogados que siguen siendo rastreables aunque no tengan tráfico ni propósito actual.

Cómo detectar el thin content en tu web

La detección sistemática requiere combinar datos de varias fuentes.

Google Search Console: la sección de Cobertura muestra páginas excluidas del índice y sus razones. Presta atención a los estados "Descubierta, pendiente de indexación" y "Rastreada, no indexada": Google las está visitando pero decidiendo no incluirlas, frecuentemente porque las considera de baja calidad.

Screaming Frog o Sitebulb: estos rastreadores técnicos te permiten exportar todas las URLs del sitio con su número de palabras, etiquetas de título, meta description y estado de canonicalización. Filtra por páginas con menos de 300 palabras como punto de partida para identificar candidatas a revisar.

Google Analytics o GA4: ordena tus páginas por sesiones orgánicas. Las URLs con cero o casi cero tráfico orgánico en los últimos 12 meses y sin propósito de conversión son candidatas claras a evaluar.

Ahrefs o SEMrush: la función de auditoría de sitio de estas herramientas identifica problemas de contenido duplicado, páginas con bajo conteo de palabras y URLs con señales de baja calidad según sus propias métricas.

El proceso de clasificación: no todas las páginas cortas son thin content

Antes de actuar, clasifica cada URL identificada en una de estas categorías: páginas de alto valor con contenido mejorable, páginas de bajo valor mejorables, páginas de bajo valor no mejorables, y páginas duplicadas o redundantes. Esta clasificación determinará qué acción tomar con cada una.

Qué hacer con el thin content: las cuatro acciones posibles

Una vez identificado el thin content, tienes cuatro opciones. Elegir la correcta para cada URL es más importante que actuar rápido.

1. Mejorar el contenido: es la opción preferida para páginas que tienen potencial de posicionamiento pero no están bien desarrolladas. Añadir texto sustancial, responder preguntas relacionadas, incluir ejemplos y estructurar mejor el contenido puede convertir una página de 150 palabras en un recurso útil de 800. Esta opción funciona cuando la URL tiene relevancia estratégica para el negocio.

2. Consolidar con otra página (canonical o redirect 301): cuando tienes varias páginas sobre el mismo tema con contenido solapado, fusionarlas en una sola más completa es más eficiente que mejorarlas por separado. Redirige las versiones menos completas a la versión principal con un redirect 301 y asegúrate de transferir los backlinks que pudieran tener.

3. Añadir etiqueta noindex: para páginas que necesitan existir por razones técnicas o de navegación pero que no deben posicionarse (páginas de resultados de búsqueda interna, páginas de parámetros de URL, archivos de paginación), añadir una meta etiqueta noindex las excluye del índice sin eliminarlas del sitio. Es la solución ideal para páginas de taxonomía sin valor editorial.

4. Eliminar la página (301 o 410): para páginas completamente obsoletas, sin tráfico, sin backlinks y sin posibilidad de mejora, la eliminación es la opción más limpia. Si la URL tiene algún enlace entrante, redirige con un 301 hacia la sección más relevante del sitio. Si no tiene ningún enlace, un código de estado 410 (Gone) es más explícito que un 404.

Priorización: por dónde empezar la limpieza de thin content

Si tu sitio tiene decenas o cientos de páginas problemáticas, abordarlas todas a la vez no es realista. Prioriza así:

Primero, elimina o redirige las páginas completamente obsoletas: son acciones rápidas con beneficio inmediato en el presupuesto de rastreo. Segundo, añade noindex a las páginas de taxonomía generadas automáticamente. Tercero, consolida las páginas con contenido solapado. Y cuarto, mejora las páginas con potencial de posicionamiento empezando por las que ya tienen algún tráfico o backlinks que se podría amplificar.

Después de cada ronda de acciones, espera al menos cuatro semanas antes de medir el impacto: Google necesita tiempo para recrawlear el sitio y actualizar sus valoraciones.

Implementación práctica: limpieza de thin content en una tienda online

Una tienda de materiales de construcción con catálogo de 4.000 productos había visto decrecer su tráfico orgánico durante dos años consecutivos. Auditando el sitio se detectaron tres problemas de thin content: 1.200 fichas de producto con descripciones de fabricante idénticas a las de otras tiendas, 340 páginas de etiquetas autogeneradas por el CMS y 80 landing pages de campañas de temporada de años anteriores.

El plan de acción fue:

Noindex en las 340 páginas de etiquetas.
Redirect 301 de las 80 landing pages obsoletas a las categorías correspondientes.
Selección de los 200 productos de mayor margen para reescribir sus descripciones con contenido original, incluyendo especificaciones técnicas propias, preguntas frecuentes y comparativas con productos alternativos.
Para el resto de fichas de producto, se implementó una plantilla estructurada que añadía automáticamente contenido dinámico relevante (proyectos en los que se usa, materiales complementarios, preguntas de otros clientes).

En los cuatro meses siguientes, el número de páginas indexadas se redujo de 5.100 a 3.600, el tráfico orgánico creció un 28% y las páginas mejoradas pasaron de posición media 45 a posición media 18 para sus keywords principales.

Thin content vs. contenido evergreen: la perspectiva estratégica

La limpieza de thin content no es un ejercicio defensivo. Es el primer paso para construir un sitio web que Google valore de forma consistente. Cada página eliminada o mejorada libera autoridad para las páginas que sí tienen potencial. Cada consolidación crea activos editoriales más fuertes que los fragmentos dispersos que los originaron.

El objetivo final es un sitio donde prácticamente cada URL indexada justifique su existencia con valor real para el usuario. Ese estándar de calidad es lo que distingue los dominios que mantienen su posicionamiento a través de las actualizaciones de algoritmo de los que sufren caídas periódicas sin causa aparente.

Sugerencias de enlazado interno

¿Necesitas una estrategia de contenidos SEO profesional?

Detectar y eliminar el thin content es una de las intervenciones con mayor retorno en SEO, pero hacerlo bien requiere criterio técnico y editorial. No se trata solo de borrar páginas; se trata de tomar decisiones estratégicas sobre qué mejorar, qué consolidar y qué eliminar para que el conjunto del sitio sea más valioso para Google y para tus usuarios.

En Comunicua realizamos auditorías de contenido completas que identifican el thin content de tu web, priorizamos las acciones según su impacto potencial y ejecutamos las mejoras editoriales y técnicas necesarias. El resultado es un sitio más limpio, mejor indexado y con un posicionamiento más estable.

→ Contacta con Comunicua y desarrolla una estrategia de contenidos que posicione tu empresa en Google.