Tras los cambios de los últimos años que ha hecho Google en su algoritmo, el contenido duplicado es uno de los grandes problemas que enfrentan muchas marcas para posicionar su contenido de manera orgánica en buscadores. Pero ¿por qué? Es un tema tan controvertido, que la multinacional norteamericana dedica una página entera de su sección Soporte (y bien completa, por cierto) que te recomiendo que te leas en unos minutos.
Google define así el contenido duplicado:
Se denomina contenido duplicado a los bloques de contenido de un tamaño considerable que coinciden completamente o son muy parecidos a otros que se encuentren en ese mismo dominio o en cualquier otro. En la mayoría de los casos no es malintencionado […]
La cuestión es que, cuando pensamos en contenido duplicado, a menudo nos empiezan a temblar las piernecillas (o piernazas, ojo, que no sé si has estado yendo mucho al gimnasio…) y a creer que cualquier cosa que escribamos, y de la que nos hayamos documentado en Internet, va a ser considerado como contenido duplicado, o que no tiene sentido escribir sobre ciertos temas si ya hay muchos otros competidores dedicados a una tarea similar, ¿verdad? Sobre esto, sí hay (buena) parte de verdad, pero el problema radica en no entender bien cómo los motores de búsqueda (G-O-O-G-L-E, ¡siempre Google!) entienden el contenido plagiado y cómo deberíamos generar contenido para la WWW.
Empecemos por la base. Hay dos grandes tipos de contenido duplicado: interno y externo, vamos a verlos a continuación.
Contenido duplicado interno: (muchas veces) el enemigo está en casa
Como bien dicen en esta entrada de InboundCycle sobre contenido duplicado, esto parece cosa de risa, pero solemos preocuparnos mucho de plagio o contenido externo que se repite (o repetimos) y muy poco del contenido interno duplicado, que todos los SEO y Google afirman que es aquel que es más común. El porqué es bastante sencillo, del problema más común al menos común tenemos:
- No contar con un dominio canónico, habiéndose creado las mismas páginas con «www» y sin el prefijo por duplicado, lo que Google lee como dos contenidos idénticos.
- Tener contenido idéntico con terminaciones distintas en nuestras URLs, dominios o subdominios (por ejemplo, *.es, *.en y *eu)
- No sacar partido a la etiqueta noindex en sitios web de prueba que utilicen contenido ya posicionado en otros dominios o en el mismo, por ejemplo; entonces, llegan los crawlers de Google y ya la hemos liado…
- Mala organización del contenido: categorías, metas, contenido idéntico… El ejemplo típico son los eCommerce aquí.
Contenido duplicado externo: desde fuera… también pueden llegar problemas
Si nos dedicamos a plagiar o a copiar partes de un artículo de un tercero sin referenciar adecuadamente (o bien se realiza el proceso inverso), es probable que Google penalice a quien ha incurrido en esta práctica. Para ello, tenemos que meternos en la cabeza que Google valora mucho el contenido original, creativo y nuevo y, por supuesto, entiende que tengas que documentarte de equis temas, pero también referenciar. En este caso, para cualquier estrategia de contenidos, será mejor dar relevancia a un tercero que la merezca, que tratar de hacer la guerra por tu cuenta.
¿Qué penalizaciones impone Google al contenido duplicado?
A grandes rasgos, hay tres niveles en los que Google actuará de forma activa (entendiendo que un empleado hace algo) o pasiva (el sistema castiga una práctica) a un website con contenido duplicado.
- En primer lugar, puede omitir ciertos páginas entre los resultados de búsqueda, es decir, en las SERPs o páginas de resultados; dentro de lo malo, que lo es, esto es lo menos malo
- A continuación, si el contenido duplicado es un «te-has-pasado-tres-pueblos», el algoritmo de Google penalizará la página o páginas con contenido duplicado
- Por último, en ciertos casos de gravedad (plagio, por ejemplo), se pueden aplicar penalizaciones de forma activa.
Sin embargo, generar contenido único no es tan difícil como parece, solo requiere tiempo y esfuerzo (poca cosa, ¿ves? 😛). Buscar atajos, querer aprovecharse del trabajo de terceros o creer que vamos a engañar a Google, por ejemplo, son los principales problemas. Nada tiene que ver con leer diez artículos de un tema y generar tu propio contenido: claro que habrá temas o cuestiones que se repitan, porque da igual que te explique yo qué tipos de contenido duplicado existen u otro, que hay los que hay, ¿sabes? Pero eso no tiene que ver con el hecho de reescribir un post de un tercero y tratar de hacerlo pasar como tuyo, ¿verdad? Eso, caca. Y ahora que lo sabes, pues no lo hagas, que está muy feo.