I contenuti duplicati sono blocchi di testo, immagini o altri elementi di un sito web, che sono identici o molto simili. Questa duplicazione può verificarsi all’interno di una singola pagina, tra pagine diverse dello stesso sito e anche su siti web differenti.
I contenuti duplicati possono essere contenuti identici o molto simili e possono essere creati intenzionalmente o accidentalmente. Per questo motivo esistono strumenti e metodologie per evitare che questa pratica penalizzi la vostra visibilità sui motori di ricerca.
Uno dei pilastri fondamentali per il successo di una strategia SEO, è la presenza di contenuti unici e originali. Tuttavia, i contenuti duplicati sono una minaccia in grado di mettere a repentaglio la visibilità e l’autorità del tuo sito web.
Per questo motivo, i contenuti duplicati sono un argomento che va necessariamente tenuto in considerazione per ottimizzare la propria strategia. Nonostante Google li citi da ormai parecchi anni, questi contenuti continuano ad essere presenti all’interno dei siti web.
In questo articolo descriveremo il concetto di contenuti duplicati, definendo essi possono presentarsi, quali sono i rischi e come è possibile mitigarne gli effetti negativi e ottimizzare la tua presenza online.
Descriveremo poi come i motori di ricerca valutano la qualità dei contenuti e quali strumenti hai a disposizione per individuare i contenuti duplicati.
Indice
1. Cosa sono i contenuti duplicati nella SEO?
2. Cosa dice Google sui contenuti duplicati?
3. Contenuti duplicati interni ed esterni
4. Contenuti duplicati: come possono generarsi
5. Contenuti duplicati: come gestirli
Cosa sono i contenuti duplicati nella SEO?
La Guida di Search Console di Google, fornisce una descrizione di contenuti duplicati, definendoli come segue:
“Il termine “Contenuti Duplicati”, si riferisce generalmente a blocchi considerevoli di contenuti all’interno o tra i domini che sono identici o molto simili. In genere, questa pratica non è all’origine ingannevole.” - Guida di Search Console
In altre parole, i contenuti duplicati sono porzioni o blocchi di testo identici presenti in pagine aventi diversi URL. La duplicazione può essere presente sia all’interno di una stessa pagina, che all’interno di pagine dello stesso sito o in siti web differenti.
Un contenuto duplicato SEO può essere il risultato della pubblicazione di contenuti identici su pagine diverse, contenuti del tuo sito web pubblicati su altri siti oppure attraverso contenuti identici che hanno URL molto simili.
Oltre al plagio di testi presi da altri siti web, che chiaramente creano un contenuto duplicato, questi possono anche verificarsi in altre situazioni legate agli URL della pagina. Alcuni esempi sono gli URL parametrici, versioni diverse del sito web e boilerplate content.
Nei paragrafi successivi esamineremo tutte queste casistiche. Ecco alcuni esempi per capire di cosa stiamo parlando:
URL parametrici
Gli URL parametrici sono URL che contengono parametri o variabili che vengono utilizzati per personalizzare la visualizzazione di una pagina. Questi parametri sono solitamente contenuti nella stringa di query di un URL e seguono il simbolo “?”.
I motori di ricerca potrebbero interpretare queste pagine come contenuti duplicati, con potenziali conseguenze negative per il posizionamento sui motori di ricerca.
Versioni diverse del sito web
Cosa sono le versioni diverse dello stesso sito wewb? Può capitare che un sito web sia presente sia come www.dominio.it che come dominio.it, ciò porterà a pagine duplicate. Lo stesso ragionamento vale per pagine presenti sia in versione http:// che in versione https://, oppure nel caso in cui un URL termini con / alla fine o senza.
Boilerplate content
Spesso le sezioni della sidebar e il footer di fondo pagina contengono contenuti identici. Questo può essere un problema, soprattutto per le pagine che hanno poco testo. Google potrebbe identificare queste pagine come contenuti duplicati, e potrebbe essere necessario diversificarle per non correre questo rischio.
Cosa dice Google sui contenuti duplicati?
Cosa dicono nel quartier generale di Google sui contenuti duplicati? Ecco tre video interessanti che ci permettono di vedere la prospettiva di Google, sia per comprendere esattamente perché le duplicazioni dei contenuti penalizzano il tuo sito che per capire come gestire al meglio il sito web per evitare questo errore.
Cominciamo da un'analisi di 14 anni fa, fatta da Greg Grothaus, che spiega come Google vede e reagisce ai contenuti doppi, soprattutto quando si trovano su vari siti diversi e non sono duplicati solamente all'interno di un solo sito web. Questo video dettaglia molto bene le prime mosse che Google ha fatto per premiare l'unicità dei contenuti.
Gary Taylor, esperto di Google, spiega in questo video di 10 anni fa come Google gestisce i contenuti duplicati, quali sono le penalizzazioni per i siti che hanno contenuti duplicati e come questi influenzano il posizionamento di un sito web.
L'ultimo video pubblicato da Google sui contenuti duplicati è del 2021, parte della serie "Sustainable Monetized Websites". Questo video spiega chiaramente come i contenuti duplicati hanno effetto su un sito web, come prevenire i contenuti duplicati interni ed esterni e, soprattutto, come i contenuti unici possono davvero portare valore agli utenti.
Contenuti duplicati interni ed esterni
È possibile individuare due tipologie di contenuti duplicati, ovvero i contenuti duplicati interni e i contenuti duplicati esterni.
La duplicazione interna si riferisce alla presenza di un contenuto duplicato all’interno dello stesso sito web. Questo si verifica attraverso variazioni di URL, sessioni duplicate, o pagine con lo stesso contenuti.
I contenuti duplicati interni sono perciò limitati a livello di dominio. Essi si verificano spesso all’interno degli e-commerce, quando le pagine relative ai prodotti sono accessibili sono accessibili senza che la categoria o il prodotto si trovino all’interno dell’indirizzo.
Ecco un esempio:
- https://www.dominio.com/categoria/paginamerce/paginadettagliomerce
- https://www.dominio.com/paginadettagliomerce
Può capitare che le due pagine vengano entrambe indicizzate. Questo può capitare quando non viene sviluppata una buona strategia di link building interna o quando entrambi gli URL ricevono link provenienti dall’esterno, come spesso succede negli e-commerce.
La duplicazione esterna si verifica quando lo stesso contenuto appare su siti web diversi. Ciò può essere causato da siti web che copiano informazioni senza autorizzazione, da pratiche di syndication, quando lo stesso contenuto viene pubblicato su più siti, oppure quando un sito web è disponibile in più versioni linguistiche.
I contenuti duplicati esterni sono “domain overlapping, ovvero riguardano domini diversi. Un esempio molto diffuso riguarda i siti web che possono essere raggiunti da più nomi di dominio.
In questo caso, i bot di Google si trovano di fronte a domini diversi con lo stesso contenuto senza riuscire a determinare la rilevanza delle diverse pagine e portando a problemi di indicizzazione.
La soluzione a questi problemi è quella di indirizzare tutte le versioni al dominio principale, utilizzando un URL Redirect 301.
Contenuti duplicati: come possono generarsi
Come abbiamo già anticipato nei paragrafi precedenti, esistono diverse cause che potrebbero portare ad avere dei contenuti duplicati all’interno di un sito web. Eccone alcune:
1. Plagio o testi copiati
Copiare contenuti provenienti da altre fonti, oppure da pagine interne del vostro sito web, può generare dei contenuti duplicati. Google ha a propria disposizione degli strumenti che gli permettono di individuare queste situazioni ed agire penalizzando il posizionamento SEO. Per risolvere questo problema è sufficiente creare dei contenuti originali, sia nel caso di testo che di immagini.
E nel caso in cui è necessario "copiare" per forza? Molti siti web devono inserire contenuti obbligatoriamente identici a contenuti già esistenti sul web. Facciamo l'esempio di aziende di Finanza Agevolata, che devono inserire normative e citazioni per fornire dettagli sui bandi disponibili. Ecco perché è possibile comunicare a Google, inserendo un link in uscita, che un contenuto inserito in un tag <blockquote></blockquote>
è una citazione e non un plagio.
2. Versioni diverse del sito web
Possono esistere diverse versioni delle pagine di un sito web. Se non esiste redirect 301 tra le diverse versioni di un sito web, il sito può essere raggiunto sia nella versione HTTP e HTTPS, oppure nella versione www e non www.
È possibile impostare un redirect utilizzando il file .httaccess oppure attraverso appositi plugin messi a disposizione dai CMS.
3. URL con parametri
L’utilizzo di parametri all’interno degli URL, per gestire le sessioni utente, gli ordinamenti, filtri o scopi di tracciamento, può portare a molteplici versioni di una pagina. I contenuti che non hanno alcun impatto sul contenuto possono essere ignorati inserendo un link canonical nella sezione
, specificando in questo modo qual è la versione principale.4. Thin Content
I Thin Content, o contenuti scarni, sono pagine web che contengono una quantità limitata o insignificante di contenuto rilevante per gli utenti e solitamente riprendono sezioni del sito già pubblicate in altri URL.
Alcuni esempi sono gli archivi dei CMS come tag, autori e date. Il nostro consiglio è quello di arricchire queste pagine con contenuti originali, oppure inserire il meta tag “noindex, follow”.
5. Boilerplate content (o footer mal gestiti)
Il boilerplate content è il contenuto presente negli header, footer e sidebar dei siti web. Queste sezioni sono spesso inserite all’interno della maggior parte delle pagine di un sito e, se le pagine in questione non hanno molto contenuto, possono rappresentare buona parte del testo della pagina, portando Google a leggere questi come contenuti duplicati.
Una soluzione può essere quella di inserire delle variazioni a questi elementi nelle diverse sezioni del sito. Oppure è possibile intervenire alla radice, evitando di creare pagine troppo brevi, che non possiedono contenuti originali: una certa percentuale di boilerplate content è infatti considerata "normale" da Google, abituato a Footer e Sidebar nei siti web.
Contenuti duplicati: come gestirli
Per risolvere il problema dei contenuti doppi o copiati e migliorare la SEO del tuo sito web, è possibile adottare diverse strategie e soluzioni. Eccone alcune:
Utilizzo del Tag Canonical
Implementando correttamente il tag <link rel="canonical">
nelle pagine del tuo sito web, puoi indicare a Google la versione “originale” di una pagina. In questo modo indicherai l’URL da considerare come versione principale e le eventuali varianti da non considerare durante una scansione.
Gestione dei parametri
È importante gestire gli URL parametrici, utilizzando nel modo corretto i tag ed evitando la presenza di contenuti duplicati.
In passato, Google Search Console metteva a disposizione degli esperti SEO la sezione “Parametri URL”, dove era possibile gestire le funzionalità dei diversi parametri. Oggi Google ha rimosso questo strumento e non è più necessario specificare la funzione dei parametri URL, poiché i crawler di Google impareranno a gestire i parametri URL automaticamente.
Redirect 301
Effettuando un redirect 301 dal file .httaccess, puoi consolidare diverse versioni di un URL che conducono allo stesso risultato. In questo modo, tutte le versioni porteranno all’URL principale, evitando problemi di duplicazione e sprechi di crawl budget.
Rel Alternate
In certi casi potrebbero essere presenti diverse versioni del sito, come nel caso di contenuti mobile o multilingua. Il rel=”alternate” serve a indicare a Google che questi non sono contenuti duplicati, ma versioni della stessa pagina.
Creazione di contenuti originali
Creare dei contenuti originali, evitando di copiare contenuti da altre fonti o ripetendo lo stesso contenuti in più pagine del tuo sito web, è fondamentale per evitare contenuti duplicati.
Perciò, concentra i tuoi sforzi nella creazione di contenuti unici, informativi e di valore. In questo modo Google premierà i tuoi sforzi.
Analisi e monitoraggio continuo
Utilizza strumenti di analisi e monitoraggio, come Google Search Console, per individuare tempestivamente problemi legati ai contenuti duplicati e risolvendoli rapidamente.
Come Google penalizza i contenuti duplicati
Partiamo col dire che i contenuti duplicati, sia interni che esterni, non forniscono alcun valore aggiunto all’esperienza utente.
Tuttavia, le questioni relative ai contenuti duplicati creano spesso confusione tra i professionisti SEO. Inizialmente Google, in un video del 2013 di Matt Cutts, affermò che “Google non tratta i contenuti duplicati come spam".
Questo significa che non esiste una vera e propria penalizzazione per i contenuti duplicati, ma è comunque consigliato evitare queste situazioni. Se il contenuto ha l’intento di manipolare il ranking, il tuo sito potrebbe subire conseguenze in termini di indicizzazione.
“Nei rari casi in cui ci accorgiamo che i contenuti duplicati potrebbero essere visualizzati con l'intento di manipolare i nostri ranking e ingannare i nostri utenti, apportiamo le necessarie modifiche all'indicizzazione e al ranking dei siti interessati. Di conseguenza, il ranking dei siti potrebbe peggiorare oppure i siti potrebbero essere rimossi completamente dall'indice Google e non compariranno più nei risultati di ricerca.” - Guida di Google Search Console
Le logiche di Google hanno senso, poiché diverse ricerche hanno dimostrato che circa un terzo delle pagine presenti sul web presenta contenuti duplicati e penalizzare tutte queste pagine avrebbe conseguenze molto pesanti.
Tuttavia, l’obiettivo di Google è quello di fornire ai suoi utenti la miglior esperienza possibile, evitando di mostrare contenuti duplicati o poco rilevanti. Se perciò vengono individuati contenuti duplicati significativi su diverse pagine, Google potrebbe penalizzare il posizionamento del sito web sui motori di ricerca.
Allo stesso tempo, gli utenti vogliono avere a disposizione una diversità di contenuti e non lo stesso contenuto riproposto su diversi domini. Per garantire la miglior esperienza possibile agli utenti è perciò importante limitare al minimo i contenuti duplicati.
Come individuare i contenuti duplicati
Esistono diversi strumenti che permettono di verificare la presenza di contenuti duplicati interni ed esterni ad un sito web.
Per ricercare i contenuti duplicati esterni, uno degli strumenti maggiormente diffusi è Copyscape, un tool antiplagio che individua i contenuti duplicati. Un’altra soluzione, che richiede però più lavoro, è la ricerca diretta su Google.
Cercando sul motore di ricerca la parte di testo che pensiamo possa essere duplicata, inserendola tra virgolette, è possibile scoprire se quel contenuto è effettivamente presente su altri siti.