Gestire i contenuti duplicati dal punto di vista SEO è da sempre una delle attività di ottimizzazione più impegnative. Oggi ti fornirò linee guida precise per avere controllo sui problemi generati dai contenuti duplicati.
I contenuti duplicati sono contenuti identici o molto simili tra loro, che si trovano su più pagine all’interno dello stesso sito web (contenuti duplicati interni) o su siti diversi (contenuti duplicati esterni).
Anche le pagine con contenuto scarno o assente vengono considerate come duplicate dai motori di ricerca.
Dovresti evitare i contenuti duplicati sul tuo sito per le seguenti ragioni:
Se sono disponibili diverse versioni dello stesso contenuto, è difficile per i motori di ricerca determinare quale versione vada indicizzata e mostrata in SERP.
Ciò riduce il ranking di tutte le versioni del contenuto, poiché sono in concorrenza tra loro e Google non sa quale scegliere.
Praticamente, un’eccessiva quantità di contenuti duplicati sul tuo sito ti impedirà di acquisire un traffico maggiore e peggiorerà sicuramente la visibilità organica.
La generazione di contenuti duplicati può dipendere da:
Vediamo in pratica la strategia per gestire queste casistiche.
I contenuti duplicati interni sono spesso dovuti al CMS configurato in modo errato (tema, plugin, ecc).
Di solito si tratta di errori di natura tecnica e possono comportare un peggioramento del posizionamento sui motori di ricerca.
Quindi è fondamentale saper individuare questi errori tecnici e risolverli correttamente. Vediamo quali sono gli errori più comuni.
Supponiamo che il tuo sito sia raggiungibile in protocollo Https e con il www. Praticamente il tuo dominio canonico sarà: https://www.tuodominio.it.
Se il redirect lato server non è configurato correttamente, il tuo dominio potrebbe essere raggiungibile anche tramite gli indirizzi:
In questo caso, per risolvere la duplicazione, dovrai implementare un redirect 301 delle varie versioni, che punta alla versione canonica https://www.tuodominio.it.
Google fa distinzione tra maiuscole e minuscole negli URL. Ciò significa che:
sono considerati come pagine diverse.
Dovrai quindi stare attento a non fare errori di battitura quando crei i link interni, perché ciò potrebbe causare l’indicizzazione di entrambe le versioni degli URL.
Uno slash (/) alla fine di un URL viene chiamato slash finale. Spesso gli URL sono accessibili attraverso entrambe le varianti:
Per risolvere la duplicazione, decidi quale struttura vuoi usare per i tuoi URL e scegli la migliore opzione tra queste:
Potrebbe capitare che la Home page del tuo sito sia accessibile tramite più URL a causa di una configurazione non corretta del server.
Ad esempio, oltre a https://www.tuodominio.it potrebbe essere accessibile anche tramite:
In questo caso, per risolvere la duplicazione, scegli quale URL usare per la tua Home page e poi:
I parametri URL sono le informazioni contenute nella stringa di query di un URL, dove la stringa di query è la parte dell’URL che viene dopo un punto interrogativo.
Analizziamo questo esempio: https://www.tuodominio.it/scarpe?type=sneakers. In questo caso, la stringa di query è type=sneakers.
Un parametro URL non è altro che una stringa composta da lettere, numeri e simboli.
Le stringhe di query vengono utilizzate per modificare il contenuto della pagina o per tenere traccia delle informazioni di un clic nell’URL.
Esistono due tipi di parametri URL:
Ad esempio, i parametri URL sono utilizzati dagli e commerce per gestire le opzioni di filtro di una pagina e in questo senso si rivelano molto utili per i visitatori. Tuttavia, possono causare un problema di contenuti duplicati.
Infatti, se i parametri URL non vengono gestiti correttamente, Google può eseguire la scansione e l’indicizzazione di più versioni dello stesso contenuto.
Per evitare che ciò accada, dovresti seguire queste best practices:
La tassonomia è un sistema per classificare i contenuti, che viene spesso utilizzato nei CMS per supportare categorie e tag.
Ad esempio, supponiamo che sul tuo blog hai inserito un articolo in tre categorie diverse. Il post può quindi essere accessibile tramite:
In questo esempio avrai contenuti duplicati, perché la stessa pagina è raggiungibile su URL differenti.
Per risolvere questo problema, assicurati di scegliere una categoria principale e di canonicalizzare gli URL delle altre categorie.
Alcuni CMS (come WordPress) creano pagine dedicate per ogni immagine.
Non avendo altri contenuti, queste pagine sono tutte molto simili tra loro e perciò vengono considerate da Google contenuti duplicati.
In questi casi, dovrai disabilitare la funzione che permette di creare pagine dedicate per le immagini.
In alternativa ti consiglio di aggiungere una direttiva noindex in questa tipologia di pagine.
Quando si parla di SEO per siti multilingua, possono sorgere problemi di contenuto duplicato se usiamo lo stesso identico contenuto per rivolgerci a persone di paesi diversi che parlano la stessa lingua.
Ad esempio, se gestisci un sito dedicato al mercato UK e un altro dedicato al mercato US, entrambi in lingua inglese, è probabile che vi siano molte duplicazioni di contenuto.
In questi casi, per gestire i contenuti duplicati dovrai implementare Hreflang, per indicare a Google le versioni di una pagina nella stessa lingua, ma rivolta a paesi differenti.
L’implementazione del Hreflang può avvenire tramite:
Molti siti permettono agli utenti di effettuare ricerche tramite l’apposita barra di ricerca interna.
Le pagine in cui vengono visualizzati i risultati della ricerca sono tutte molto simili tra loro e generalmente non hanno mire di posizionamento.
Per impedire l’indicizzazione delle pagine generate dalle ricerche degli utenti, dovrai utilizzare la direttiva noindex.
Inoltre, non dovrai inserire link interni verso le pagine generate dalle ricerche degli utenti.
Infine, se il tuo sito ha una grande quantità di pagine dei risultati di ricerca scansionabili, ti consiglio di usare una direttiva Disallow nel file robots.txt per impedire l’accesso ai crawler.
E’ corretto utilizzare ambienti di staging per implementare e testare nuove funzionalità su di un sito.
Allo stesso tempo, devi sempre assicurarti che l’ambiente di staging non sia accessibile e indicizzabile da parte di Google, utilizzando sempre l’autenticazione HTTP.
Quando crei una nuova pagina che contiene pochi contenuti, salvala come bozza, ma non pubblicarla.
Essendo una pagina in corso d’opera, potrebbe fornirebbe poco o nessun valore agli utenti.
Se proprio devi pubblicare pagine non terminate, impedisci ai motori di ricerca di indicizzarle inserendo una direttiva noindex.
Quando le pagine hanno una versione stampabile su un URL separato, significa che esistono due versioni dello stesso contenuto.
Considera i seguenti URL:
In questa situazione, per gestire i contenuti duplicati, dovrai implementare un rel canonical dalla pagina stampabile verso la pagina normale.
Oltre ai problemi tecnici, ci sono situazioni in cui i contenuti vengono volutamente copiati da altri siti.
Come detto in precedenza, questo modus operandi può provocare penalizzazioni da parte di Google e avere effetti negativi sul ranking. Vediamo le casistiche più comuni.
Il Boilerplate content è un tipo di contenuto utilizzato per fornire un senso di uniformità e coerenza tra le diverse pagine di un sito web.
Di solito si trova nel footer o nella sidebar e contiene tutte le informazioni standard come i dettagli di contatto, le dichiarazioni di non responsabilità, i diritti d’autore, ecc.
In ottica SEO, se il Boilerplate content rappresenta gran parte del testo della pagina, essendo presente in ogni URL, può rappresentare un problema di contenuti duplicati.
Il mio consiglio è di limitare al minimo l’utilizzo del Boilerplate content, inserendo solo le informazioni necessarie.
L’Advertising (Google Ads, Facebook Ads, ecc) richiede Landing Page dedicate a determinati annunci o parole chiave.
Le Landing Page presentano spesso testi copiati da altre pagine, che vengono leggermente modificati e adattati appunto per le keyword o altri metodi di targeting.
Poiché queste pagine risultano molto simili tra loro, sono considerate contenuti duplicati interni dai motori di ricerca.
Per impedire l’indicizzazione di queste landing page puoi implementare la direttiva noindex tramite Meta Robots o intestazione X-Robots-Tag.
Inoltre, dovresti evitare sia di inserire link interni verso queste landing page, sia di includerle nella Sitemap XML.
Se copi il testo per le tue pagine da altri siti, stai producendo contenuto duplicato a forte rischio di penalizzazione.
Google ha spiegato come gestire al meglio questo tipo di situazione dal punto di vista SEO:
In ogni caso, ti consiglio di chiedere sempre l’autorizzazione prima di utilizzare i contenuti altrui.
Può succedere che i tuoi contenuti siano copiati e poi pubblicati su altri siti (in questo caso si parla di duplicati esterni).
Questo potrebbe rivelarsi un problema se il tuo sito ha una domain authority bassa rispetto al dominio che ti copia i contenuti.
Infatti, dato che i siti con domain authority elevata vengono sottoposti a scansione più frequentemente, corri il rischio che il sito che copia venga indicizzato prima da Google e percepito, quindi, come l’autore originale del contenuto in questione.
Assicurati sempre che gli altri siti ti accreditino come autore originale tramite un link diretto alla tua pagina.
Se non sono disposti ad inserire il link, ti consiglio di inviare una richiesta DMCA a Google oppure intraprendere azioni legali (soprattutto quando si è vittima di negative SEO).
Tramite il tool Siteliner puoi facilmente individuare i contenuti duplicati all’interno di un sito.
Ti basterà inserire l’URL del tuo dominio nella barra di ricerca di Siteliner e avviare la scansione.
L’alternativa, a mio parere migliore, è quella di utilizzare la funzione di verifica contenuti duplicati di Screaming Frog.
Dovrai andare nelle configurazioni del tool al seguente percorso: Configuration > Content > Duplicates.
E’ veramente potente e ti consente di stabilire la percentuale di duplicazione che ritieni non tollerabile.
La sezione Content Quality all’interno del report sulle pagine interne del SEO Audit di Ahrefs, verifica anche la presenza di duplicati.
Se devi verificare un sito di piccole dimensioni, puoi provare a cercare su Google frasi tratte dai suoi articoli utilizzando gli operatori virgolette (“”).
Ad esempio, se vuoi verificare se esistono altre pagine online che presentano lo stesso contenuto di questo articolo, puoi selezionare questa frase e cercarla su Google tra virgolette (come nell’immagine che segue).
Se devi analizzare un sito di grandi dimensioni, puoi utilizzare Copyscape un servizio che ti permette di verificare la presenza di più occorrenze dello stesso contenuto.
E’ sufficiente inserire l’URL della pagina da verificare nel box di ricerca e il tool trova le copie presenti in rete.
Altri siti simili a Copyscape per individuare contenuti copiati da altri siti sono:
La risposta a questa domanda dipende dal caso specifico.
Tuttavia, se vuoi che il tuo sito si posizioni bene, devi ridurre al minimo i contenuti simili o identici pubblicati su più pagine.
Devi assicurarti che il contenuto di ogni pagina sia utile per i visitatori e non sia copiato da altre risorse online.
Si, se risolvi i problemi relativi ai contenuti duplicati, Googlebot non dedicherà crawl budget alle pagine duplicate e potrà concentrarsi solo sulle pagine che ospitano un contenuto originale e pertinente.
Se copi intenzionalmente i contenuti da altri siti per migliorare il ranking e il traffico, rischi di penalizzazioni sono elevati.
Google, attraverso Panda, penalizza tutti quelle pagine che sono deliberatamente duplicate su vari domini con lo scopo di manipolare i risultati di ricerca.
Se non hai copiato intenzionalmente i contenuti, ma ciononostante risultano molti duplicati sul tuo sito, i rischi di penalizzazione sono minori, ma comunque avrai poca visibilità.
Se vuoi posizionare le pagine del tuo sito, devono avere contenuti unici e che forniscono una buona esperienza all’utente.
Il modo migliore per posizionarti su Google è quello di investire in contenuti di qualità, originali e utili per i tuoi utenti.
Oggi abbiamo visto diversi esempi di contenuti duplicati interni / esterni e le strategie per gestire correttamente ogni problema che causano dal punto di vista SEO.
L’algoritmo di Google sta diventando sempre più intelligente e l’obiettivo di una consulente SEO è di ridurre al minimo la presenza di contenuti simili dati in pasto ai motori di ricerca.
Ti consiglio di valutare servizi SEO professionali per gestire correttamente ogni aspetto di ottimizzazione e le problematiche causate dai duplicati.
Hai dubbi o domande su questa guida? Non esitare ad utilizzare i commenti.
Ottieni l’accesso a guide, strategie e tutorial esclusivi che non condivido da nessun’altra parte.
Sottoscrivo la Privacy Policy di Valentino Mea. Sottoscrivendo acconsenti a ricevere informazioni e offerte riservate. Rispettiamo la tua privacy, i tuoi dati sono al sicuro e non saranno mai ceduti a terzi.
Vuoi sviluppare un business online di successo o vuoi essere formato anche tu ad alti livelli?
Copyright © 2013 - 2023 · Valentino Mea Srls rating 5.0/5 su 22 recensioni · C.F. / P.iva: 04373930611 · Privacy Policy · Cookie Policy · Sitemap · All rights reserved
Lascia un commento