Contenuti Duplicati SEO: la Guida Completa

Contenuti Duplicati SEO

Gestire i contenuti duplicati dal punto di vista SEO è da sempre una delle attività di ottimizzazione più impegnative. Oggi ti fornirò linee guida precise per avere controllo sui problemi generati dai contenuti duplicati.

Indice della guida Contenuti Duplicati SEO:


Cosa sono i contenuti duplicati: definizione

I contenuti duplicati sono contenuti identici o molto simili tra loro, che si trovano su più pagine all’interno dello stesso sito web (contenuti duplicati interni) o su siti diversi (contenuti duplicati esterni).

Anche le pagine con contenuto scarno o assente vengono considerate come duplicate dai motori di ricerca.

Perché i contenuti duplicati danneggiano la SEO?

Dovresti evitare i contenuti duplicati sul tuo sito per le seguenti ragioni:

  • Confondono i motori di ricerca, provocando un impatto negativo sull’indicizzazione;
  • Potrebbero danneggiare il posizionamento, provocando una penalizzazione da Google Panda;
  • Google avrà difficoltà a definire le metriche di autorevolezza, pertinenza e link equity per il contenuto, soprattutto quando altri siti esterni linkano più pagine con contenuto duplicato interno.

Se sono disponibili diverse versioni dello stesso contenuto, è difficile per i motori di ricerca determinare quale versione vada indicizzata e mostrata in SERP.

Ciò riduce il ranking di tutte le versioni del contenuto, poiché sono in concorrenza tra loro e Google non sa quale scegliere.

Praticamente, un’eccessiva quantità di contenuti duplicati sul tuo sito ti impedirà di acquisire un traffico maggiore e peggiorerà sicuramente la visibilità organica.

Le cause più comuni di contenuti duplicati

La generazione di contenuti duplicati può dipendere da:

  • un problema tecnico;
  • contenuti volutamente copiati sulle proprie pagine;
  • contenuti copiati su siti esterni.

Vediamo in pratica la strategia per gestire queste casistiche.

Presenza di contenuti duplicati causati da motivi tecnici

I contenuti duplicati interni sono spesso dovuti al CMS configurato in modo errato (tema, plugin, ecc).

Di solito si tratta di errori di natura tecnica e possono comportare un peggioramento del posizionamento sui motori di ricerca.

Quindi è fondamentale saper individuare questi errori tecnici e risolverli correttamente. Vediamo quali sono gli errori più comuni.

Versioni separate WWW vs NO WWW e HTTP vs HTTPs

Supponiamo che il tuo sito sia raggiungibile in protocollo Https e con il www. Praticamente il tuo dominio canonico sarà: https://www.tuodominio.it.

Se il redirect lato server non è configurato correttamente, il tuo dominio potrebbe essere raggiungibile anche tramite gli indirizzi:

  • http://www.tuodominio.it (senza https)
  • http://tuodominio.it (senza https e www)
  • https://tuodominio.it (senza www)

Redirect 301 versioni Dominio

In questo caso, per risolvere la duplicazione, dovrai implementare un redirect 301 delle varie versioni, che punta alla versione canonica https://www.tuodominio.it.

Varianti degli URL maiuscole/minuscole

Google fa distinzione tra maiuscole e minuscole negli URL. Ciò significa che:

  • https://www.tuodominio.it/url-a/ (minuscolo)
  • https://www.tuodominio.it/URL-A/ (maiuscolo)

sono considerati come pagine diverse.

Esempio URL duplicati minuscolo e maiuscolo

Dovrai quindi stare attento a non fare errori di battitura quando crei i link interni, perché ciò potrebbe causare l’indicizzazione di entrambe le versioni degli URL.

URL con e senza slash finali

Uno slash (/) alla fine di un URL viene chiamato slash finale. Spesso gli URL sono accessibili attraverso entrambe le varianti:

  • https://www.tuodominio.it/url-a (senza slash finale)
  • https://www.tuodominio.it/url-a/ (con slash finale)

Per risolvere la duplicazione, decidi quale struttura vuoi usare per i tuoi URL e scegli la migliore opzione tra queste:

  • configura un redirect 301 dalle versioni alternative verso l’URL corretto;
  • oppure inserisci un rel canonical indicando la versione che ritieni corretta.

Home page raggiungibile con più URL

Potrebbe capitare che la Home page del tuo sito sia accessibile tramite più URL a causa di una configurazione non corretta del server.

Ad esempio, oltre a https://www.tuodominio.it potrebbe essere accessibile anche tramite:

  • https://www.tuodominio.it/index.html;
  • https://www.tuodominio.it/index.php;
  • https://www.tuodominio.it/index.asp;
  • https://www.tuodominio.it/index.aspx.

In questo caso, per risolvere la duplicazione, scegli quale URL usare per la tua Home page e poi:

  • reindirizza gli altri URL verso quello principale con un redirect 301;
  • oppure implementare nel codice sorgente il rel canonical indicando la versione corretta.

Parametri URL

I parametri URL sono le informazioni contenute nella stringa di query di un URL, dove la stringa di query è la parte dell’URL che viene dopo un punto interrogativo.

Analizziamo questo esempio: https://www.tuodominio.it/scarpe?type=sneakers. In questo caso, la stringa di query è type=sneakers.

Un parametro URL non è altro che una stringa composta da lettere, numeri e simboli.

Le stringhe di query vengono utilizzate per modificare il contenuto della pagina o per tenere traccia delle informazioni di un clic nell’URL.

Esistono due tipi di parametri URL:

  • Parametri URL attivi: modificano il contenuto della pagina.
  • Parametri URL passivi: sono utilizzati a scopi di monitoraggio e non cambiano il contenuto della pagina.

Ad esempio, i parametri URL sono utilizzati dagli e commerce per gestire le opzioni di filtro di una pagina e in questo senso si rivelano molto utili per i visitatori. Tuttavia, possono causare un problema di contenuti duplicati.

Infatti, se i parametri URL non vengono gestiti correttamente, Google può eseguire la scansione e l’indicizzazione di più versioni dello stesso contenuto.

Per evitare che ciò accada, dovresti seguire queste best practices:

  • Indica a Google quale versione della tua pagina va indicizzata tramite rel canonical;
  • Utilizza la funzionalità di gestione dei parametri di Google Search Console e Bing Webmaster Tools per istruire i crawler su come gestire i parametri;
  • Ottimizza il file robots.txt: puoi impedire ai robot di eseguire la scansione di determinate sezioni del tuo sito (ad esempio: Disallow: /vestiti/*?);
  • Utilizza un correttamente i link interni, linkando sempre al versione canonica dell’URL e mai la versione parametrica.

Tassonomie

La tassonomia è un sistema per classificare i contenuti, che viene spesso utilizzato nei CMS per supportare categorie e tag.

Ad esempio, supponiamo che sul tuo blog hai inserito un articolo in tre categorie diverse. Il post può quindi essere accessibile tramite:

  • https://www.tuodominio.it/categoria-a/post/;
  • https://www.tuodominio.it/categoria-b/post/;
  • https://www.tuodominio.it/categoria-c/post/.

In questo esempio avrai contenuti duplicati, perché la stessa pagina è raggiungibile su URL differenti.

Per risolvere questo problema, assicurati di scegliere una categoria principale e di canonicalizzare gli URL delle altre categorie.

Pagine dedicate alle Immagini

Alcuni CMS (come WordPress) creano pagine dedicate per ogni immagine.

Non avendo altri contenuti, queste pagine sono tutte molto simili tra loro e perciò vengono considerate da Google contenuti duplicati.

In questi casi, dovrai disabilitare la funzione che permette di creare pagine dedicate per le immagini.

In alternativa ti consiglio di aggiungere una direttiva noindex in questa tipologia di pagine.

Versioni localizzate delle pagine

Quando si parla di SEO per siti multilingua, possono sorgere problemi di contenuto duplicato se usiamo lo stesso identico contenuto per rivolgerci a persone di paesi diversi che parlano la stessa lingua.

Ad esempio, se gestisci un sito dedicato al mercato UK e un altro dedicato al mercato US, entrambi in lingua inglese, è probabile che vi siano molte duplicazioni di contenuto.

In questi casi, per gestire i contenuti duplicati dovrai implementare Hreflang, per indicare a Google le versioni di una pagina nella stessa lingua, ma rivolta a paesi differenti.

L’implementazione del Hreflang può avvenire tramite:

  • Tag HTML;
  • Intestazioni HTTP
  • Sitemap XML.

Pagine dei risultati di ricerca

Molti siti permettono agli utenti di effettuare ricerche tramite l’apposita barra di ricerca interna.

Le pagine in cui vengono visualizzati i risultati della ricerca sono tutte molto simili tra loro e generalmente non hanno mire di posizionamento.

Per impedire l’indicizzazione delle pagine generate dalle ricerche degli utenti, dovrai utilizzare la direttiva noindex.

Inoltre, non dovrai inserire link interni verso le pagine generate dalle ricerche degli utenti.

Infine, se il tuo sito ha una grande quantità di pagine dei risultati di ricerca scansionabili, ti consiglio di usare una direttiva Disallow nel file robots.txt per impedire l’accesso ai crawler.

Ambiente di staging / test indicizzabile

E’ corretto utilizzare ambienti di staging per implementare e testare nuove funzionalità su di un sito.

Allo stesso tempo, devi sempre assicurarti che l’ambiente di staging non sia accessibile e indicizzabile da parte di Google, utilizzando sempre l’autenticazione HTTP.

Contenuti in corso d’opera

Quando crei una nuova pagina che contiene pochi contenuti, salvala come bozza, ma non pubblicarla.

Essendo una pagina in corso d’opera, potrebbe fornirebbe poco o nessun valore agli utenti.

Se proprio devi pubblicare pagine non terminate, impedisci ai motori di ricerca di indicizzarle inserendo una direttiva noindex.

Versione stampabile

Quando le pagine hanno una versione stampabile su un URL separato, significa che esistono due versioni dello stesso contenuto.

Considera i seguenti URL:

  • https://www.tuodominio.it/pagina/ (pagina normale);
  • https://www.tuodominio.it/stampa/pagina/ (pagina stampabile).

In questa situazione, per gestire i contenuti duplicati, dovrai implementare un rel canonical dalla pagina stampabile verso la pagina normale.

Presenza di contenuti duplicati causati da contenuti copiati

Oltre ai problemi tecnici, ci sono situazioni in cui i contenuti vengono volutamente copiati da altri siti.

Come detto in precedenza, questo modus operandi può provocare penalizzazioni da parte di Google e avere effetti negativi sul ranking. Vediamo le casistiche più comuni.

Boilerplate content

Il Boilerplate content è un tipo di contenuto utilizzato per fornire un senso di uniformità e coerenza tra le diverse pagine di un sito web.

Di solito si trova nel footer o nella sidebar e contiene tutte le informazioni standard come i dettagli di contatto, le dichiarazioni di non responsabilità, i diritti d’autore, ecc.

In ottica SEO, se il Boilerplate content rappresenta gran parte del testo della pagina, essendo presente in ogni URL, può rappresentare un problema di contenuti duplicati.

Il mio consiglio è di limitare al minimo l’utilizzo del Boilerplate content, inserendo solo le informazioni necessarie.

Landing Page per Advertising

L’Advertising (Google Ads, Facebook Ads, ecc) richiede Landing Page dedicate a determinati annunci o parole chiave.

Le Landing Page presentano spesso testi copiati da altre pagine, che vengono leggermente modificati e adattati appunto per le keyword o altri metodi di targeting.

Poiché queste pagine risultano molto simili tra loro, sono considerate contenuti duplicati interni dai motori di ricerca.

Per impedire l’indicizzazione di queste landing page puoi implementare la direttiva noindex tramite Meta Robots o intestazione X-Robots-Tag.

Inoltre, dovresti evitare sia di inserire link interni verso queste landing page, sia di includerle nella Sitemap XML.

Testo copiato da altri siti

Se copi il testo per le tue pagine da altri siti, stai producendo contenuto duplicato a forte rischio di penalizzazione.

Google ha spiegato come gestire al meglio questo tipo di situazione dal punto di vista SEO:

  • dovrai linkare la fonte originale;
  • in alternativa implementare un rel canonical verso la fonte originale;
  • oppure inserire una direttiva noindex nella pagina che contiene il contenuto duplicato;

In ogni caso, ti consiglio di chiedere sempre l’autorizzazione prima di utilizzare i contenuti altrui.

Contenuti copiati su siti esterni

Può succedere che i tuoi contenuti siano copiati e poi pubblicati su altri siti (in questo caso si parla di duplicati esterni).

Questo potrebbe rivelarsi un problema se il tuo sito ha una domain authority bassa rispetto al dominio che ti copia i contenuti.

Verificare Domain Authority

Infatti, dato che i siti con domain authority elevata vengono sottoposti a scansione più frequentemente, corri il rischio che il sito che copia venga indicizzato prima da Google e percepito, quindi, come l’autore originale del contenuto in questione.

Assicurati sempre che gli altri siti ti accreditino come autore originale tramite un link diretto alla tua pagina.

Se non sono disposti ad inserire il link, ti consiglio di inviare una richiesta DMCA a Google oppure intraprendere azioni legali (soprattutto quando si è vittima di negative SEO).

Come trovare contenuti duplicati e copiati

Individuare i contenuti duplicati interni

Siteliner

Tramite il tool Siteliner puoi facilmente individuare i contenuti duplicati all’interno di un sito.

Ti basterà inserire l’URL del tuo dominio nella barra di ricerca di Siteliner e avviare la scansione.

Trovare contenuti duplicati con Siteliner

Screaming Frog

L’alternativa, a mio parere migliore, è quella di utilizzare la funzione di verifica contenuti duplicati di Screaming Frog.

Dovrai andare nelle configurazioni del tool al seguente percorso: Configuration > Content > Duplicates.

Trovare contenuti duplicati con Screaming Frog

E’ veramente potente e ti consente di stabilire la percentuale di duplicazione che ritieni non tollerabile.

Ahref Content Quality

La sezione Content Quality all’interno del report sulle pagine interne del SEO Audit di Ahrefs, verifica anche la presenza di duplicati.

Trovare contenuti duplicati con Ahrefs

Trovare i contenuti duplicati esterni

Operatori di ricerca

Se devi verificare un sito di piccole dimensioni, puoi provare a cercare su Google frasi tratte dai suoi articoli utilizzando gli operatori virgolette (“”).

Ad esempio, se vuoi verificare se esistono altre pagine online che presentano lo stesso contenuto di questo articolo, puoi selezionare questa frase e cercarla su Google tra virgolette (come nell’immagine che segue).

Trovare contenuti copiati con gli Operatori di Ricerca

Copyscape

Se devi analizzare un sito di grandi dimensioni, puoi utilizzare Copyscape un servizio che ti permette di verificare la presenza di più occorrenze dello stesso contenuto.

E’ sufficiente inserire l’URL della pagina da verificare nel box di ricerca e il tool trova le copie presenti in rete.

Trovare contenuti duplicati con Copyscape

Alternative a Copyscape

Altri siti simili a Copyscape per individuare contenuti copiati da altri siti sono:

Domande e risposte sui contenuti duplicati

Quanto contenuto duplicato è accettabile su un sito?

La risposta a questa domanda dipende dal caso specifico.

Tuttavia, se vuoi che il tuo sito si posizioni bene, devi ridurre al minimo i contenuti simili o identici pubblicati su più pagine.

Devi assicurarti che il contenuto di ogni pagina sia utile per i visitatori e non sia copiato da altre risorse online.

Se risolvo i problemi relativi a contenuti duplicati, il mio sito si posizionerà meglio su Google?

Si, se risolvi i problemi relativi ai contenuti duplicati, Googlebot non dedicherà crawl budget alle pagine duplicate e potrà concentrarsi solo sulle pagine che ospitano un contenuto originale e pertinente.

Esiste una penalizzazione per i contenuti duplicati?

Se copi intenzionalmente i contenuti da altri siti per migliorare il ranking e il traffico, rischi di penalizzazioni sono elevati.

Google, attraverso Panda, penalizza tutti quelle pagine che sono deliberatamente duplicate su vari domini con lo scopo di manipolare i risultati di ricerca.

Se non hai copiato intenzionalmente i contenuti, ma ciononostante risultano molti duplicati sul tuo sito, i rischi di penalizzazione sono minori, ma comunque avrai poca visibilità.

Se vuoi posizionare le pagine del tuo sito, devono avere contenuti unici e che forniscono una buona esperienza all’utente.

Ultime considerazioni sui contenuti duplicati

Il modo migliore per posizionarti su Google è quello di investire in contenuti di qualità, originali e utili per i tuoi utenti.

Oggi abbiamo visto diversi esempi di contenuti duplicati interni / esterni e le strategie per gestire correttamente ogni problema che causano dal punto di vista SEO.

L’algoritmo di Google sta diventando sempre più intelligente e l’obiettivo di una consulente SEO è di ridurre al minimo la presenza di contenuti simili dati in pasto ai motori di ricerca.

Ti consiglio di valutare servizi SEO professionali per gestire correttamente ogni aspetto di ottimizzazione e le problematiche causate dai duplicati.

Hai dubbi o domande su questa guida? Non esitare ad utilizzare i commenti.

Iscriviti alla Newsletter!

Ottieni l’accesso a guide, strategie e tutorial esclusivi che non condivido da nessun’altra parte.

Sottoscrivo la Privacy Policy di Valentino Mea. Sottoscrivendo acconsenti a ricevere informazioni e offerte riservate. Rispettiamo la tua privacy, i tuoi dati sono al sicuro e non saranno mai ceduti a terzi.

Libro SEO per E-Commerce PRO di Valentino Mea

Libro SEO per E-Commerce PRO

Valentino Mea

  • Esperto di Search Marketing dal 2009 con migliaia di progetti SEO e Google Ads dimostrabili gestiti.
  • Supporta Aziende nazionali e internazionali nello sviluppare business sostenibili e redditizi, tramite il Marketing sui Motori di Ricerca.
  • Ad oggi ha formato 932 consulenti SEO e Google Ads, autonomi e dipendenti.
  • Autore di “SEO per E-commerce PRO” il Libro Best Seller su come ottimizzare siti e-commerce per aumentare il posizionamento su Google e trasformare gli utenti in clienti. Puoi trovarlo su Amazon.
  • Ideatore del Video Corso “Diventare SEO” il 1° corso in Italia che insegna in modo pratico la SEO e come monetizzare le competenze.
  • Fondatore della SEO Membership® l’unica community privata dove si incontrano ogni settimana imprenditori, colleghi e aspiranti per discutere di SEO e business online.
  • Dal Novembre 2013 condivide tutorial pratici e la sua esperienza nel settore su questo blog.

Vuoi sviluppare un business online di successo o vuoi essere formato anche tu ad alti livelli?

Richiedi Informazioni

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Copyright © 2013 - 2023 · Valentino Mea Srls rating 5.0/5 su 22 recensioni · C.F. / P.iva: 04373930611 · Privacy Policy · Cookie Policy · Sitemap · All rights reserved