Seo  

Contenuti Duplicati & SEO: Conoscerli per sconfiggerli

Cosa sono i contenuti duplicati?

Partiamo con una definizione di contenuti duplicati. Essenzialmente un contenuto duplicato è un contenuto che appare sul web in più di una posizione, ovvero su diverse pagine (URL). 


Se lavori in ambito web e SEO saprai che i contenuti duplicati sono un po’ come i lunedì mattina: fastidiosi e ripetitivi. Ecco perché devi conoscerli meglio e sapere come contrastarli in maniera efficace e definitiva.

Insomma, caro mio, vuoi davvero aumentare le visite al sito? Da buon consulente SEO non mi resta che invitarti a proseguire nella lettura, perché sei capitato proprio nel posto giusto. In questa guida voglio portarti a conoscere da vicino i contenuti duplicati, che sono un po’ i Voldemort della SEO. Ma visto che tu la faccia da Harry Potter proprio non ce l’hai, sappi che purtroppo non potrai usare la bacchetta magica per liberartene!

Contenuti duplicati: il principale problema SEO

Qual è il problema dei contenuti duplicati?

Provo a semplificarti la questione. Sebbene i contenuti duplicati non possano generare penalizzazioni algoritmiche, essi possono certamente impattare pesantemente sul posizionamento sui motori di ricerca del tuo sito web. Questo accade perché, quando Google trova quelli che chiama “contenuti evidentemente simili” (appreciably similar content) in diversi indirizzi web, diventa difficile per lui difficile decidere quale versione di questi documenti troppo similari possa essere la più rilevante per una determinata ricerca degli utenti.

Perché i contenuti duplicati sono così importanti?

I contenuti duplicati possono portare a 3 problemi principali per i motori di ricerca:

  1. I crawler di Google non sono esattamente dei geni (no, nemmeno quelli di Google) e non sono in grado di riconoscere quale versione dei contenuti simili è da indicizzare, includere o escludere dai risultati
  2. I crawler non sono capaci di elaborare in modo appropriato tutte le metriche derivanti dai link che puntano a un contenuto (trust, autorità, anchor text, link equity) e separare queste metriche tra le diverse versioni dello stesso
  3. Di fronte a dei contenuti duplicati i Google crawler non riescono a capire quale versione del contenuto vada posizionata per le domande di ricerca correlate (query)

Ecco perché, lato webmaster, quando sono presenti contenuti duplicati possono verificarsi perdite di ranking e quindi di traffico. Queste perdite sono ascrivibili a due problemi principali:

  • Problema N°1: Al fine di offrire la migliore esperienza di ricerca possibile, i motori di ricerca raramente mostrano versioni multiple di uno stesso contenuto e sono dunque forzati a scegliere autonomamente la versione migliore da mostrare nei risultati. La causa di questo problema è quindi semplice: se viene scelto un solo contenuto, questo limiterà la visibilità dei risultati duplicati nelle SERP.
  • Problema N°2: La link equity o link juice (come viene anche chiamata) potrebbe trovarsi diluita poiché i siti che scelgono di linkare un certo contenuto potrebbero selezionare per errore il duplicato. Di conseguenza, invece di avere tutti i tuoi bei link che puntano allo stesso contenuto conferendo autorità alla pagina, ti ritroveresti con una serie di duplicati con bassa potenza da link equity.

Ora dovrebbe risultarti più chiaro il quadro dei rischi legati al contenuto duplicato. Ecco, non appena hai finito di rabbrividire, che ne dici se ti spiego cosa causa più frequentemente i contenuti duplicati?

Contenuti duplicati: le cause più frequenti

Nella stragrande maggioranza dei casi i webmaster non creano intenzionalmente contenuti duplicati, ma questo non significa che essi non siano presenti. Alcune stime dicono che circa il 29% dell’intero Word Wide Web potrebbe essere composto da contenuti duplicati.

contenuti duplicati ricerca raven tool

Bene, ora voglio illustrarti alcune degli errori più comuni che portano alla creazione (non intenzionale) di contenuti duplicati.

1) Presenza contemporanea di HTTP e HTTPS

Se il tuo sito ha due versioni separate (una in http:// e l’altra in https://) e lo stesso contenuto si trova su ambedue le versioni del sito, beh, allora hai certamente un problema di contenuti duplicati! Lo stesso accade nel caso in cui il tuo sito abbia una versione www.nomesito.it e un’altra con solo nomesito.it (senza www). Se gli stessi contenuti sono presenti su ambedue le versioni allora stai dando in pasto al bot contenuti duplicati.

Per scongiurare questo rischio devi reindirizzare tutto ciò che è HTTP verso HTTPS, preferibilmente attraverso la modifica del file HTACCESS così da elaborare lato server tutti i reindirizzamenti. Vuoi fare da te? Eccoti il codice necessario:

RewriteEngine OnRewriteBase /RewriteCond %{HTTPS} offRewriteCond %{HTTP:X-Forwarded-Proto} !httpsRewriteRule ^(.*)$ https://%{HTTP_HOST}%{REQUEST_URI} [L,R=301]

2) Presenza di parametri nelle tue URL

Parametri URL quali il tracciamento dei click e alcuni codici di Analytics possono causare problemi di contenuto duplicato. In questo caso l’inghippo non nasce a causa dei parametri stessi, ma per via del modo in cui i parametri appaiono nelle URL. Ecco alcuni esempi pratici:

  • www.tuosito.com/pagina-prodotto?colore=blu  potrebbe essere un duplicato diwww.tuosito.com/pagina-prodotto
  • www.tuosito.com/pagina-prodotto?colore=blu&categoria=3  potrebbe essere un duplicato di: www.tuosito.com/pagina-prodotto?categoria=3&colore=blu

Sul sito utilizzi un sistema per applicare un certo ID alla sessione degli utenti? Anche questo può generare contenuti duplicati. Tale problema si verifica infatti quando alla sessione di ciascun utente è assegnato un ID differente che viene immagazzinato nell’URL. Il concetto di base è che qualunque parametro presente nelle URL può essere causa di un contenuto duplicato.

COME RISOLVERE: In questi casi l’intervento è quasi sempre custom e si interviene inserendo un link rel=canonical nelle pagine varianti.

3) Contenuti copiati o “grattati”

Quando si parla di “contenuti” duplicati si include in questo insieme non solo i blog post o il contenuto editoriale, ma anche le informazioni delle pagine prodotto presenti ad esempio in un e-commerce. I copioni che fanno “scraping” (come si dice in gergo) o copiano il contenuto di un sito possono causare problemi di comprensione al bot.

In questo senso c’è un problema che si vede in tantissimi e-commerce: quando un prodotto è molto comune i webmaster tendono a copiare la descrizione esattamente come fornita sul sito del produttore. Questo atteggiamento, come capirai, comporta la creazione di contenuti duplicati perfettamente identici su molti diversi siti web.

COME RISOLVERE: Qui c’è davvero poca trippa per gatti. La maggior parte delle volte devi metterti l’anima in pace e riscrivere al meglio tutte le schede prodotto. Sono tantissime e non sai come fare? Prendi in considerazione l’idea di pagare qualcuno 🙂

Contenuti duplicati: soluzioni semplici a problemi complessi

Eccoci al punto nodale del discorso. Ora ti spiego come risolvere i problemi che derivano dai contenuti duplicati. Non angustiarti, i sistemi che ti spiegherò sono solo un pelino più complessi rispetto alla teoria della relatività di Einstein, quindi non hai nulla di cui preoccuparti 😉

Tutto si risolve applicando un principio di massima: specificare al bot quale dei vari contenuti duplicati è quello giusto/originale.

Quando molte pagine che potenzialmente possono rankare bene vengono combinate in una sola, allora smettono di competere l’una con l’altra e liberano il loro vero potenziale. L’impatto positivo sulle pagine che vuoi far posizionare sarà sbalorditivo. Ti stai già sfregando le mani, eh?

Eccoti allora le contromisure che cercavi contro i contenuti duplicati.

1) Redirect 301: il principale antidoto ai contenuti duplicati

In molti casi il modo migliore per risolvere i problemi da contenuti duplicati è realizzare un redirect 301 dai contenuti duplicati verso la pagina con il contenuto originale. In questo modo le diverse pagine combinano il loro potenziale di ranking in una singola URL e non solo smetteranno di competere tra di loro, ma andranno anche a creare un segnale di rilevanza e popolarità più forte a livello generale in grado di impattare positivamente sulle possibilità di posizionamento della pagina target.

2) Abbatti i contenuti duplicati sfruttando il rel=”canonical”

Un’altra opzione valida per sfrondare i contenuti duplicati viene dall’attributo rel=canonical. Questo comunica infatti al motore di ricerca che una certa pagina deve essere trattata come una copia di una specifica URL e che tutti i suoi link, metriche e potere di posizionamento possono essere accreditati ad un’altra URL specificata.

Il rel=canonical è parte dell’head di una pagina HTML. Se ti stai chiedendo come aggiungerlo, ecco come fare:

<head>...[altro codice che potrebbe trovarsi nel tuo documento HTML]...<link href="URL DELLA PAGINA CANONICA" rel="canonical" />...[altro codice che potrebbe trovarsi nel tuo documento HTML]...</head>

L’attributo rel=canonical dovrebbe essere aggiunto nell’head di qualsiasi pagina duplicata. La parte “URL DELLA PAGINA CANONICA” deve contenere la URL della pagina obiettivo – mantenendo sempre le virgolette, mi raccomando 😉

Pss… Vuoi saperne di più sulla canonicalizzazione delle tue URL? Leggi l’approfondimento: Rel Canonical, cosa è e perché non puoi farne a meno lato SEO

3) Specificare il “dominio preferito” in Search Console

La Search Console di Google ancora una volta si rivela utilissima, anche per i contenuti duplicati. La piattaforma permette infatti di selezionare il “preferred domain” del proprio sito e specificare che il bot deve scansionare i diversi parametri URL in maniera differente.

dominio preferito su search console

Il problema principale di questa soluzione è che funziona soltanto per Google e non per i bot degli altri motori di ricerca tipo Bing, quindi è consigliata soltanto se proprio non te ne frega una cippa degli altri motori di ricerca!

4) Togli ai contenuti duplicati ogni pretesa grazie al noindex

Abbiamo poi un meta tag preistorico ma ancora valido, che può tornarti particolarmente utile per affrontare i contenuti duplicati. Parlo del meta tag robots, quando è utilizzato con la dicitura “noindex, follow”.

Anche questo meta tag deve essere applicato nella sezione head dell’HTML di ogni singola pagina da te individuata come contenuto duplicato: così facendo escluderai quel contenuto dall’indice del motore di ricerca. Ecco come si presenta il meta tag robots:

<head>...[altro codice che potrebbe trovarsi nel tuo documento HTML]...<meta name="robots" content="noindex,follow">...[altro codice che potrebbe trovarsi nel tuo documento HTML]...</head>

In questo modo ti assicuri che la pagina sia ancora “scansionabile” dal bot, ma non indicizzata. Questa è la soluzione migliore specialmente per i problemi di contenuto duplicato dovuti alla paginazione.

Occhio al rispetto del crawl budget: se utilizzi il meta tag “no index” su una pagina, assicurati che quest’ultima venga poi esclusa anche dalla tua Sitemap perché in caso contrario genererai un errore. Sarebbe come se invitassi Google a visitare il tuo appartamento per poi fargli trovare le porte delle stanze chiuse a chiave!

Contenuti duplicati: individua quelli presenti nel tuo sito grazie a SiteLiner

Molto bene, ora dovresti avere le idee più chiare, giusto?

siteliner per controllare la presenza di contenuti duplicati all

Comunque un bell’aiutino extra non guasta mai, quindi lascia che ti presenti il mio tool preferito per controllare la presenza di contenuti duplicati all’interno del tuo sito web.

Vai su siteliner.com, inserisci la URL del sito che vuoi controllare e in un batter d’occhio ti troverai di fronte allo stato dell’arte del tuo sito web!

siteliner guida

Addio contenuti duplicati? Forse…

Se avevi un problema di contenuti duplicati o temi di esserne vittima nel futuro, ora hai 4 assi nella manica che puoi giocarti per mantenere il controllo della situazione. Solo i siti che ottimizzano aspetti come questo riescono a dialogare alla pari con Google e possono porre le giuste basi per un posizionamento solido e duraturo nel tempo.

Come avrai compreso, però, affrontare i contenuti duplicati può essere complesso dal punto di vista tecnico. Se non te la senti di mettere le mani in pasta, lascia che lo faccia un professionista al posto tuo. Molto spesso è questa la soluzione migliore, altrimenti si rischia solo di impasticciare ancora di più le cose.

Se poi dovessi scegliere proprio me… beh, sappi che ne sarei felice 😀

Roberto Serra

Mi chiamo Roberto Serra e sono un digital marketer con una forte passione per la SEO: Mi occupo di posizionamento sui motori di ricerca, strategia digitale e creazione di contenuti.

Ricevi i migliori aggiornamenti di settore