Canonicalizzazione: Come, Quando e Perché – SEO Tech Academy

Vuoi evitare problemi di contenuti duplicati, migliorare l’indicizzazione o dare ai motori di ricerca le giuste indicazioni sulle pagine più rilevanti? Il tag canonical viene in tuo soccorso!

Ne parliamo in questo appuntamento con la SEO Tech Academy – consigli SEO in meno di 10 minuti.

Se non vuoi perderti i prossimi video, iscriviti al canale YouTube oppure alla newsletter dedicata per riceverli direttamente nella tua casella di posta, ogni lunedì alle ore 12!

Cos’è la canonicalizzazione di una risorsa?

La canonicalizzazione di una risorsa è la selezione di una tra molteplici versioni di una pagina che identifichiamo come “preferita” o “rappresentativa” per i contenuti in essa espressi e che vogliamo siano “privilegiati” in sede di scansione dal motore di ricerca.

In ambito SEO ciò si traduce generalmente nella scelta di un URL tra 2 o più risorse che sono apparentemente o totalmente identiche tra di loro.

Ecco un esempio:

Quali problemi si risolvono utilizzando il “rel=canonical”?

La canonicalizzazione serve principalmente a risolvere due tipi di problematiche:

Duplicazione di un contenuto

Questa casistica si presenta in larga maggioranza negli ecommerce e nello specifico quando si incontrano varianti di uno stesso prodotto che vengono gestite da url parametriche, in cui la variante viene appesa al parametro dell’url.

Vediamo nell’esempio che segue come l’attributo “colore” non modifichi sostanzialmente le pagine in quanto tra il parametro verde e il parametro rosso non ci sono variazioni sostanziali.

Di questo tema ne parliamo anche nell’articolo dedicato alla navigazione a faccette.

Per evitare quindi che queste due risorse entrino in competizione sarà necessario canonicalizzare una delle due a vantaggio dell’altre.

Elevata somiglianza

Questo solitamente avviene sia per gli ecommerce che per i siti dove il contenuto testuale differisce per pochissimi fattori:

Quali problemi possono nascere se non si usa correttamente il “rel=canonical”

I problemi derivanti dal non gestire correttamente la canonicalizzazione delle risorse sono:

La divisione del ranking

Se non si utilizza il canonical per gestire duplicazione e somiglianza delle risorse, il valore che da una pagina viene trasferito all’altra si dimezzerà, con conseguente perdita di ranking.

Fluttuazione dei risultati in SERP

In questo caso avremo che la pagina non sarà abbastanza stabile con leggere fluttuazioni in termini di visibilità sulla SERP, ma avrà delle oscillazioni anche molto ampie in brevi lassi di tempo.

Problemi di scansione

Se non viene correttamente impostato od omesso del tutto, potremmo incorrere in problemi di scansione e di uso eccessivo di crawl budget, poiché il motore di ricerca andrà a scansionare pagine che hanno un valore relativo tralasciando magari pagine che devono essere posizionate e che hanno un alto valore.

Potenziali problemi di spam

Enormi quantità di contenuti quasi identici possono essere percepiti dal motore di ricerca come spam e quindi è possibile incorrere in attività di penalizzazione oltre che a perdite significative di ranking.

Confusione e/o irritazione da parte dell’utente

L’utente che naviga il sito si troverà a caricare contenuti pressoché e identici, aumentando l’insoddisfazione e la propensione all’abbandono del sito. Il tutto si traduce in un aumento del bounce rate che a lungo andare porterà a perdite di ranking.

Quali sono i principali metodi per utilizzare canonicalizzare una risorsa?

Ci sono 4 metodi per canonicalizzare una risorsa:

  1. Forte
  2. Debole
  3. Ibrido
  4. Sbagliato

Canonicalizzazione Forte

Questo tipo di canonicalizzazione viene eseguito quando l’url canonica non è navigabile e solitamente la troviamo quando abbiamo a che fare con varianti di TDL, sotto domini e protocolli http (da http ad https), e in associazione a un redirect 301.

Canonicalizzazione Debole

Sicuramente quella più utilizzata all’interno di siti e ecommerce, viene dichiarato sotto forma di link all’interno del tag <head> e in questo caso le pagine “duplicate o simili” sono raggiungibili durante la navigazione (ad esempio le varianti del colore di una t-shirt da uomo) grazie all’utilizzo di filtri.

È necessario individuare quale delle varianti dobbiamo/vogliamo indicizzare e tale scelta va fatta utilizzando Google Search Console (che ci può dare preziose informazioni sul CTR di una pagina in relazione ad un panel di keyword) e Google Analytics, (nel caso di un ecommerce ci può fornire quale tra tutte le pagine simili performa maggiormente in termine di vendite).

Canonicalizzazione Ibrida

Questo tipo di canonicalizzazione è forse la più difficile da interpretare e la più complessa da utilizzare. Solitamente e una pratica SEO sconsigliata in quanto può portare a delle penalizzazioni importanti tuttavia in alcune casistiche viene utilizzata soprattutto lato Server per mostrare a Bot di siti di terze parti (spam bot) che scansionano con un’elevata frequenza i siti delle risorse (tramite redirect 301) che sono state create “ad hoc” in maniera da limitare il carico sul server di questi programmi.

Lato utente non si avrà la percezione di queste risorse, tuttavia il risparmio di crawl budget sarà sostanziale

Errori di canonicalizzazione

Ecco di seguito alcuni errori di canonicalizzazione:

  1. Canonicalizzare pagine 404;
  2. canonicalizzare il file robot.txt;
  3. canonicalizzare pagine con il tag noindex;
  4. canonicalizzare pagine in lingue diverse di un sito (in questo caso è importante utilizzare il tag “hreflang”);
  5. nelle pagine che non sono generate dall’utilizzo di filtri di navigazione utilizzare il self-canonical;
  6. nella stessa pagina più canonical a pagine differenti.

Tipi di Canonicalizzazione

Vediamo ora quali sono i principali tipi di canonicalizzazione e quando devono essere utilizzati.

  1. Self-Canonical
  2. Cross Page Canonical
  3. Cross Domain Canonical

Self Canonical

Questo tipo di risorsa canonical viene utilizzato quando siamo in presenza di pagine paginate (pag. 1, pag. 2, pag. 3, etc.) o quando siamo in presenza di url parametriche che sono “case sensitive” ma non mostrano contenuti differenti.

Cross Page Canonical

Viene utilizzato in queste situazioni:

  • in presenza di filtri all’interno delle categorie degli ecommerce;
  • varianti di prodotto (colori, dimensioni, etc.);
  • contenuti duplicati su più risorse.

Cross Domain Canonical

  • In presenza di siti con contenuti molto simili tra di loro, per cui il motore di ricerca non riesce a stabilire il dominio da enfatizzare, quindi elevato rischio di cannibalizzazione della SERP.

Quando non usare il canonical

Le risorse non vedono essere canonicalizzate nelle seguenti situazioni:

  • In presenza del tag “noindex”, in quanto non si vuole che questa risorsa venga indicizzata, quindi ai fini pratici non ha senso utilizzare il canonical;
  • in presenza della direttiva “Disallow” nel robots.txt, in quanto anche in questo caso ogni valore andrebbe perso;
  • in pagine che non sono più navigabili (404, 410).

Catene di risorse canoniche

Può capitare che nella gestione di siti di grandi dimensioni si facciano catene di redirect, se all’interno di queste pagine ci sono dei canonical avremo una catena di risorse canonicalizzate che invece non ci dovrebbero essere in quanto il canonical deve essere del tipo uno a uno e non uno a molti.

Come gestire il tag canonical e risolvere gli errori con Screaming Frog

Abbiamo visto opportunità e rischi del tag canonical, vediamo ora come utilizzare Screaming Frog per individuare e risolvere gli errori.

Andiamo dunque in Configurazioni > Spider > Attivare Crawl e Store dei Canonicals. Una volta che hai fatto partire la scansione potrai consultare tutti i risultati.

Ecco i filtri che avrai a disposizione:

1) Contains Canonical > tutte le pagine che contengono il tag canonical

2) Self Referencing > il tag canonical riferito a se stesso, ad esempio:

PAGINA: example.com/prodotto

<link rel=”canonical” href=”https://example.com/prodotto” />

3) Canonicalised > le pagine canonicalizzate (nel caso qui sotto, per esempio, sto dicendo a Google che il ranking deve portarlo sulla pagina “prodotto-A”:

PAGINA: example.com/prodotto

<link rel=”canonical” href=”https://example.com/prodotto-A” />

4) Missing > identifica quando il tag canonical è assente in qualche pagina

5) Multiple + Multiple Conflicting > tag canonical che nei cms più comuni, a causa di plugin, vengono raddoppiati e quindi si crea incertezza nel motore di ricerca:

PAGINA: example.com/prodotto

<link rel=”canonical” href=”https://example.com/prodotto” />

<link rel=”canonical” href=”https://example.com/prodotto-A” />

6) Non-indexable canonical > quando la pagina canonicalizzata non è, per esempio, raggiungibile e non risponde con status code 200:

PAGINA: example.com/prodotto

<link rel=”canonical” href=”https://example.com/prodotto-A” />

MA “prodotto-A” ha uno STATUS CODE:
– 4XX
– 5XX
– no index
– canonicalised
– no response

7) Canonical is relative > è sempre meglio tutto il percorso dell’URL per non intercorrere in errori di scansione dello spider, si veda l’esempio (errato) qui sotto:

PAGINA: example.com/prodotto

<link rel=”canonical” href=”/prodotto-A” />

8) Unlinked > Google trova l’unico link a quella pagina tramite il tag canonical ma sono assenti internal linking che valorizzano la pagina

9) Invalid attribute in annotation > Alcuni plugin inseriscono nel tag canonical anche l’hreflang, che ha funzione diversa ed è un errore:

PAGINA: example.com/prodotto

<link rel=”canonical” href=”https://example.com/prodotto-A”  rel=”alternate” hreflang=”en-gb”  />

10) Canonical fragment url > questo capita soprattutto con i plugin perché potrebbe generare un errore di scansione:

PAGINA: example.com/prodotto

<link rel=”canonical” href=”https://example.com/prodotto” /#example>

11) Outside <head > > il tag canonical è fuori dal tag head, in questo caso Google potrebbe non considerarlo nelle sue valutazioni e quindi ignorare il consiglio:

<!DOCTYPE html>

<html>

<head>

</head>

<link rel=”canonical” href=”https://example.com/prodotto” />

<body>

</body>

</html>

Ti è piaciuta questa guida?

Se non vuoi perderti i prossimi contenuti, iscriviti al canale YouTube oppure compila il form qui sotto per riceverli direttamente nella tua casella di posta!

La tua iscrizione non può essere convalidata.
La tua iscrizione è avvenuta correttamente.

ISCRIVITI ALLA SEO TECH ACADEMY

Ricevi i nostri video gratuiti, ogni lunedì alle 12 direttamente nella tua casella di posta!

Inviando il form dichiari di aver letto e compreso la Privacy Policy.

In questo articolo...