Canonicalizzazione: Come, quando e perché

Tutto ciò che è importante sapere per gestire al meglio in ambito Seo la canonicalizzazione delle risorse, sia per ecommerce che per i siti.

Cos’è la canocalizzazione di una risorsa?

Possiamo definire la canonicalizzazione di una risorsa la selezione di una tra molteplici versioni di una pagina che identifichiamo come “preferita” o “rappresentativa” per i contenuti in essa espressi e che vogliamo siano “privilegiati” in sede di scansione dal motore di ricerca.

In ambito Seo ciò si traduce generalmente nella scelta di un URL tra 2 o più risorse che sono apparentemente o totalmente identiche tra di loro.

Ecco un esempio:

Quali problemi si risolvono utilizzando il “rel=canonical”?

La canonicalizzazione serve principalmente a risolvere due tipi di problematiche:

Duplicazione di un contenuto: questa casistica si presenta in larga maggioranza negli ecommerce e nello specifico quando si incontrano “varianti “di uno stesso prodotto che vengono gestite da url parametriche, in cui la variante viene appesa al parametro dell’url. Vediamo nell’esempio che segue come l’attributo “colore” non modifichi sostanzialmente le pagine in quanto tra il parametro verde e il parametro rosso non ci sono variazioni sostanziali.

Per evitare quindi che queste due risorse entrino in competizione sarà necessario canonicalizzare una delle due a vantaggio dell’altre.

Elevata somiglianza: Questo solitamente avviene sia per gli ecommerce che per i siti dove il contenuto testuale differisce per pochissimi fattori

Quali problemi possono nascere se non si usa correttamente il “rel=canonical”

I problemi derivanti dal non gestire correttamente la canonicalizzazione delle risorse sono:

La divisione del ranking: se non si utilizza il canonical per gestire duplicazione e somiglianza delle risorse, il valore che da una pagina viene trasferito ad un’altra si dimezzerà, con conseguente perdita di ranking

Fluttuazione dei risultati in serp: in questo caso avremo che la pagina non sarà abbastanza stabile con leggere fluttuazioni in termini di visibilità sulla Serp, ma avrà delle oscillazioni anche molto ampie in brevi lassi di tempo.

Problemi di scansione: se non viene correttamente impostato od omesso del tutto, potremmo incorrere in problemi di scansione e di uso eccessivo di crawl budget, poiché il motore di ricerca andrà a scansionare pagine che hanno un valore relativo tralasciando magari pagine che devono essere posizionate e che hanno un alto valore.

Potenziali problemi di spam: enormi quantità di contenuti quasi identici possono essere percepiti dal motore di ricerca come spam e quindi è possibile incorrere in attività di penalizzazione oltre che a perdite significative di ranking.

Confusione e/o irritazione da parte dell’utente: se nel punto 4 abbiamo visto il punto di vista del motore di ricerca è importante porci anche dal punto di vista dell’utente che credendo di trovare risorse diverse nel corso del naturale processo di navigazione, si troverà invece a caricare contenuti pressoché e identici, aumentando l’insoddisfazione e la propensione all’abbandono del sito. Il tutto si traduce in un aumento del bounce rate che a lungo andare porterà a perdite di ranking.

Quali sono i principali metodi per utilizzare canonicalizzare una risorsa?

Contrariamente a quanto si potrebbe pensare ci sono 4 metodi per canonicalizzare una risorsa:

  1. Forte
  2. Debole
  3. Ibrido
  4. Sbagliato

Canonicalizzazione Forte

Questo tipo di canonicalizzazione viene eseguito quando l’url canonica non è navigabile e solitamente la troviamo quando abbiamo a che fare con varianti di TDL, sotto domini e protocolli http (da http ad https), e in associazione a un redirect 301.

Canonicalizzazione debole

Sicuramente quella più utilizzata all’interno di siti e ecommerce, viene dichiarato sotto forma di link all’interno del tag <head> e contrariamente alle risorse del punto precedente, in questo caso le pagine “duplicate o simili” sono raggiungibili durante la navigazione (ad esempio le varianti del colore di una t-shirt da uomo) grazie all’utilizzo di filtri ad esempio.

Come detto in precedenza qui è necessario individuare quale delle varianti dobbiamo/vogliamo indicizzare e tale scelta va fatta utilizzando Google Search Console (che ci può dare preziose informazioni sul CTR di una pagina in relazione ad un panel di kwd) e Google Analytics, (nel caso di un ecommerce ci può fornire quale tra tutte le pagine simili performa maggiormente in termine di vendite).

Canonicalizzazione ibrida

Questo tipo di canonicalizzazione è forse la più difficile da interpretare e la più complessa da utilizzare. Solitamente e una pratica SEO sconsigliata in quanto può portare a delle penalizzazioni importanti tuttavia in alcune casistiche viene utilizzata soprattutto lato Server per mostrare a Bot di siti di terze parti (spam bot) che scansionano con un’elevata frequenza i siti delle risorse (tramite redirect 301) che sono state create “ad hoc” in maniera da limitare il carico sul server di questi programmi.

Lato utente non si avrà la percezione di queste risorse, tuttavia il risparmio di crawl budget sarà sostanziale

Errori di canonicalizzazione

Ecco di seguito alcuni errori di canonicalizzazione:

  1. canonicalizzare pagine 404
  2. canonicalizzare il file robot.txt
  3. canonicalizzare pagine con il tag noindex
  4. canonicalizzare pagine in lingue diverse di un sito (in questo caso è importante utilizzare il tag “hreflang”)
  5. Nelle pagine che non che non sono generate dall’utilizzo di filtri di navigazione utilizzare il self-canonical
  6. Nella stessa pagina più canonical a pagine differenti

Tipi di Canonicalizzazione

Vediamo ora quali sono i principali tipi di canonicalizzazione e quando devono essere utilizzati.

  1. Self-Canonical
  2. Cross Page Canonical
  3. Cross Domain Canonical

Self Canonical

Questo tipo di risorsa canonica viene utilizzato quando siamo in presenza di pagine paginate (pag. 1, pag. 2, pag. 3, etc.) o quando siamo in presenza di url parametriche che sono “case sensitive” ma non mostrano contenuti differenti.

Cross Page Canonical

Viene utilizzato in queste situazioni:

  • In presenza di filtri all’interno delle categorie degli ecommerce
  • Varianti di prodotto (colori, dimensioni, etc.)
  • Contenuti duplicati su più risorse

Cross Domain Canonical

  • In presenza di siti con contenuti molto simili tra di loro, per cui il motore di ricerca non riesce a stabilire il dominio da enfatizzare, quindi elevato rischio di cannibalizzazione della serp

Quando non si deve usare il canonical

Le risorse non vedono essere canonicalizzate nelle seguenti situazioni:

  • In presenza del tag “noindex”, in quanto non si vuole che questa risorsa venga indicizzata, quindi ai fini pratici non ha senso utilizzare il canonical.
  • In presenza della direttiva “Disallow” nel robots.txt, in quanto anche in questo caso ogni valore andrebbe perso
  • In pagine che non sono più navigabili (404, 410)

Catene di risorse canoniche

Può capitare che nella gestione di siti di grandi dimensioni si facciano catene di redirect, se all’interno di queste pagine ci sono dei canonical avremo una catena di risorse canonicalizzate che invece non ci dovrebbero essere in quanto il canonical deve essere del tipo uno a uno e non uno a molti.

La personalizzazione del tuo eCommerce soddisfa i tuoi utenti?
Scoprilo SUBITO con un’analisi ad hoc… CONTATTACI!

In questo articolo...