Come ottimizzare la Sitemap XML per la Seo

Un uso alternativo della Sitemap Xml per migliorare l’indicizzazione delle pagine e aumentare le performance seo.

Che cos’è una Sitemap.xml?

Il file denominato sitemap.xml non è nient’altro che un file che contiene tutte gli url di un sito web, non è importante che siano inseriti in maniera gerarchica l’importante è che siano presenti tutti.

È altresì importante che in questo file compaiano solo url corretti e funzionanti, senza quindi link che hanno status code 404 e 301.

Le linee guida di Google per creare dei file corretti sono presenti in questa risorsa: https://developers.google.com/search/docs/advanced/sitemaps/build-sitemap?visit_id=637856020560426869-1260209936&rd=1

Quanti tipi di Sitemap XML esistono?

Sempre attingendo dalle linee guida di Google è importante capire che non tutti gli url sono uguali per il motore di ricerca e quindi anche le Sitemap XML non possono e non devono essere tutte uguali.

È buona norma infatti suddividere le varie sitemap in base a come è sviluppata l’architettura informativa del sito, quindi utilizzando un sitemap index a mo di contenitore, inserire al suo interno:

  1. sitemap delle pagine istituzionali
  2. sitemap della categorie
  3. sitemap delle pagine (o dei prodotti in caso di un ecommerce)
  4. sitemap delle immagini
  5. sitemap dei video (dove presenti)

Quanto deve essere “grande” o “pesare” una sitemap.xml?

Tra tutti i punti delle linee guida fornite da Google uno di quelli che solitamente viene trattato con “sufficienza” riguarda la dimensione o il peso di questi file.

Una Sitemap XML non dovrebbe contenere più di 50.000 url o pesare più di 50 MB.

Queste indicazioni vengono rispettate in maniera dinamica dai plug-in delle varie piattaforme che generano in maniera automatica questi file.

Ciò permette di aggiornare senza problemi il o i file che verranno poi inviati alla GSC per essere scansionati dal motore di ricerca.

Perché le Sitemap XML non dovrebbero contenere più di 5000 url?

Come visto in precedenza Google assegna una dimensione o un peso massimi a questi file, quindi è logico aspettarsi che più ci si avvicina al limite più il bot del motore di ricerca impieghi più tempo per leggere queste risorse.

Ecco quindi che “parzializzando” e dividendo questi file in file più piccoli otterremo dei grandi benefici:

  1. il motore di ricerca impiegherà molto meno tempo per leggere le risorse in esso contenute
  2. avremo un controllo più capillare sugli url in esse contenute in quanto il numero sarà molto inferiore
  3. la possibilità di indicizzare nuovi contenuti aggiunti di recente da parte del motore di ricerca sarà aumenta

Ecco perché (soprattutto in relazione all’ultimo punto) consigliamo di non superare il limite delle 5000 url per singola sitemap.xml

Sorgono ovviamente delle problematiche in relazione a questa gestione delle sitemap, in quanto non ci si può più solamente avvalere di plugin per generarle in maniera dinamica, ma sarà necessario sviluppare un sistema custom per rispettare le nuove direttive.

Un approccio alternativo alle Sitemap XML

Questo approccio è utile se è importante che i contenuti vengano indicizzati il ​​prima possibile. È anche utile se si hanno molti URL non indicizzati che necessitano di una indicizzazione veloce.

Ecco tutta l’idea e come è stata sviluppata:

  • Avere un elenco di URL di cui si desidera eseguire la scansione da parte di  Googlebot.
  • Generare una mappa del sito XML chiamata ad es. sitemap-nonindexed.xml.
  • Monitorare i server log di accesso per le richieste di Googlebot.
  • Ogni volta che Googlebot effettua una richiesta a uno degli URL che si stanno monitorando, l’URL viene rimosso da sitemap-nonindexed.xml
  • Questo viene aggiunto alla Sitemap XML più appropriata (ad es . sitemap-products7.xml ).

Ciò che si ottiene è che i nuovi contenuti e quelli scansionati ma non indicizzati verranno compresi e inseriti nella serp con velocità maggiore rispetto al metodo tradizionale.

Ovviamente questo passaggio come il precedente deve essere sviluppato in maniera personalizzata da programmatori esperti.


In questo articolo...