Come ottimizzare la Sitemap XML per la Seo

La sitemap.xml è un elemento chiave per la SEO, fondamentale per aiutare i motori di ricerca a navigare e indicizzare correttamente tutte le pagine di un sito.

In questo articolo spieghiamo non solo cos’è una sitemap ma anche come strutturarla per ottenere il massimo risultato in termini di indicizzazione e visibilità.

  • Cos’è una sitemap.xml: si tratta di un file dove vanno inseriti solo URL funzionanti (no errori 404 o redirect 301) e che segue precise linee guida di Google, per guidare i crawler verso le pagine corrette da scansionare.
  • Tipi di sitemap: viene chiarito che non esiste una sola sitemap, ma è preferibile suddividere gli URL in file separati per pagine istituzionali, categorie, prodotti (nelle versioni e-commerce), immagini o video, raccolti tutti tramite un “sitemap index”.
  • Dimensioni ottimali: la dimensione massima raccomandata per una sitemap è 50.000 URL o 50MB, ma si consiglia di spezzarla in file più piccoli di massimo 5.000 URL per questioni di performance e rapidità di scansione da parte di Googlebot.
  • Approccio alternativo avanzato: viene presentata una strategia innovativa con la sitemap-nonindexed.xml. Si inseriscono qui solo gli URL non ancora indicizzati e, tramite monitoraggio dei log del server, si trasferiscono nella sitemap principale una volta scansionati, controllando così in modo puntuale l’indicizzazione soprattutto nei siti molto grandi o negli e-commerce.

Che cos’è una Sitemap.xml?

Il file denominato sitemap.xml non è nient’altro che un file che contiene tutte gli url di un sito web, non è importante che siano inseriti in maniera gerarchica l’importante è che siano presenti tutti.

È altresì importante che in questo file compaiano solo url corretti e funzionanti, senza quindi link che hanno status code 404 e 301.

Le linee guida di Google per creare dei file corretti sono presenti in questa risorsa: https://developers.google.com/search/docs/advanced/sitemaps/build-sitemap?visit_id=637856020560426869-1260209936&rd=1

Quanti tipi di Sitemap XML esistono?

Sempre attingendo dalle linee guida di Google è importante capire che non tutti gli url sono uguali per il motore di ricerca e quindi anche le Sitemap XML non possono e non devono essere tutte uguali.

È buona norma infatti suddividere le varie sitemap in base a come è sviluppata l’architettura informativa del sito, quindi utilizzando un sitemap index a mo di contenitore, inserire al suo interno:

  1. sitemap delle pagine istituzionali
  2. sitemap della categorie
  3. sitemap delle pagine (o dei prodotti in caso di un ecommerce)
  4. sitemap delle immagini
  5. sitemap dei video (dove presenti)

Quanto deve essere “grande” o “pesare” una sitemap.xml?

Tra tutti i punti delle linee guida fornite da Google uno di quelli che solitamente viene trattato con “sufficienza” riguarda la dimensione o il peso di questi file.

Una Sitemap XML non dovrebbe contenere più di 50.000 url o pesare più di 50 MB.

Queste indicazioni vengono rispettate in maniera dinamica dai plug-in delle varie piattaforme che generano in maniera automatica questi file.

Ciò permette di aggiornare senza problemi il o i file che verranno poi inviati alla GSC per essere scansionati dal motore di ricerca.

Perché le Sitemap XML non dovrebbero contenere più di 5000 url?

Come visto in precedenza Google assegna una dimensione o un peso massimi a questi file, quindi è logico aspettarsi che più ci si avvicina al limite più il bot del motore di ricerca impieghi più tempo per leggere queste risorse.

Ecco quindi che “parzializzando” e dividendo questi file in file più piccoli otterremo dei grandi benefici:

  1. il motore di ricerca impiegherà molto meno tempo per leggere le risorse in esso contenute
  2. avremo un controllo più capillare sugli url in esse contenute in quanto il numero sarà molto inferiore
  3. la possibilità di indicizzare nuovi contenuti aggiunti di recente da parte del motore di ricerca sarà aumenta

Ecco perché (soprattutto in relazione all’ultimo punto) consigliamo di non superare il limite delle 5000 url per singola sitemap.xml

Sorgono ovviamente delle problematiche in relazione a questa gestione delle sitemap, in quanto non ci si può più solamente avvalere di plugin per generarle in maniera dinamica, ma sarà necessario sviluppare un sistema custom per rispettare le nuove direttive.

Un approccio alternativo alle Sitemap XML

Questo approccio è utile se è importante che i contenuti vengano indicizzati il ​​prima possibile. È anche utile se si hanno molti URL non indicizzati che necessitano di una indicizzazione veloce.

Ecco tutta l’idea e come è stata sviluppata:

  • Avere un elenco di URL di cui si desidera eseguire la scansione da parte di  Googlebot.
  • Generare una mappa del sito XML chiamata ad es. sitemap-nonindexed.xml.
  • Monitorare i server log di accesso per le richieste di Googlebot.
  • Ogni volta che Googlebot effettua una richiesta a uno degli URL che si stanno monitorando, l’URL viene rimosso da sitemap-nonindexed.xml
  • Questo viene aggiunto alla Sitemap XML più appropriata (ad es . sitemap-products7.xml ).

Ciò che si ottiene è che i nuovi contenuti e quelli scansionati ma non indicizzati verranno compresi e inseriti nella serp con velocità maggiore rispetto al metodo tradizionale.

Ovviamente questo passaggio come il precedente deve essere sviluppato in maniera personalizzata da programmatori esperti.


In questo articolo...