GEO con Screaming Frog: Come misurare se compari su ChatGPT (o altri motori AI)

Ogni giorno i tuoi contenuti alimentano l’AI: i motori di ricerca AI come ChatGPT, Gemini e Perplexity continuano ad apprendere, a migliorare e a generare risposte grazie a ciò che trovano online.

Il tuo sito è uno degli ingredienti che nutrono questi modelli, ma per poter citare il tuo brand nelle risposte, le AI devono poter accedere correttamente alle tue pagine.

Devono leggerle, capirle e interpretarle senza incontrare errori, blocchi o limiti di crawler.

Prima ancora di parlare di GEO, citazioni, visibilità o strategie editoriali, il primo passo è verificare se ChatGPT (o altri motori AI) riesce davvero ad accedere alle tue pagine.

La risposta si trova nei file di log del tuo server. Un’analisi preliminare ti mostra quali bot stanno visitando il sito, con quale frequenza, quali URL esplorano e soprattutto dove incontrano errori che impediscono loro di utilizzare i tuoi contenuti.

In che modo? Grazie a Screaming Frog Log File Analyser puoi importare facilmente i tuoi log, verificare i bot dei motori di ricerca e AI e analizzarne il comportamento. In questo momento in cui c’è l’espansione della AI diventa ancora più importante il loro studio!

Se sei un eCommerce o Marketing Manager e hai bisogno di un aiuto professionale per portare il tuo sito web dentro le risposte nei motori di ricerca AI, richiedi informazioni sulla consulenza GEO e ottieni una diagnosi completa della tua visibilità nelle risposte LLM.

File di Log e AI Bot Search: Perché contano così tanto

Tradizionalmente i file di log servono per analizzare il comportamento dei bot dei motori di ricerca esaminando aspetti come i codici di risposta, la frequenza di scansione, il crawl budget e altro ancora, ma offrono anche visibilità sull’attività dei bot AI che non si può trovare altrove.

Le principali piattaforme AI (OpenAI, Perplexity, Anthropic) utilizzano bot differenti per scopi diversi. Screaming Frog Log File Analyser include attualmente diversi preset per la maggior parte delle principali piattaforme:

La possibilità di distinguere il traffico tra bot di addestramento, bot di ricerca e bot di citazione consente di capire per cosa viene usato il tuo contenuto.

Inoltre, aggiungendo i propri user-agent personalizzati, si sbloccano ulteriori approfondimenti, permettendo di identificare quali contenuti vengono utilizzati per l’addestramento dei modelli, per la
ricerca / indicizzazione o per essere mostrati in tempo reale agli utenti all’interno di una chat.

Insieme a strumenti di monitoraggio della visibilità AI (che hanno comunque i loro limiti), queste informazioni possono essere utilizzate per costruire un quadro molto più chiaro della visibilità del tuo sito web all’interno dell’AI.

Analisi File di Log per la GEO con Screaming Frog

Nel tutorial qui sotto trovi la procedura completa. Se hai bisogno di supporto per interpretare i log e migliorare l’accessibilità AI del tuo eCommerce, siamo qui per aiutarti. Prenota una consulenza GEO e inizia a costruire la tua presenza nei motori generativi.

1. Importa i file di log

Trascina semplicemente i tuoi file di log su Screaming Frog Log File Analyser. Il tool li processa in pochi secondi.

2. Crea il progetto

Puoi creare un nuovo progetto o alimentarne uno già esistente tramite un semplice drag & drop.

3. Configura gli user-agent

Clicca su User Agents per definire quali bot includere nell’analisi.

Per impostazione predefinita, Screaming Frog filtra solo i bot dei motori di ricerca (opzione “Filter User Agents – Improves Performance”). Puoi disattivarla per includere anche i bot AI oppure aggiungere user-agent custom tramite “Configure User Agents”.

4. Verifica l’autenticità dei bot

I bot dei motori di ricerca possono essere contraffatti. Screaming Frog effettua una verifica sugli IP ufficiali noti (Google, Bing), controllando tramite reverse DNS che i domini siano legittimi.

Questa verifica è in arrivo anche per i bot AI, anche se oggi la contraffazione degli user-agent AI è ancora rara.

5. Analizza i dati dei Search AI

A questo punto puoi iniziare a esplorare il comportamento dei bot AI, filtrando per piattaforma, user-agent o tipologia di evento.

Response Code: gli errori che ti impediscono di apparire nelle risposte AI

Una volta ottenuti i dati, il primo controllo fondamentale riguarda i codici di risposta.

Filtra per user-agent specifici e osserva come i bot AI interagiscono con il sito. Errori 4XX o 5XX sono segnali chiari che qualcosa non va.

  • Bot di citazione (ChatGPT-User, Perplexity-User): ogni errore è una citazione mancata. Se non riescono a recuperare il contenuto, il tuo sito non appare nelle risposte ai loro utenti.
  • Bot di addestramento (GPTBot, ClaudeBot): gli errori indicano che i tuoi contenuti non vengono acquisiti nei modelli.

Controlla infine la scheda Response Codes per cogliere incoerenze: se un URL passa da 200 a 404 da un giorno all’altro, c’è un problema da indagare (redirect mancati, URL obsolete, problemi di configurazione).

Most Visited URLs: quali contenuti AI considerano più importanti

Ordina la tab “URL” per Num Events: scoprirai quali pagine i bot AI visitano più spesso.

Potresti trovare:

  • pagine informative molto attraenti per i bot di addestramento;
  • specifiche pagine prodotto richieste dai bot di citazione;
  • intere directory ignorate.

Se una sezione strategica non viene scansionata, valuta:

  • miglioramento del linking interno;
  • aggiornamento del robots.txt;
  • rimozione di blocchi accidentali.

Interessante anche confrontare i diversi bot:

  • i bot di addestramento preferiscono contenuti evergreen, lunghi, informativi;
  • i bot di citazione si muovono in base alle query degli utenti, quindi colpiscono pagine commerciali o molto specifiche.

Bandwidth: i bot AI consumano risorse (anche tante)

La colonna “Total Bytes” mostra quanta banda sta consumando ogni bot.

Su siti di grandi dimensioni può emergere un impatto significativo:

  • alcuni bot AI inviano centinaia di richieste al secondo;
  • questo può causare rallentamenti del server e spreco di risorse;
  • genera anche un impatto ambientale non trascurabile.

In questi casi puoi giustificare limitazioni o blocchi selettivi tramite robots.txt.

Crawling Patterns: riconoscere picchi e comportamenti anomali

Il grafico degli eventi nella scheda Overview ti aiuta a individuare attività insolite.

Picchi improvvisi possono indicare:

  • scoperta del sito da parte di un nuovo bot;
  • crawling troppo aggressivo;
  • ignoranza delle direttive crawl-delay.

Controlla anche il tempo medio di risposta: se aumenta durante l’attività di specifici bot AI, stanno sovraccaricando il server.

Puoi implementare:

  • crawl-delay mirati;
  • limitazioni di velocità a livello server;
  • controlli sugli IP delle regioni inattese.

Crawl Depth: quanto a fondo arrivano gli AI Bot nel tuo sito

Dalla scheda Directory puoi verificare a quale profondità gli AI bot stanno effettivamente esplorando la struttura.

Una profondità bassa può essere causata da:

  • linking interno debole;
  • rendering JS non accessibile (molti bot AI non eseguono JS);
  • blocchi involontari nel robots.txt.

Confrontare la copertura dei bot di addestramento con quella dei bot di citazione è rivelatore:
se il modello “prende” i tuoi contenuti, ma i bot di risposta non ti visitano, stai contribuendo all’AI senza ottenere visibilità in cambio.

Conclusioni sull’analisi dei Log per la GEO con Screaming Frog

Capire come gli AI Bot leggono il sito è una componente essenziale della visibilità futura del brand. Gli LLM sono un nuovo punto di ingresso delle ricerche e i tuoi contenuti sono una delle fonti che alimentano ciò che ChatGPT, Perplexity e gli altri motori AI mostrano agli utenti.

Per accedere a quelle informazioni, i bot devono poter entrare nel sito, leggerlo senza errori, interpretarlo correttamente e decidere quali parti considerare affidabili.

L’analisi dei file di log è tra gli strumenti più conreti per verificare se i motori AI stanno realmente raggiungendo il tuo eCommerce e quali contenuti stanno utilizzando.

Se vuoi capire con esattezza come gli AI motori stanno leggendo il tuo sito e cosa puoi fare per migliorare la tua presenza nelle loro risposte siamo qui per aiutarti.

Richiedi informazioni sulla consulenza GEO: ti aiutiamo a rendere il tuo sito visibile nelle risposte di Gemini, ChatGPT e altri motori di ricerca AI.

In questo articolo...