Analisi degli N-gram con Screaming Frog – SEO Tech Academy

In un’epoca in cui la SEO non si limita più a contare keyword ma deve comprendere il linguaggio umano, l’analisi degli n-gram offre uno strumento per affinare la qualità semantica dei contenuti.

In questo appuntamento con la SEO Tech Academy vediamo perché analizzare le combinazioni di parole più frequenti nei nostri contenuti e come utilizzare l’analisi n-gram per individuare il keyword stuffing oppure migliorare la leggibilità e ottimizzare il focus semantico delle pagine.

Se non vuoi perderti i prossimi video, iscriviti al canale YouTube oppure alla newsletter dedicata per riceverli direttamente nella tua casella di posta

Cosa sono gli n-gram e quali sono i vantaggi

Gli n-gram sono combinazioni di elementi consecutivi – come parole, lettere o sillabe – che appaiono all’interno di un testo. Analizzarli significa andare oltre le singole keyword, per cogliere le strutture linguistiche ricorrenti che caratterizzano un contenuto.

Questa analisi permette di:

    • studiare la concorrenza, osservando quali combinazioni funzionano nei siti che si posizionano meglio;

    • individuare nuove opportunità di keyword e varianti naturali;

    • ottimizzare i contenuti rendendoli più coerenti e leggibili.
 

n-gram

Analisi della concorrenza

Attraverso Screaming Frog hai la possibilità di analizzare gli n-gram più comuni nei siti concorrenti che si posizionano bene: quali combinazioni di parole usano nei titoli, negli heading, nei meta tag o nel contenuto della pagina?

Se la pagina di un tuo competitor si posiziona meglio, l’n-gram ti aiuta a capire la sua strategia semantica.

Ottimizzazione dei contenuti

L’analisi degli n-gram consente di usare strutture linguistiche naturali e più affini al linguaggio umano.

Inoltre:

    • migliora la semantica del testo, rendendolo più rilevante agli occhi di Google e più leggibile per gli utenti;

    • identifica lacune nei contenuti esistenti (n-gram rilevanti non coperti);

    • supporta la creazione di contenuti correlati e l’organizzazione di contenuti pillar/topic cluster;

    • gli n-gram frequenti suggeriscono concetti correlati che possono essere usati come anchor text per link interni.

Come attivare l’analisi degli n-gram con Screaming Frog

Le fonti da cui possiamo ottenere gli n-gram possono essere Google Search Console, Semrush o affini e Screaming Frog.

L’analisi degli n-gram con Screaming Frog è molto semplice, sarà sufficiente seguire i prossimi step:

    • “Configuration” → “Spider” → “Extraction”

    • Nella tab HTML seleziona store HTML e Store Rendered HTML

    • Fai una scansione del sito

    • Seleziona gli URL e potrai osservare i tuoi n-gram

La scheda n-gram

Nella tab derivata a seguito della scansione potrai visualizzare le seguenti colonne:

  • Body Text: mostra quante volte un N-gram appare nel corpo testuale della pagina, esclusi elementi come titoli o link.

  • Density: indica la percentuale dell’N-gram rispetto al totale delle combinazioni presenti nel body, utile per capire se un’espressione è usata in modo eccessivo.

  • Body Text (senza link): evidenzia solo le occorrenze che non fanno parte di un link ipertestuale, filtrando potenziali distorsioni legate alla navigazione.

  • Title: segnala se e quante volte l’N-gram è presente nel titolo della pagina, elemento critico per il posizionamento SEO.

  • Inlinks Anchor Text: rileva le occorrenze nei testi di ancoraggio dei link in entrata verso quella pagina.

  • Inlinks Alt Text: indica se l’N-gram è presente nel testo alternativo delle immagini linkate alla pagina.

  • Totale: somma tutte le occorrenze dell’N-gram, a prescindere dalla loro posizione.

Un parametro da impostare è il livello di profondità: puoi filtrare la visualizzazione scegliendo n-gram composti da 2, 3, 4 o più parole consecutive. Questa flessibilità consente di cogliere sia le formule più brevi e generiche, sia le espressioni articolate e specifiche.
n-gram2

Limiti dell’analisi n-gram

Per quanto potente e immediato, l’approccio basato sugli n-gram presenta limiti strutturali che è importante conoscere per non fraintendere i dati emersi. Si tratta, in fondo, di una tecnica statistica: utile per osservare quanto qualcosa accade, ma non perché accade né cosa significhi davvero.

Il primo limite è l’assenza di comprensione del significato. Gli n-gram sono sequenze meccaniche di parole e non tengono conto dell’intento comunicativo. Due frasi semanticamente equivalenti – come “pasta senza glutine” e “senza glutine pasta” – verranno lette come combinazioni distinte, anche se il messaggio trasmesso è lo stesso.

A questo si aggiunge la mancanza di contesto. Le parole vengono analizzate in base alla loro posizione e frequenza, ma non in relazione al senso complessivo della frase o del paragrafo.

Infine il terzo limite riguarda la scarsa flessibilità linguistica. Sinonimi, parafrasi o varianti stilistiche vengono trattati come entità distinte. “Acquistare scarpe online” e “comprare calzature su internet” sono semanticamente affini, ma verranno letti come espressioni completamente separate.

L’analisi n-gram è un ottimo punto di partenza per scoprire pattern frequenti e diagnosticare anomalie nei testi, ma da sola non basta per guidare scelte strategiche profonde. Per farlo è necessario affiancarla a strumenti e metodi che sappiano leggere oltre le parole.

Vantaggi dell‘analisi semantica rispetto agli n-gram

Se gli n-gram rappresentano il livello più immediato dell’analisi testuale, l’analisi semantica va ben oltre: non si limita a contare parole, ma cerca di comprenderne il significato profondo, le connessioni logiche, il contesto d’uso.

I modelli semantici, basati su reti neurali e vettorializzazione del linguaggio, traducono le parole in coordinate all’interno di uno spazio multidimensionale, dove la distanza tra i termini riflette la loro vicinanza di significato. Questo permette di intercettare concetti simili, anche se espressi con parole differenti.

Grazie a questa logica:

  • si identificano entità e relazioni tra parole (non solo sequenze);

  • si ampliano le possibilità di copertura tematica, esplorando tutte le sfumature di un argomento;

  • si abilitano cluster intelligenti, in cui pagine e keyword vengono raggruppate in base all’intento di ricerca e alla coerenza semantica.

Un vantaggio particolarmente rilevante riguarda la pianificazione dei topic cluster e l’ottimizzazione della struttura informativa del sito. Mentre gli n-gram fotografano l’esistente, l’analisi semantica suggerisce direzioni evolutive: individua gap nei contenuti, relazioni non ancora sfruttate e offre spunti concreti per migliorare l’internal linking e la pertinenza delle pagine.

In conclusione l’analisi n-gram aiuta a rilevare pattern linguistici ricorrenti, mentre l’analisi semantica consente di costruire una visione più profonda e strategica. Insieme offrono una prospettiva solida per fare SEO del 2025.

Ti è piaciuta questa guida? Se non vuoi perderti i prossimi contenuti, iscriviti al canale YouTube oppure compila il form qui sotto per riceverli direttamente nella tua casella di posta!

La tua iscrizione non può essere convalidata.
La tua iscrizione è avvenuta correttamente.

ISCRIVITI ALLA SEO TECH ACADEMY

Ricevi i nostri video gratuiti, ogni lunedì alle 12 direttamente nella tua casella di posta!

Inviando il form dichiari di aver letto e compreso la Privacy Policy.

In questo articolo...