TF*IDF per il SEO: Risultati dei test e confronto degli strumenti

Potresti aver visto il termine TF * IDF essere stato lanciato nell’ultimo anno o giù di lì, ma nessuno potrebbe biasimarti se non hai ancora iniziato a prestare attenzione.

Molte mode SEO vanno e vengono, e alcune delle più interessanti finiscono per attrarre sanzioni, in seguito, giusto?

Ma TF * IDF è qualcosa di leggermente diverso.

Non è una manipolazione dei motori di ricerca; è un metodo per analizzare gli argomenti nei contenuti ed è basato sugli stessi principi dei motori di ricerca stessi. Per questo motivo, ha un potenziale straordinario per i SEO che hanno bisogno di un metodo veramente oggettivo per misurare e migliorare i contenuti.

Ho appena concluso un caso di studio esattamente in cosa è capace e i risultati sono piuttosto interessanti.

Nel caso in cui alcuni di voi fossero dov’ero solo pochi mesi fa, voglio assicurarmi di coprire ciò che ho imparato su TF * IDF e come viene utilizzato prima di arrivare a ciò che ho imparato dai miei esperimenti personali con esso.

Il corso intensivo inizia nella sezione successiva, ma se sei già un utente esperto, puoi trovare i risultati dei miei test personali e alcuni confronti dei migliori strumenti TF * IDF verso la fine.

In attesa di domande e commenti.

Che cos’è TF * IDF?

Quindi cos’è TF * IDF? Un acronimo? Un’equazione? Un’emoji di testo davvero oscura?

Sono almeno due di quelle cose.

In termini letterali, significa Frequenza Frequenza Termini Frequenza documento inversa.

equazione

TF * IDF è un’equazione che combina queste due misurazioni: la misurazione della frequenza con cui un termine viene utilizzato su una pagina (TF) e la misurazione della frequenza con cui tale termine appare in tutte le pagine di una raccolta (IDF) – per assegnare un punteggio, o peso, per l’importanza di quel termine per la pagina.

Lo so … allarme secchione, vero?

Vedremo perché questo è così importante per i SEO tra un po ‘, ma prima, diamo un’occhiata a da dove proviene.

L’equazione ha una storia molto lunga nel mondo accademico , in cui i ricercatori in campi diversi come la linguistica e l’architettura dell’informazione l’hanno usata come un modo per analizzare enormi biblioteche di documenti in breve tempo.

Viene anche utilizzato dai programmi di recupero delle informazioni (inclusi tutti i motori di ricerca) per ordinare e giudicare in modo efficiente la pertinenza di milioni di risultati.

C’è una differenza importante tra ciò che vuoi fare e ciò che il motore di ricerca vuole fare con queste stesse informazioni.

Il motore di ricerca vuole prendere in considerazione una raccolta composta da tutti i risultati sul Web mentre si desidera confrontare una pagina o un sito Web con solo i siti che lo stanno superando … vale a dire la top 10.

Diamo un’occhiata a TF e IDF in modo più approfondito …

Le equazioni che ti portano a TF * IDF

zona

Devi fare un po ‘più di matematica per ottenere entrambe le misurazioni coinvolte, ovvero TF e IDF . ma prometto che non sarà difficile. A seconda dell’applicazione, le equazioni per TF * IDF possono diventare molto più complicate degli esempi che sto usando di seguito.

Semplificato o no, in genere non vuoi essere sorpreso a fare questo lavoro a mano se stai cercando di ottimizzare un sito. Queste equazioni ti aiuteranno a capire come funziona TF * IDF, ma sono gli strumenti che sto discutendo alla fine che aprono davvero il potenziale.

Risolvi il primo, Frequenza dei termini, calcolando il numero di volte in cui un termine appare su una pagina. Quindi, collegare quel numero all’equazione seguente:

Frequenza termine = (conteggio dei termini non elaborato) / (conteggio delle parole totali del documento)

Da solo, il punteggio TF può dirti se stai usando una parola troppo raramente o troppo spesso, ma è davvero utile solo se confrontato con l’altra misura.

Calcola la frequenza inversa dei documenti dividendo il numero di documenti in cui appare il termine per il numero totale di documenti nella raccolta scelta, in questo modo:

Frequenza documento inversa (termine) = log (numero di documenti / (documenti contenenti parole chiave)

Con il punteggio IDF, ora puoi misurare l’importanza di una frase per una pagina, non solo il suo numero di usi. Questo è importante perché ti sta mettendo nella mentalità delle persone che stanno costruendo algoritmi per motori di ricerca.

Perché è importante per i SEO?

L’obiettivo finale di essere in grado di compilare questa equazione è quello di essere in grado di dare un punteggio di pertinenza praticabile ai tuoi contenuti . Usando gli strumenti TF * IDF ora disponibili, puoi quindi confrontare i tuoi punteggi con i punteggi delle pagine con le migliori prestazioni per qualsiasi termine.

Classificando le pagine su questa misura, puoi quasi abbassare il sipario su come Google potrebbe classificare i siti dedicati allo stesso argomento .

Non è noto se Google stia utilizzando TF * IDF nel loro algoritmo, e se lo sono, è una sua forma mutata o no? Detto questo, ci sono stati alcuni studi di correlazione privata di cui sono stato a conoscenza i cui dati suggeriscono che è probabile.

L’analisi TF * IDF consente di ottimizzare l’equilibrio dei termini nei contenuti in base a ciò che viene già premiato dall’algoritmo.

È enorme per i SEO perché segna il ritorno di qualcosa che tutti i vecchi cappelli conoscevano e … amavano?

Ritorni densità parola chiave?

ancora meme

No. Nessuno amava i giorni in cui regnava la densità delle parole chiave.

Tuttavia, TF * IDF potrebbe segnare un ritorno al primato di frasi e parole chiave come marcatore importante, solo in un modo molto diverso.

Il fatto è che Google non ha mai fatto affidamento sulla densità delle parole chiave come misura di valore. Sembrava proprio che lo facessero a persone che non capivano come funzionasse davvero l’algoritmo.

Invece, le strategie di densità delle parole chiave sono state un primo tentativo di capire come Google stesse usando TF * IDF per l’indicizzazione e il richiamo.

La gente cercava di creare parole chiave, quindi sono usciti alghe e filtri per combatterla (ciao panda).

Quindi, in un certo senso, la densità delle parole chiave è tornata. È scappato di casa da adolescente scontroso ed è tornato da adulto maturo con una laurea in scienze.

La densità delle parole chiave era una tattica precoce e limitata che incoraggiava soprattutto cattive abitudini. Misurare l’utilizzo dei termini con TF * IDF ti darà un’idea (almeno nella misura in cui i risultati migliori li stanno usando). Rivela ciò che è considerato naturale, in modo molto preciso.

Utilizzo di TF * IDF per migliorare la ricerca di parole chiave

TF * IDF fa un passo avanti rispetto alla densità di parole chiave nel modo in cui ti apre a intuizioni su intere famiglie di parole su un sito Web.

Ad esempio, immagina di aver già completato la ricerca di parole chiave per ottimizzare una pagina per “avvocato DUI Chicago”. La maggior parte degli strumenti di ricerca per parole chiave sputeranno parole chiave come “avvocato DUI a Chicago”, “avvocato DUI Chicago”, ecc.

Quando usi gli strumenti TF * IDF che tratterò in seguito, sarai anche in grado di trovare termini non SEO correlati che vengono utilizzati dalle pagine più classificate che non avresti mai trovato prima di utilizzare la normale ricerca di parole chiave . Termini come “legale”, “esperto”, “diritti” e “pratica”.

dui avvocato chicago

Queste parole non sarebbero apparse negli strumenti di ricerca delle parole chiave perché gli articoli stessi non sono classificati per loro, tuttavia sono necessari per raccontare la storia dell’intento di ricerca.

Mettiamo l’equazione da usare.

Fortunatamente, non dovrai farlo manualmente per i tuoi siti. C’è sempre uno strumento da usare, e hai solo pochi passaggi per vedere quelli che ho testato per i risultati.

Mettere TF * IDF da usare

Oh no Più matematica.

A questo punto potresti avere dei flashback al liceo, girarti sulla sedia cercando disperatamente l’orologio da parete che ti dirà quando sei libero.

Non ti preoccupare, questa volta, vado a fare i conti. Subito dopo, arriveremo alle cose succose: come utilizzare TF * IDF da usare.

Diamo un’occhiata all’equazione in azione …

Supponi che un documento, come la landing page di un cliente che stai esaminando, contenga il termine “PPC” 12 volte e sia lungo circa 100 parole. Se vuoi iniziare ad analizzare questo contenuto, dovresti iniziare collegandolo al termine equazione di frequenza da prima.

TF (PPC) = (12/100) = 0 .12

Ora, supponiamo che tu voglia capire come questo utilizzo rispetto all’uso di questo termine sul resto del web. Da un campione di 10.000.000, almeno alcune di queste pagine riguarderanno i servizi Web e includeranno riferimenti a PPC. Diciamo, 300.000 di loro.

Possiamo usare quei numeri per finire l’equazione della frequenza del documento inverso.

IDF (PPC) = log (10.000.000 / 300.000) = 1.52

Ora assegnate un punteggio alla vostra pagina in base a quel termine con l’equazione TF * IDF

TF * IDF (PPC) = 0.12 * 1.52 = 0.182

È un ottimo punteggio. O è?

La verità è che non si tratta davvero di rispettare un limite. Desideri bilanciare il tuo punteggio per termini mirati con gli URL con le migliori prestazioni a pagina 1.

Un punteggio elevato per un certo termine non è necessariamente una buona cosa (12 usi in 100 parole è molto, dopo tutto).

Che dire di termini comuni come “the” e “of”?

Ti starai chiedendo, che dire del rumore?

Che dire di tutte le parole comuni come “di”, “il” o “e”? A causa del modo in cui è strutturata l’equazione, questo rumore non è davvero un problema.

L’intera serie di documenti usa queste parole frequentemente, quindi l’importanza di queste parole viene notevolmente ridotta.

Torniamo all’equazione. Per illustrare davvero la differenza, diremo che ci sono tanti usi di “of” sulla pagina quanti sono i “PPC”.

TF (OF) = (12/100) = 0 .12

Ma guarda cosa succede quando finiamo l’equazione IDF con la consapevolezza che la stragrande maggioranza dei risultati conterrà la parola “di”, diciamo 8.000.000 di essi.

IDF (OF) = log (10.000.000 / 8.000.000) = 0,09

Ciò renderebbe il valore finale TF * IDF:

TF * IDF (OF) = 0 .12 * 0.09 = 0.010

Il valore TF * IDF aumenta proporzionalmente al numero di volte in cui la frase viene utilizzata nel documento, ma in questo caso è così compensata dalla frequenza della parola nel resto della raccolta, che il suo punteggio di valore viene craterizzato rispetto a l’ultimo esempio.

In altre parole, più la parola è comune, più piccolo diventa l’IDF.

E le frasi?

I motori di ricerca tendono a dare un peso fuori misura alle frasi composte da più termini.

parola

Ciò è particolarmente vero quando si considera la qualità naturale del linguaggio.

Naturalmente, si desidera portare queste considerazioni su come eseguire le valutazioni IDF TF *.

Fortunatamente, ciò non richiede alcuno sforzo aggiuntivo da parte tua. La maggior parte degli strumenti TF * IDF è in grado di calcolare le parole chiave come versioni a 2 e 3 parole.

Quando TF * IDF veniva utilizzato esclusivamente per scopi accademici e di ricerca, i termini erano già calcolati come insiemi di 2 parole chiamati bigrams o insiemi di 3 parole chiamati trigrammi. La stessa pratica è stata adottata dai motori di ricerca, quindi è importante analizzare i tuoi contenuti nello stesso modo in cui lo fanno.

Usando l’esempio di una pagina PPC di prima, diamo un’occhiata a una frase che potrebbe apparire su quella pagina e cosa possono suggerire le frasi sull’argomento.

“Una campagna PPC ha bisogno di molti annunci”

Ogni insieme di due parole in questa frase può essere calcolato come un insieme di bigrammi.

  • Un PPC
  • Campagna PPC
  • esigenze della campagna
  • eccetera.

Quando viene aggiunta una terza parola, diventa ancora più chiaro quanto sia importante il contesto aggiunto quando vengono prese in considerazione frasi più lunghe.

  • Una campagna PPC
  • Esigenze della campagna PPC
  • la campagna ha bisogno di molti
  • eccetera.

Non tutti gli strumenti TF * IDF sono in grado di gestire più di due combinazioni. Esaminerò più in dettaglio le capacità di ciascuno nel confronto degli strumenti situato più in basso.

Come usare TF * IDF

TF * IDF si adatta perfettamente al processo di sviluppo dei contenuti di quasi tutti i SEO.

È un metodo per imparare di più prima di iniziare a creare contenuti e poi sapere dove e come perfezionarlo di nuovo.

Dopo aver scelto uno strumento, è solo una procedura dettagliata per ottenere maggiori informazioni sulla scelta di ogni parola chiave. Se non hai ancora scelto uno strumento TF * IDF, puoi trovare i dati dei test che ho eseguito con loro nella sezione successiva.

1) Scrivi contenuto

scrivere contenuti

Scrivi i contenuti secondo i più alti standard che conosci o fai riferimento a un contenuto che stai ottimizzando per un cliente. Crea un elenco di argomenti di una, due o tre parole che vuoi trattare e portalo allo strumento TF * IDF che hai scelto.

Il tuo obiettivo qui è quello di indirizzare le parole chiave e gli URL dei principali domini che li indirizzano per rivelare quali argomenti ti mancano e quali argomenti non stai trattando in modo sufficientemente approfondito.

2) Collegare a uno strumento TF * IDF

Ogni strumento funziona in modo leggermente diverso, come potrai vedere, di seguito. Tracciano anche informazioni diverse, ma quelle più utili sono orientate ad aiutarti a capire come i tuoi concorrenti stanno ottenendo successo con il loro uso delle parole chiave.

Sfrutta tutte le funzionalità che lo strumento che hai scelto ti aiuta a scoprire i termini associati ai primi 10-20 URL di primo livello e quindi produce punteggi che riflettono il peso di ogni altro termine che stanno utilizzando.

3) Ottimizzare nuovamente il contenuto

Ora che hai un’idea completa degli argomenti trattati da ciascuno dei tuoi concorrenti e una comprensione della frequenza con cui queste parole vengono utilizzate, puoi utilizzare tali informazioni per perfezionare il tuo contenuto.

Dai un secondo passaggio al contenuto e cerca modi naturali per introdurre argomenti che non hai ancora trattato. Ricorda, la tua motivazione non è quella di roba in modo innaturale, ma di ripristinare connessioni naturali dove attualmente mancano.

4) Pubblica

Pubblica i contenuti aggiornati con gli approfondimenti che hai recentemente raccolto dalle tue ricerche. Da qui, puoi continuare ad analizzarlo e qualsiasi cambiamento nei ranghi.

5) Mostra i risultati prima e dopo TF * IDF

surfista prima e dopo

Uno dei vantaggi di TF * IDF è che ti consente di tenere traccia delle prestazioni a un livello molto minuto. Prima e dopo ogni modifica apportata ai tuoi contenuti, puoi produrre schermate di come è cambiato il bilancio degli argomenti delle tue pagine. Questi sono utili per i clienti interessati a visualizzare metriche specifiche per le modifiche che stai apportando ai loro contenuti.

Ora siamo pronti per entrare nella parte che stavate aspettando!

Ho avuto la possibilità di giocare con tutti i più grandi strumenti TF * IDF sui miei siti e ho molto da mostrarti su cosa possono fare.

Ma prima, lasciami condividere alcuni risultati che ho ottenuto testando TF * IDF negli interwebs reali.

Risultati dei test

Vorrei prefigurare questa sezione dicendo che sto testando TF * IDF da oltre un anno.

Sin dalla prima volta che ho esaminato gli algoritmi di densità semantica basati su nicchia, il concetto ha colpito un accordo armonioso con me.

E anche se la giusta mentalità in ogni tipo di sperimentazione è l’agnosticismo, volevo davvero che TF * IDF funzionasse.

Detto questo … per molto tempo, ho ottenuto risultati poco brillanti.

E poi le cose sono cambiate.

Sto per guidarti attraverso la cronologia, ma prima, lascia che ti descriva come l’ho provato.

Identificazione di test per gli esperimenti TF * IDF

La creazione di strutture di test a variabile singola è piuttosto impegnativa per questo particolare scenario.

cane di prova

Che cos’è un test a variabile singola?

In un ambiente di test super controllato, si avrebbero due gruppi di test case.

Un gruppo sarebbe il gruppo di controllo .

Nel gruppo di controllo, non cambi nulla. Stai semplicemente ottenendo un risultato “basale” da confrontare con il gruppo sperimentale.

Il gruppo sperimentale è completamente identico al gruppo di controllo sotto molti aspetti.

Le pagine Web potrebbero avere gli stessi tipi di backlink, hanno come target le stesse parole chiave, ecc. Tutte queste variabili devono essere simili e costanti tra loro, altrimenti il ​​test è difettoso.

Tuttavia, con il gruppo sperimentale, si cambia una cosa. Questa è la “singola variabile”. E in questo caso, sarebbe l’ottimizzazione TF * IDF.

Per i siti Web nel gruppo sperimentale, eseguire l’ottimizzazione TF * IDF, lasciarli seduti e quindi confrontare i risultati con il gruppo di controllo.

La sfida con i test SEO è che non puoi mai controllare tutte le variabili. C’è sempre rumore che arriva sotto forma di backlink, traffico, concorrenza, modifiche dell’algoritmo, ecc.

Sai come è SEO. È rumoroso AF.

Un modo in cui alla gente piace creare test SEO è usare parole incomprensibili.

Diciamo che creiamo 10 pagine interne sullo stesso dominio, tutte rivolte a parole inventate come “flubblegoblin”.

Occuperebbero l’intera prima pagina di Google poiché non ci sono risultati di ricerca per “flubblegoblin” (ancora).

flubblegoblin

Queste pagine sarebbero molto simili per lunghezza, ottimizzazione, ecc.

Potresti quindi ottimizzarne tre con TF * IDF, lasciarli sedere e quindi se TF * IDF funziona, dovrebbero iniziare la classifica # 1-3, giusto?

Ma questo approccio è imperfetto dall’inizio.

Dovresti ottimizzare i loro contenuti rispetto a tutte le altre pagine che hai creato, che sono già state create in modo simile l’una all’altra.

Pertanto, se imposti l’esperimento correttamente dall’inizio, non ci sarebbe alcuna ottimizzazione possibile. Sono già identici.

Quindi anche un vicolo cieco.

Purtroppo, ho seguito il seguente approccio ai test.

Vorrei isolare più pagine su più siti Web live che presentavano le seguenti caratteristiche:

  • Classifiche statiche per almeno un mese
  • Non riceve alcun backlink o succo di link interno

Vorrei quindi applicare l’ottimizzazione TF * IDF e lasciarli riposare per circa 30 giorni e cercare aumenti o diminuzioni delle classifiche.

Non sono del tutto soddisfatto di questo approccio in quanto un sacco di “rumore” può entrare in questa struttura di esperimento a causa di modifiche dell’algoritmo, invecchiamento dei siti Web, ecc

Così, ho deciso di combattere questa inesattezza, testando su più fasi e molte pagine diverse.

Ora sullo spettacolo.

Fase 1 – Tra dicembre e marzo

Ah, i secoli bui.

Strumenti di ottimizzazione:

I miei primi esperimenti con l’ottimizzazione TF * IDF sono stati eseguiti tra le date sopra menzionate.

Ho eseguito esperimenti in tre diverse occasioni, in 12 URL diversi e ho tracciato 36 parole chiave diverse (3 per URL).

In ogni caso, i risultati sono stati lasciati stabilizzare per 45 giorni (per ogni evenienza).

Ecco i risultati poco brillanti:

risultati del test tfidf di fase 1

Whomp whomp.

Non sembra esserci molto effetto né nella direzione positiva né in quella negativa.

Dopo tanti test e risultati come questi, perché ho continuato?

Perché, come ho detto prima, ero davvero interessato al concetto ed ero (per essere sincero) abbastanza sorpreso che non avesse fatto nulla.

Ho iniziato a dubitare della mia integrità di testcase e degli strumenti che stavo usando.

Alla fine, mi sono appena detto che avrei continuato a testarlo periodicamente solo per “controllare” le cose.

Fase 2 – aprile

Per questa seconda serie di test, ho deciso di attenermi agli strumenti di testo per l’analisi e l’ottimizzazione.

Perché?

Per uno perché il software ha permesso le regolazioni all’interno dello strumento, così ho potuto modificare il mio testo e rivalutare al volo (farò una revisione dello strumento più avanti in questo articolo).

E due, perché il proprietario mi ha dato una licenza gratuita (grazie Michael).

Sono stato sorpreso di vedere i seguenti risultati la seconda volta.

risultati del test tfidf di fase 2

In due delle tre prove abbiamo riscontrato movimenti positivi.

Non è stato un movimento innovativo, ma abbastanza per mostrare una tendenza.

Ma ecco il kicker.

Durante questo momento, è stato rilasciato un aggiornamento dell’algoritmo di base. È successo a marzo per l’esattezza.

I due siti che hanno mostrato movimenti positivi erano attualmente maltrattati da questo aggiornamento dell’algoritmo.

E mentre tutte le pagine del sito stavano subendo una perdita nelle classifiche, le pagine in cui stavo testando TF * IDF hanno mantenuto la loro posizione o guadagnato posizioni.

E poi ho trovato articoli come questo …

vedi articolo

Se questi aggiornamenti dell’algoritmo riguardavano davvero la pertinenza, quale miglior indicatore di rilevanza rispetto alle dannate parole che compaiono sulle pagine Web.

La coincidenza è stata sufficiente per aumentare il mio interesse.

È stato sufficiente per me firmare completamente su TF * IDF e aggiungerlo alle mie procedure operative standard (SOP)?

Assolutamente no.

Solo più test potrebbero farlo.

Fase 3 – maggio

Non è cambiato nulla in questo esperimento.

Ho continuato a utilizzare gli strumenti di testo come software preferito.

L’unica cosa diversa erano le nuove prove e una data diversa.

risultati del test tfidf di fase 3

Le tendenze sono rimaste le stesse della fase 2.

Risultati più positivi.

Questa volta ho scavato nelle cose e ho notato alcuni schemi.

I risultati in genere peggiorano prima di migliorare

Nel 61% delle parole chiave che stavo monitorando, le parole chiave sono peggiorate prima di migliorare.

Solo dopo 22-24 giorni dopo il calcio d’inizio iniziale e la nuova memorizzazione nella cache del nuovo testo ottimizzato, le classifiche hanno iniziato a girare l’angolo.

Ottimizzando una parola chiave, è possibile disattivarne un’altra

Faccio molto SEO affiliato, quindi la maggior parte delle pagine che stavo sperimentando erano pagine di recensioni.

Quindi, quando decido per quali parole chiave analizzare e ottimizzare, in genere sceglierei parole chiave “migliori ___” come “polvere proteica migliore”.

Tuttavia, per i test, stavo monitorando una vasta gamma di parole chiave come “benefici in polvere proteica”.

Quelle parole chiave che non sono realmente correlate a query orientate alla revisione come “migliore polvere proteica” o “recensioni polvere proteica” avevano maggiori probabilità di sperimentare movimenti negativi.

Fase 4 – agosto

Questa volta ho deciso di utilizzare uno strumento diverso: Link Assistant’s Website Auditor .

Ho cambiato le cose da Strumenti di testo poiché c’è (quello che credo sia) un difetto nel suo impianto, di cui parlerò più avanti.

Ecco i risultati:

risultati del test tfidf di fase 4

A questo punto, ho iniziato a sentirmi abbastanza a mio agio con i risultati da giustificare la scrittura di questo articolo e iniziare a incorporare questa tecnica nel nostro SOP.

Soprattutto con risultati come questi che hanno richiesto la costruzione di zero link:

errore marchiano

Confronto tra strumenti: Sufer vs Sito Web Auditor vs Strumenti di testo

Ecco un confronto tra tre degli strumenti più popolari sul mercato che possono essere utilizzati per l’analisi e l’ottimizzazione del contenuto TF * IDF: Surfer’s True Density vs Link Assistant’s Website Auditor vs Text Tools .

Confronto strumenti TF * IDF

Piattaforma (vincitore: surfista)

Surfer viene eseguito nel cloud. Si accede alla loro piattaforma e tutta l’analisi viene eseguita sul lato server.

schermo a densità reale

Ovviamente, questo è il modo in cui molti di noi amano eseguire il nostro software in questi giorni (se possibile), quindi stiamo dando il nostro voto a Surfer quando si tratta di piattaforma.

Text Tools è anche eseguito nel cloud e ha delle belle viste grafiche (vedi sotto), ma Surfer ha un leggero vantaggio quando si tratta della potenza della loro piattaforma. Surfer non fa solo TFIDF, ma fa molto di più.

strumenti di testo

Website Auditor è un software scaricabile. La versione gratuita include l’analisi TF * IDF.

È uno strumento piuttosto solido, come puoi vedere di seguito.

dashboard del revisore dei siti Web

Tuttavia, preferiamo ancora lavorare sul cloud, quindi il voto va a Surfer.

Usabilità (Vincitore: Surfer)

Immediatamente, il Revisore dei siti Web ha un grosso colpo contro di esso poiché non è possibile salvare i progetti.

Questa è una funzione che viene sbloccata quando esegui l’upgrade alla versione a pagamento dello strumento, quindi immagino sia un punto controverso, ma ho pensato di buttarlo lì.

Strumenti di testo è un po ‘glitch su Chrome. Almeno la versione con cui sto giocando in questo momento.

Per la mia vita, non riesco a passare tra le varie schede nella modalità di analisi su Chrome. Sono bloccato in modalità panoramica e non riesco ad entrare nelle cose succose come “Confronta” in cui analizzi il tuo URL rispetto all’analisi della concorrenza.

pulsanti

Detto questo, su Firefox va tutto bene.

Immagino che un flusso di lavoro TF * IDF produttivo funzioni in questo modo:

  • Analisi della concorrenza
  • Confronto con i tuoi contenuti
  • Ottimizzazione dei tuoi contenuti
  • Ri-confronto con i tuoi contenuti
  • Pubblicare

Strumenti di testo ti consente di copiare e incollare il testo della tua pagina nello strumento stesso. Se apporti modifiche al contenuto, puoi semplicemente modificare il contenuto nello strumento e ripetere l’analisi per vedere come hai fatto.

Il revisore dei siti Web confronta solo con gli URL. Devi apportare modifiche ai tuoi contenuti live o pubblicare i tuoi contenuti in un documento Google e fare in modo che lo strumento lo analizzi.

Non è un affare, ma richiede tempo ed è fastidioso.

Ora Surfer passa a un altro livello e ti offre una funzione di “Content Editor” che ti offre al volo tassi di completamento della densità delle parole chiave.

schermo a densità reale

Questo rende Surfer super facile da lavorare .

Precisione (Vincitore: Surfer)

Mentre la mia squadra e io stavamo giocando con gli strumenti di testo, abbiamo iniziato a notare qualcosa di strano.

Supponiamo che tu analizzi un termine come “parole chiave cannibalizzazione”.

Quando confronti il ​​risultato con il mio articolo sulla cannibalizzazione delle parole chiave , troverai un risultato simile al seguente:

peso

Noterai che per la parola “strategia” il mio contenuto (linea gialla) diventa zero perché non ho quella parola sulla mia pagina.

Ma quello che scoprirai è che anche se sembra che la media sia di circa 3,4, dovrei solo aggiungere una volta la parola “strategia” per passare a numeri adeguati.

Ne ho parlato con lo sviluppatore Michael Kaiser (un ragazzo adorabile), e ha detto che il suo strumento indica l’asse y come un “peso”, calcolato internamente. E molto spesso, aggiungere una parola una volta a un articolo è sufficiente per soddisfare il requisito di peso.

Questo va bene, ma sto più cercando una guida reale su quante volte ogni parola dovrebbe apparire nell’articolo.

Il revisore dei siti Web offre questo, ma ha un difetto critico …

ingrandisci il controllo del sito web

Il revisore dei siti Web non tiene conto del conteggio delle parole!

Se ho un articolo di 500 parole e tutti gli altri hanno un articolo di 1000 parole a pagina 1, mi darà comunque indicazioni come se avessi 1000 parole, causandomi un’ottimizzazione eccessiva. Sheesh.

Quindi, di nuovo, Surfer ruba lo spettacolo.

L’algoritmo TFIDF di Surfer si chiama True Density, che è un po ‘diverso, ma a mio avviso, più accurato.

Inoltre, interrompe la guida tra parole, frasi e numeri.

granularità a densità reale

E, naturalmente, ottiene la vittoria nella categoria di precisione grazie a questo algoritmo e al fatto importante che prende in considerazione il conteggio delle parole.

Costo (vincitore: revisore dei siti Web)

Concorrenza sleale. Non puoi competere con libero.

La nostra scelta: Surfer SEO

logo del surfista

Strumenti di testo ha molte cose da fare. Preferirei di gran lunga lavorare sul cloud ed eseguire le mie modifiche all’interno di uno strumento in modo da poter eseguire una rapida analisi.

Il revisore dei siti Web è gratuito, ma ha i suoi difetti in termini di precisione.

Alla fine, sto cercando una soluzione basata su cloud che mi dia una guida, a livello granulare, della densità media delle parole chiave di nicchia per ogni frase e parola. Per questo, sto con Surfer .

FAQ

Che cos’è TF IDF SEO?

Questo è il processo SEO per ottimizzare la densità delle parole chiave dei tuoi contenuti con la guida dell’algoritmo noto come TF IDF.

Come funziona TF IDF?

TF IDF si riferisce al termine frequenza moltiplicato per la frequenza inversa del documento. TF cresce con il numero di volte in cui una determinata parola appare su una pagina. Mentre IDF diminuisce il valore di parole comunemente usate come “e”.

Ogni parola ottiene un punteggio, che può essere utilizzato per determinare l’importanza di varie parole nel contenuto.

Google utilizza TF IDF?

Probabilmente nella sua interezza. Se lo usano, è una versione avanzata che si è evoluta oltre la sua comprensione originale negli anni ’70.

Chi ha inventato TF IDF?

L’informatica britannica Karen Spärck Jones ha inventato TF * IDF.

TF IDF può essere negativo?

No. Entrambi i valori TF e IDF non possono mai essere negativi.

Conclusione

Spero che questo articolo abbia aiutato a chiarire le cose riguardo all’analisi estremamente utile, ma spesso fraintesa, TF * IDF.

Non solo hai imparato la matematica dietro di essa, ma anche come si applica al SEO e creando rilevanza nei tuoi articoli.

Hai anche visto alcuni risultati dei test su come si presenta l’ottimizzazione nelle SERP, nonché un confronto tra gli strumenti più popolari sul mercato.

In caso di domande, utilizzare la casella di commento qui sotto.

Open

info.ibdi.it@gmail.com

Close