Cerca

TF*IDF für SEO: Testergebnisse und Werkzeugvergleich

Sie haben vielleicht gesehen, dass der Begriff TF*IDF im letzten Jahr oder so eingeführt wurde, aber niemand könnte Ihnen die Schuld geben, wenn Sie noch nicht angefangen haben, aufzupassen.

Viele SEO-Moden kommen und gehen, und einige der interessantesten am Ende ziehen Sanktionen, später, nicht wahr?

Aber TF*IDF ist etwas anderes.

Es ist keine Manipulation von Suchmaschinen; ist eine Methode zur Analyse von Themen im Inhalt und basiert auf den gleichen Prinzipien wie Suchmaschinen selbst.Aus diesem Grund hat es ein enormes Potenzial für SEOs, die eine wirklich objektive Methode benötigen, um Inhalte zu messen und zu verbessern.

Ich habe gerade eine Fallstudie genau das abgeschlossen, wozu sie in der Lage ist, und die Ergebnisse sind sehr interessant.

Für den Fall, dass einige von Ihnen dort waren, wo ich vor ein paar Monaten war, möchte ich sicherstellen, dass ich über das, was ich über TF*IDF gelernt habe und wie es verwendet wird, bevor ich zu dem komme, was ich aus meinen persönlichen Experimenten mit ihm gelernt habe, berichten.

Der Intensivkurs beginnt im nächsten Abschnitt, aber wenn Sie bereits ein erfahrener Benutzer sind, können Sie die Ergebnisse meiner persönlichen Tests und einige Vergleiche der besten TF* IDF Tools gegen Ende finden.

Wir freuen uns auf Fragen und Kommentare.

Was ist TF * IDF?

Was ist TF* IDF?Ein Akronym?Eine Gleichung?Ein wirklich dunkles Text-Emoji?

Das sind mindestens zwei dieser Dinge.

Wörtlich bedeutet dies Frequenzbegriffe Umkehren der Dokumenthäufigkeit.

Gleichung

TF * IDF ist eine Gleichung, die diese beiden Messungen kombiniert: Messung, wie oft ein Begriff auf einer Seite (TF) verwendet wird, und Messung, wie oft dieser Begriff auf allen Seiten in einer Sammlung (IDF) angezeigt wird – um eine Punktzahl oder Gewichtung für die Bedeutung dieses Begriffs für die Seite zuzuweisen.

Ich weiß… Nerd-Alarm, oder?

Wir werden sehen, warum dies für SEOs in einer Weile so wichtig ist, aber zuerst werfen wir einen Blick darauf, woher es kam.

Die Gleichung hat eine sehr lange Geschichte in der Wissenschaft, wo Forscher in so unterschiedlichen Bereichen wie Linguistik und Informationsarchitektur es als eine Möglichkeit, riesige Bibliotheken von Dokumenten in kurzer Zeit zu analysieren.

Es wird auch von Informationsabrufprogrammen (einschließlich aller Suchmaschinen) verwendet, um die Relevanz von Millionen von Ergebnissen effizient zu sortieren und zu beurteilen.

Es gibt einen wichtigen Unterschied zwischen dem, was Sie tun möchten, und dem, was die Suchmaschine mit diesen Informationen tun möchte.

Die Suchmaschine möchte eine Sammlung in Betracht ziehen, die aus allen Ergebnissen im Web besteht, während Sie eine Seite oder Website mit nur den Websites vergleichen möchten, die sie übertreffen…die Top 10 ist.

Werfen wir einen genaueren Blick auf TF und IDF…

Die Gleichungen, die Sie zu TF * IDF führen

Bereich

Sie müssen ein wenig mehr Mathematik tun, um beide Messungen einzubeziehen, nämlich TF und IDF.aber ich verspreche, dass es nicht schwierig sein wird.Je nach Anwendung können Gleichungen für TF* IDF viel komplizierter werden als die Beispiele, die ich unten verwende.

Vereinfacht oder nicht, möchten Sie in der Regel nicht überrascht sein, diese Aufgabe von Hand zu erledigen, wenn Sie eine Website optimieren möchten.Diese Gleichungen werden Ihnen helfen zu verstehen, wie TF * IDF funktioniert, aber es sind die Werkzeuge, die ich am Ende bespreche, die wirklich das Potenzial eröffnen.

Lösen Sie die erste, Begriffshäufigkeit, indem Sie berechnen, wie oft ein Term auf einer Seite angezeigt wird.Verknüpfen Sie diese Zahl dann mit der folgenden Gleichung:

Begriffshäufigkeit = (Anzahl der nicht verarbeiteten Begriffe) / (Gesamtwortanzahl des Dokuments)

Auf eigene Faust kann die TF-Punktzahl Ihnen sagen, ob Sie ein Wort zu selten oder zu oft verwenden, aber es ist nur wirklich nützlich, wenn es mit dem anderen Maß verglichen wird.

Berechnet die umgekehrte Häufigkeit von Dokumenten, indem die Anzahl der Dokumente, in denen der Begriff angezeigt wird, durch die Gesamtzahl der Dokumente in der von Ihnen auswählten Bibliothek dividiert wird, wie folgt:

Reverse Document Frequency (Term) = log (Anzahl der Dokumente / (Dokumente mit Schlüsselwörtern)

Mit dem IDF-Score können Sie nun die Bedeutung eines Satzes für eine Seite messen, nicht nur die Anzahl der Verwendungen.Dies ist wichtig, weil es Sie in der Denkweise von Menschen, die Suchmaschinenalgorithmen erstellen.

Warum ist es wichtig für SEOs?

Das ultimative Ziel, diese Gleichung kompilieren zu können, ist es, Ihren Inhalten eine tragfähige Relevanzbewertung zu geben.Mit den jetzt verfügbaren TF*IDF-Tools können Sie dann Ihre Ergebnisse mit den besten Performance-Seitenbewertungen für jeden Begriff vergleichen.

Indem Sie Seiten zu dieser Maßnahme einordnen, können Sie den Vorhang fast senken, wie Google Websites, die dem gleichen Thema gewidmet sind, klassifizieren könnte.

Es ist nicht bekannt, ob Google TF* IDF in ihrem Algorithmus verwendet, und wenn sie es sind, ist es eine mutierte Form davon oder nicht?Das heißt, es gab einige private Korrelationsstudien, die ich kenne, deren Daten darauf hindeuten, dass es wahrscheinlich ist.

Mit der TF* IDF-Analyse können Sie die inhaltliche Ausgewogenheit auf der Grundlage dessen optimieren, was bereits vom Algorithmus belohnt wird.

Es ist riesig für SEOs, weil es die Rückkehr von etwas markiert, was alle alten Hüte wussten und… Liebte?

Geben Sie keyword density zurück?

noch meme

Nein. Niemand liebte die Tage, als Die Stichwortdichte herrschte.

TF* IDF könnte jedoch eine Rückkehr zum Primat von Phrasen und Schlüsselwörtern als wichtigen Marker markieren, nur auf eine ganz andere Art und Weise.

Tatsache ist, dass Google sich nie auf die Keyword-Dichte als Wertmaß verlassen hat.Es schien nur, als ob sie es Leuten antun, die nicht verstanden haben, wie der Algorithmus wirklich funktionierte.

Stattdessen waren Keyword-Dichtestrategien ein erster Versuch zu verstehen, wie Google TF*IDF für die Indizierung und den Rückruf verwendet.

Die Leute versuchten, Schlüsselwörter zu schaffen, also kamen Algen und Filter heraus, um es zu bekämpfen (hallo Panda).

In gewisser Weise ist die Keyword-Dichte also zurück.Als mürrischer Teenager flüchtete er von zu Hause und kehrte als reifer Erwachsener mit einem Bachelor-Abschluss in Naturwissenschaften zurück.

Die Keyword-Dichte war eine frühe und begrenzte Taktik, die vor allem schlechte Gewohnheiten förderte.Die Messung der Verwendung von Begriffen mit TF* IDF gibt Ihnen eine Idee (zumindest in dem Maße, in dem die besten Ergebnisse sie verwenden).Es zeigt, was als natürlich gilt, sehr genau.

Verwenden von TF * IDF zur Verbesserung der Keyword-Suche

TF* IDF ist der Keyword-Dichte einen Schritt voraus, da sie Ihnen Einblicke in ganze Wortfamilien auf einer Website gewährt.

Stellen Sie sich beispielsweise vor, Sie haben die Suche nach Schlüsselwörtern bereits abgeschlossen, um eine Seite für "DUI Chicago Attorney" zu optimieren.Die meisten Keyword-Suchwerkzeuge werden Keywords wie "DUI lawyer in Chicago", "DUI Chicago lawyer" usw. ausspucken.

Wenn Sie die TF*IDF-Tools verwenden, die ich später behandeln werde, werden Sie auch in der Lage sein, verwandte Nicht-SEO-Begriffe zu finden, die von den am häufigsten gewerteten Seiten verwendet werden, die Sie vor der regulären Keyword-Suche nie gefunden hätten.Begriffe wie "legal", "erfahren", "Rechte" und "Praxis".

dui chicago Rechtsanwalt

Diese Wörter wären nicht in Keyword-Suchwerkzeugen erschienen, weil die Artikel selbst nicht für sie klassifiziert sind, aber sie sind notwendig, um die Geschichte der Suchabsicht zu erzählen.

Lassen Sie uns die Gleichung verwenden.

Glücklicherweise müssen Sie es nicht manuell für Ihre Websites tun.Es gibt immer ein Werkzeug zu verwenden, und Sie haben nur ein paar Schritte, um die zu sehen, die ich für die Ergebnisse getestet.

Setzen Sie TF * IDF zur Verwendung

Oh no More mathe.

An diesem Punkt können Sie Rückblenden in der High School haben, drehen Sie sich in Ihrem Stuhl verzweifelt auf der Suche nach der Wanduhr, die Ihnen sagen wird, wenn Sie frei sind.

Keine Sorge, dieses Mal werde ich die Mathematik machen.Gleich danach kommen wir zu den saftigen Dingen: wie man TF*IDF verwendet.

Werfen wir einen Blick auf die Gleichung in Aktion…

Angenommen, ein Dokument, wie die Zielseite eines Kunden, den Sie überprüfen, enthält den Begriff "PPC" 12 Mal und ist etwa 100 Wörter lang.Wenn Sie mit der Analyse dieses Inhalts beginnen möchten, sollten Sie ihn zunächst mit dem Begriff Frequenzgleichung von zuvor verknüpfen.

TF (PPC) = (12/100) = 0 .12

Angenommen, Sie möchten verstehen, wie diese Verwendung im Vergleich zur Verwendung dieses Begriffs im Rest des Webs.Aus einer Stichprobe von 10.000.000 wird zumindest ein Teil dieser Seiten Webdienste abdecken und Verweise auf PPC enthalten.Nehmen wir an, 300.000 von ihnen.

Wir können diese Zahlen verwenden, um die umgekehrte Dokumentfrequenzgleichung zu beenden.

IDF (PPC) = log (10.000.000 / 300.000) = 1,52

Bewerten Sie nun Ihre Seite basierend auf diesem Begriff mit der TF * IDF-Gleichung

TF * IDF (PPC) = 0,12 * 1,52 = 0,182

Das ist eine gute Punktzahl.Oder ist es das?

Die Wahrheit ist, dass es nicht wirklich darum geht, eine Grenze einzuhalten.Sie möchten Ihre Punktzahl für Zielbegriffe mit den leistungsstärksten URLs auf Seite 1 ausgleichen.

Eine hohe Punktzahl für einen bestimmten Begriff ist nicht unbedingt eine gute Sache (12 Verwendungen in 100 Wörtern ist schließlich eine Menge).

Was ist mit gebräuchlichen Begriffen wie "das" und "von"?

Sie fragen sich vielleicht, was ist mit dem Lärm?

Was ist mit allen gängigen Wörtern wie "von", "der" oder "e"?Aufgrund der Art und Weise, wie die Gleichung strukturiert ist, ist dieses Rauschen kein wirkliches Problem.

Der gesamte Satz von Dokumenten verwendet diese Wörter häufig, so dass die Bedeutung dieser Wörter stark reduziert wird.

Kehren wir zur Gleichung zurück.Um den Unterschied wirklich zu veranschaulichen, werden wir sagen, dass es so viele Verwendungen von "von" auf der Seite gibt, wie es "PPC" gibt.

TF (OF) = (12/100) = 0 .12

Aber sehen Sie, was passiert, wenn wir die IDF Gleichung mit dem Wissen beenden, dass die überwiegende Mehrheit der Ergebnisse das Wort "von" enthalten wird, sagen 8.000.000 von ihnen.

IDF (OF) = log (10.000.000 / 8.000.000) = 0,09

Dies würde den Endwert TF * IDF machen:

TF * IDF (OF) = 0 .12 * 0,09 = 0,0
10

Der TF * IDF-Wert erhöht sich proportional zur Anzahl der Verwendungen des Ausdrucks im Dokument, wird in diesem Fall aber durch die Häufigkeit des Wortes in der restlichen Sammlung kompensiert, so dass seine Wertpunktzahl im Vergleich zum letzten Beispiel zerkratzt ist.

Mit anderen Worten, je häufiger das Wort, desto kleiner wird die IDF.

Was ist mit den Sätzen?

Suchmaschinen neigen dazu, Phrasen, die aus mehreren Begriffen bestehen, ein überdasspoke Gewicht zu verleihen.

Wort

Dies gilt insbesondere, wenn man die natürliche Qualität der Sprache betrachtet.

Natürlich möchten Sie diese Überlegungen zur Durchführung von IDF TF*-Bewertungen mitbringen.

Glücklicherweise erfordert dies keinen zusätzlichen Aufwand ihrerseits.Die meisten TF* IDF-Tools können Schlüsselwörter als 2- und 3-Wort-Versionen berechnen.

Als TF * IDF ausschließlich für akademische und Forschungszwecke verwendet wurde, wurden die Begriffe bereits als Sätze von 2 Wörtern berechnet, die Bigrams oder Sätze von 3 Wörtern genannt Trigramme genannt werden.Die gleiche Praxis wurde von Suchmaschinen übernommen, daher ist es wichtig, Ihre Inhalte auf die gleiche Weise zu analysieren, wie sie es tun.

Am Beispiel einer PPC-Seite von früher werfen wir einen Blick auf einen Ausdruck, der auf dieser Seite erscheinen könnte, und welche Sätze zu diesem Thema vorschlagen können.

"Eine PPC-Kampagne braucht viele Anzeigen"

Jeder Satz von zwei Wörtern in diesem Satz kann als ein Satz von Murmeln berechnet werden.

  • Ein PPC
  • PPC-Kampagne
  • Kampagnenbedarf
  • Etcetera.

Wenn ein drittes Wort hinzugefügt wird, wird noch deutlicher, wie wichtig der Kontext ist, der hinzugefügt wird, wenn längere Sätze berücksichtigt werden.

  • Eine PPC-Kampagne
  • PPC-Kampagnenbedarf
  • die Kampagne braucht viele
  • Etcetera.

Nicht alle TF* IDF-Tools können mehr als zwei Kombinationen verarbeiten.Ich werde die Möglichkeiten jedes einzelnen beim Vergleich der unten aufgeführten Instrumente genauer untersuchen.

Wie ist TF * IDF anzuwenden?

TF* IDF fügt sich perfekt in den Content-Entwicklungsprozess fast aller SEOs ein.

Es ist eine Möglichkeit, mehr zu erfahren, bevor Sie mit dem Erstellen von Inhalten beginnen und dann wissen, wo und wie Sie sie erneut verfeinern können.

Nachdem Sie ein Tool ausgewählt haben, ist es nur eine exemplarische Vorgehensweise, um weitere Informationen zur Auswahl der einzelnen Schlüsselwörter zu erhalten.Wenn Sie noch kein TF* IDF-Tool ausgewählt haben, finden Sie im nächsten Abschnitt die Testdaten, die ich mit ihnen ausgeführt habe.

1) Inhalt schreiben

Inhalt schreiben

Schreiben Sie Inhalte nach den höchsten Standards, die Sie kennen, oder beziehen Sie sich auf Inhalte, die Sie für einen Kunden optimieren.Erstellen Sie eine Liste mit Themen mit einem, zwei oder drei Wörtern, die Sie behandeln möchten, und führen Sie sie in das ausgewählte TF*IDF-Tool.

Ihr Ziel hier ist es, die Keywords und URLs der Hauptdomänen, die sie anweisen, zu zeigen, welche Themen Sie vermissen und welche Themen Sie nicht in der Tiefe genug behandeln.

2) Verbinden Sie sich mit einem TF * IDF-Tool

Jedes Tool funktioniert etwas anders, wie Sie unten sehen werden.Sie verfolgen auch verschiedene Informationen, aber die nützlichsten sind darauf ausgerichtet, Ihnen zu helfen, zu verstehen, wie Ihre Konkurrenten mit ihrer Verwendung von Schlüsselwörtern erfolgreich sind.

Nutzen Sie alle Funktionen, die Das von Ihnen gewählte Tool Ihnen dabei hilft, die Begriffe zu ermitteln, die mit den ersten 10-20 URLs der obersten Ebene verknüpft sind, und erstellen Sie dann Partituren, die das Gewicht jedes anderen Begriffs widerspiegeln, den sie verwenden.

3) Inhalt wieder optimieren

Nun, da Sie eine vollständige Vorstellung von den Themen haben, die von jedem Ihrer Mitbewerber behandelt werden, und ein Verständnis dafür, wie oft diese Wörter verwendet werden, können Sie diese Informationen verwenden, um Ihre Inhalte zu verfeinern.

Machen Sie einen zweiten Schritt zum Inhalt und suchen Sie nach natürlichen Möglichkeiten, um Themen vorzustellen, die Sie noch nicht behandelt haben.Denken Sie daran, Ihre Motivation ist nicht unnatürlich zu stopfen, sondern natürliche Verbindungen wiederherzustellen, wo sie derzeit fehlen.

4) Öffentlich

Veröffentlichen Sie aktuelle Inhalte mit Einblicken, die Sie kürzlich aus Ihren Suchvorgängen gewonnen haben.Von hier aus können Sie es und alle Änderungen in den Rängen weiter analysieren.

5) Ergebnisse vor und nach TF anzeigen * IDF

Surfer vor und nach

Einer der Vorteile von TF* IDF ist, dass Es Ihnen ermöglicht, die Leistung auf einer Minute zu verfolgen.Vor und nach jeder Änderung, die Sie an Ihren Inhalten vornehmen, können Sie Screenshots erstellen, wie sich die Bilanz der Themen Ihrer Seiten verändert hat.Diese sind nützlich für Kunden, die bestimmte Metriken für die Änderungen anzeigen möchten, die Sie an ihren Inhalten vornehmen.

Jetzt sind wir bereit, in den Teil zu kommen, auf den du gewartet hast!

Ich hatte die Chance, mit allen größten TF *IDF Tools auf meinen Seiten zu spielen und ich habe eine Menge, um Ihnen zu zeigen, was sie tun können.

Aber zuerst, lassen Sie mich einige Ergebnisse teilen, die ich durch das Testen tf*IDF in realen Interwebs erhalten habe.

Testergebnisse

Ich möchte diesen Abschnitt vorherahnen, indem ich sage, dass ich TF*IDF seit über einem Jahr teste.

Seit ich mir zum ersten Mal Nischen-basierte semantische Dichtealgorithmen ansah, traf das Konzept eine harmonische Übereinstimmung mit mir.

Und obwohl die richtige Denkweise in allen Arten von Experimenten Agnostizismus ist, wollte ich wirklich, dass TF*IDF funktioniert.

Das heißt … für eine lange Zeit, Ich bekam unlullied Ergebnisse.

Und dann änderten sich die Dinge.

Ich werde Sie durch die Geschichte führen, aber lassen Sie mich zuerst beschreiben, wie ich es versucht habe.

Identifizierung von Tests für TF * IDF-Experimente

Das Erstellen von einvariablen Teststrukturen ist für dieses spezielle Szenario eine ziemliche Herausforderung.

Testhund

Was ist ein einzelvariabler Test?

In einer supergesteuerten Testumgebung haben Sie zwei Gruppen von Testfällen.

Eine Gruppe wäre die Kontrollgruppe.

In der Kontrollgruppe ändern Sie nichts. 

 

 

   

 

   

 

 

 

flubblegoblin

 

 

 

  

 

 

 

  •  
  •  

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  

 

 

  

 

  

 

 

 

 

 

 

  

  

 

 

 

  •  
  •  
  •  
  •  
  •  

  

  

 

 

 

 

 

 

 

 

 

  

 

 

 

 

  

 

 

 

 

 

 

  

 

 

  

 

  

 

 

 

 

   

 

 

  

 

 

 

 

 

 

 

 

 

Open

info.ibdi.it@gmail.com

Close