Latent semantic indexing

Wie Sie sicherlich wissen, ändern die Suchmaschinen, insbesondere Google, ihre Algorithmen bzw. Rankingkriterien von Zeit zu Zeit. Dies ist insbesondere der Fall, wenn Suchmaschinen-Spam gehäuft auftritt. Spam ist nichts anderes als der Versuch einiger Webmaster, sich durch Tricks auf ihren Webseiten, einen Vorteil in den Ergebnisseiten zu verschaffen.

Die Suchmaschinen wollen so etwas natürlich nicht zulassen und tun alles Mögliche, um solche Manipulationen zu verhindern. Denn diese wollen dem Suchenden ja möglichst gute Resultate liefern, damit dieser auch weiter die Suchmaschine benutzt.

Je schlechter die Seiten, die vorne gelistet werden, desto eher wendet sich ein solcher Suchender an eine andere Suchmaschine, um dort womöglich bessere Resultate geliefert zu bekommen. Die Suchmaschinen sind also bestrebt, einen Ausgleich zwischen den Erwartungen der Besucher und der Relevanz der Seiten in ihrem Index herzustellen, damit der Besucher zufrieden ist und auch das findet, wonach er gesucht hat. Diese neuen Algorithmen finden sich in neuartigen Konzepten wider, die man unter den Abkürzungen LSI und LSA zusammenfasst.

Wie so viele Abkürzungen haben LSI und LSA keine Bedeutung bis man erklärt bekommen hat, wofür diese Initialen stehen. Die beiden obengenannten hören sich fast so an, wie einige Krimiserien nach dem Motto LSI: Miami oder LSA: London. Ganz so verkehrt ist dies nicht, denn diese Abkürzungen sind den meisten Webmastern auch wie ein Rätsel. Nicht nur das, denn diese beiden Prinzipien nicht umzusetzen, sollte inzwischen auch schon so etwas wie ein Verbrechen sein. Lassen Sie uns diesen beiden Mysterien einmal auf den Grund gehen…

LSI kommt aus dem Englischen und steht für Latent Semantic Indexing.

LSA kommt ebenfalls aus dem Englischen und steht für Latent Semantic Analysis.

Das hilft irgendwie auch noch nicht so recht weiter, stimmt’s…?

Natürlich nicht. LSI und LSA sind Konzepte, die man besser anhand von Beispielen verstehen kann. Bevor wir uns diese Beispiele einmal ansehen, lassen Sie uns die einzelnen Wörter aufschlüsseln, die in dem Gesamtbegriff enthalten sind.

Latent Semantic Indexing

Definition von Latent:

Latent bedeutet „schlafend, ruhend, noch nicht sichtbar oder versteckt.“ Es bezieht sich auf Qualitäten, Fähigkeiten oder Talente, die momentan nicht sichtbar sind – die vielleicht in einem Gegenstand oder einer Person schlummern und die darauf warten, entdeckt und genutzt zu werden.

Beispiele:

1. Sein latentes musikalisches Talent trat nicht zutage, bis er zu einigen Klavierstunden gegangen war.

2. Ihre latenten mathematischen Fähigeiten überraschten ihre Eltern, als sie anfing, sehr gute Testnoten nach Hause zu bringen.

3. Die latenten Defekte des Wagens traten nicht auf, bevor die Garantie des Wagens abgelaufen war.

Alle 3 Beispiele beziehen sich auf Qualitäten oder Eigenschaften (positive und negative), die immer schon da waren, aber die eine Weile brauchten, um bemerkt zu werden.

Definition von Semantic:

Semantic, oder im Deutschen „semantisch“, bezieht sich auf die Bedeutung oder die Interpretation eines Wortes, eines Satzes oder eines Dokumentes im Bezug auf andere Wörter innerhalb eines Textes. Es steht nicht für den bekannten Antiviren-Programme Hersteller Symantecâ„¢. Es geht also um die Bedeutung von Wörter und von Sätzen, sowohl alleinstehend, als auch in Kombination mit anderen Wörtern oder Satzteilen. Der semantische Aspekt eines Satzes, eines Absatzes oder eines ganzen Artikels ist das, was es für den Leser bedeutet.

Beispiele:

Ein Beispiel einer Argumentation im Bereich der Semantik wäre es, wenn 2 Leute sich über die Bedeutung des Wortes „Krieg“ uneinig wären. Der Erste könnte darauf bestehen, dass Krieg die Abwesenheit von Frieden ist, während der Zweite meint, es würde sich dabei um das Bestehen von Kampfhandlungen handeln. Natürlich haben beide irgendwie Recht, aber es ist irgendwie wie die Frage nach dem halbleeren oder halbvollem Glas. Beide Parteien haben die Bedeutung des Wortes Krieg erkannt, aber es ist dennoch immer noch eine Interpretationsfrage.

Für unsere Zwecke bezieht sich „semantic“ auf die Bedeutung eines Wortes, eines Satzes oder eines Dokumentes und wie der Leser sie interpretiert, sowie die Zusammenhänge zwischen den Wörtern eines Textes.

Definition von Indexing:

Ein Index ist „eine alphabetisierte Liste von Namen, Orten und Personen, die in einem geschriebenem Werk vorkommen und wo die jeweilige Seite gelistet wird, auf der der Begriff behandelt wird“. Es ist ein Hilfsmittel für die Organisation von gedruckten Werken, so dass man einige der obengenannten Dinge einfacher finden kann.

Beispiele:

Der Index eines Buches ist ein ausgezeichnetes Beispiel. Wenn Sie ein Buch über Internet Marketing lesen und Suie wollen die Informationen extrahieren, die sich mit dem Unterthema Affiliates- oder Partnerprogramme beschäftigen, so schauen Sie einfach im Index des Buches nach, wo diese Begriffe verwendet werden. So würden Sie die Information einfach und schnell finden.

Wenn man alles obengenannte kombiniert…

Latent – bezieht sich auf Qualitäten oder Eigenschaften, die schon immer vorhanden waren, aber die eine Weile brauchten, um sichtbar zu werden.

Semantic – bezieht sich auf die Bedeutung eines Wortes, eines Satzes oder eines Dokumentes, wie der der Leser sie interepretiert und die Zusammenhänge zwischen den Wörtern in einem Text.

Indexing – das Erstellen einer Liste oder einer Referenz für ein gedrucktes Werk, so dass man einzelne Begriffe einfacher und schneller finden kann.

Deswegen bedeutet Latent Semantic Indexing oder LSI eine Liste für gedrucktes Material, das sowohl die offensichtlichen, als auch die versteckten Bedeutungen und Interpretationen von Wörtern, Sätzen und Absätzen in dem Werk auflistet und darstellt, wie die Wörter miteinander im Zusammenhang stehen.

Latent Semantic Analysis

Die Definitionen für latent, semantic und indexing haben Sie obenstehend schon lesen können. Alles, was wir jetzt noch brauchen ist eine Definition für „Analysis“, oder auch „Analyse“ im Deutschen.

Definition:

Analysis – eine detaillierte Untersuchung von Elementen oder einer Struktur.

Beispiele:

Die besten Beispiele sind die, die Sie gerade gelesen haben! Wir haben gerade die Abkürzungen LSI und LSA untersucht. Die Wörter, die zu jedem einzelnen Buschstaben gehören wurden bestimmt, wie auch die Bedeutung der Wörter. Diese Bedeutungen der Einzelwörter wurden zu einem Gesamtbegriff zusammengefasst, welche die Interpretationen des Autors über die Konzepte LSI und LSA beinhalteten.

Deswegen ist LSA die genaue Untersuchung der Wörter, Sätze, Absätze und der Beziehungen zwischen Wörtern im gedruckten Material und deren offensichtlichen und versteckten Bedeutungen. LSA muss deshalb stattfinden, bevor die Resultate mit Hilfe von LSI organisiert und tabellarisch dargestellt werden können.

Warum sind diese beiden Konzepte so wichtig für Sie?

LSA und LSI sind deshalb wichtige Konzepte weil die Suchmaschinen, insbesondere Google, damit anfangen Dokumente, in diesem Fall Webseiten, genau nach diesen Kriterien zu beurteilen. Lassen Sie mich dies wiederholen: Google und andere Suchmaschinen werden LSA und LSI benutzen, um Ihre Webseiten in den richtigen Zusammenhang einordnen zu können.

Deswegen sollten Sie diese kennen und wissen, was diese Konzepte bedeuten. Wenn Sie es erst einmal verstanden haben, werden Sie in der Lage sein, Webseiten so zu schreiben, dass LSI-Techniken verwendet werden. Dies hat zur Folge, dass Sie von den Suchmaschinen mit besseren Platzierungen belohnt werden. Und dies bedeutet dann hoffentlich für Sie, dass Sie mehr über Ihre Webseiten einnehmen werden, also höhere Gewinne machen.

Im Offline-Bereich werden diese Konzepte schon seit Jahrzehnten benutzt, um gedruckte Dokumente zu analysieren. LSA ist eine Technik, die bei der Sprachanalyse schon lange benutzt wird, um die Beziehungen zwischen verschiedenen Dokumenten zu analysieren und die Begriffe, die darin vorkommen besser zu verstehen.

Dies wird gemacht, indem man ein Hauptkonzept bestimmt, welches sich auf die Begriffe innerhalb von Dokumenten und auf die Dokumente selbst bezieht. Wenn die LSA komplett ist, werden die Resultate in einem Index mit Hilfe von LSI zusammengefasst. Die Konzepte und Prozeduren sind die gleichen, sowohl online, als auch offline.

Die Sprache ist keine Barriere für LSA und LSI. Wenn 2 Dokumentensets in verschiedenen Sprachen geschrieben wurden, können sie durch LSI und analysiert und katalogisiert werden, wenn wenigstens ein Set in die jeweils andere Sprache übersetzt werden kann. Die Aufgabe wird natürlich einfacher, wenn beide Dokumente in der gleichen Sprache geschrieben wurden und diese muss nicht unbedingt Englisch sein.

Was bedeutet all das, was ich hier soeben beschrieben habe, für Sie…?

Es bedeutet in letzter Konsequenz, dass die Tage des „Keyword-Stuffing“ (das ständige Wiederholen der Keywords im sichtaren Text, als auch in den Meta-Tags) gezählt sind. Wenn Sie dies immer noch tun (es hat ja mal funktioniert…), dann sollten Sie so schnell wie möglich damit aufhören. Benutzen Sie stattdessen Synonyme für Ihre Keywords und verwandte Begriffe aus dem selben Themenbereich. Dies sorgt dafür, dass Ihr Thema sich bei den Suchmaschinen verankert und macht sowohl die Suchmaschinen, als auch Ihre Besucher glücklich!

Leave a Reply

Your email address will not be published. Required fields are marked *