Kaser, Armin (2016). Automatische Bedeutungsextraktion
mittels moderner Internetsuchmaschinen.
In Pierre Sachse, & Marco Furtner (Hrsg.), Kognitive Prozesse – Beiträge zur Psychologie der Informationsverarbeitung, Reihe Psychologie, Bd. 46, S. X–X. Berlin [u.a.]: LIT Verlag. Auf Amazon ansehen.
Zusammenfassung/Abstract
Moderne Suchmaschinen und das menschliche Gehirn weisen in ihrer Funktionsweise Parallelen auf (Griffiths, Styvers & Firl, 2007). Deshalb kann aus der Trefferanzahl, die zwei Begriffe in einer Suchanfrage erzielen, bestimmt werden, wie semantisch ähnlich sich diese sind (Cilibrasi & Vitányi, 2005).
Mit dieser Methode lassen sich vollautomatisch semantische Netze erstellen. In dieser Untersuchung wurden vier moderne Suchmaschinen (Google, Yahoo, MSN und Scirus) sowie vier Webverzeichnisse (allesklar.de [inzwischen offline], web.de, Open Directory und Yahoo Verzeichnis) auf ihre Eignung für dieses Verfahren hin untersucht.
Die Ergebnisse legen nahe, dass in bisherigen Studien (Cilibrasi et al., 2005, 2007) die eher ungünstige Alternative Google gewählt wurde, und dass die bisher nicht für diesen Zweck verwendeten Webverzeichnisse generell besser geeignet sind als Suchmaschinen.
Ein neuer Ansatz dieser Untersuchung kombiniert die Vorteile der großen Indizes von Suchmaschinen und der redaktionellen Qualitätssicherung von Webverzeichenissen. Durch die Verwendung von Daten der freien Enzyklopädie Wikipedia kann die Effizienz des Verfahrens so nachweislich noch weiter gesteigert werden.
Buch
Literatur
Cilibrasi, R. & Vitányi, P. (2005, 15. März). Automatic Meaning Discovery Using Google. Verfügbar unter: http://arxiv.org/pdf/cs/0412098v2 [17.9.2008].
Cilibrasi, R. & Vitányi, P. (2007). The Google Similarity Distance. IEEE Transactions on Knowledge and Data Engineering (3), 370-383.