Wissensmanagement 2.0: Ordnung schaffen mittels Social Tagging

Präsentation an der Tagung der Österreichischen Gesellschaft für Psychologie

Kaser, Armin & Kolar, Gerald (2010). Wissensmanagement 2.0: Ordnung schaffen mittels Social Tagging. In Österreichische Gesellschaft für Psychologie (Hrsg.), 9. Tagung der ÖGP, Abstractband, S. 90-91.

Poster zum Kongress ÖGP, Social Tagging, Prof. Gerald Kolar FH Wien

Transkript:

Einleitung

Social Tagging ist eines der Schlüsselelemente für den Erfolg von Web 2.0-Plattformen wie YouTube, Flickr oder auch Onlineshops. Bei dieser innovativen Form der Wissensorganisation ordnen Nutzer Inhalten passende Deskriptoren zu, ohne dabei einem expliziten Regelwerk zu folgen.

Abb. 1: Social Tagging am Beispiel eines Onlineshops (www.alternate.de)

Ziel der Studie

Ein Schwachpunkt des Verfahrens ist, dass eine sinnvolle Nutzung der semantischen Strukturen erst ab einer kritischen Größe derselben möglich wird.
In dieser Studie zeigen wir, dass diese Problematik entschärft werden kann, indem zur Erweiterung von bestehenden, aber in ihrer Größe noch nicht ausreichenden Social-Tagging-Inhalten computergestützte Verfahren verwendet werden können.

Psychologische Grundlagen

Dem semantischen Netzwerkmodell von Collins & Lokus (1975) zufolge können Begriffe als Knoten dargestellt werden, welche untereinander über Kanten verbunden sind. Empirische Befunde wie Semantic Priming-Effekte legen nahe, dass Verbindungen zwischen semantisch verwandten Begriffen (z.B. sind die Begriffe Hund und Katze semantisch verwandt, weil beides Tiere bezeichnen) besser ausgebildet sind.
Nutzung bereits bestehender Datenbestände Moderne Internet-Suchmaschinen können dazu verwendet werden, abzuschätzen, wie semantisch verwandt zwei beliebige Begriffe sind: Werden zwei Begriffe gemeinsam in die Suchmaschine eingegeben, erzielen sie eine bestimmte Anzahl Treffer. Sind sie semantisch eng verwandt, kommen sie auf überdurchschnittlich vielen Internetseiten gemeinsam vor und generieren so viele Treffer (Cilibrasi & Vitanyi, 2007).

Methoden

Um zu belegen, dass dieses Verfahren tatsächlich Strukturen schaffen kann, die jenen von Menschen geschaffenen ähnlich sind, glichen wir einen auf diese Weise mit der Wikipedia-Suche generierten Datensatz („Tag Cloud”) mit einem über 3000 Einträge umfassenden, von Hand erstelltem Karteikartensystem ab, welches als Referenz für ein menschliches, natürliches Ordnungssystem fungierte.

Hypothese

Es gibt eine signifikante Korrelation zwischen dem Grad der semantischen Verwandtheit zweier Begriffe im suchmaschinengenerierten Datensatz und der semantischen Verwandtheit derselben beiden Begriffe in der von Menschenhand erstellten Ordnung.

Ergebnisse & Diskussion

Die Korrelation zwischen dem Referenzdatensatz und der computergenerierten Struktur lag bei r,=.388 (p<.001; N=12255).
Das computergestützte Verfahren zur automatischen Erweiterung von Social-Tagging-Datenbeständen ist demzufolge in der Lage, Informationen ähnlich zu strukturieren, wie es ein Mensch von Hand leisten würde.

Grenzen des Verfahrens

Jeder computergenerierte Datensatz kann nur so gut sein, wie die Grundlage, auf der dieser basiert. In diesem Fall handelt es sich dabei um die gesammelten Wikipedia-Inhalte, auf die die Suche zugreifen kann. In seltenen Fällen kann es vorkommen, dass sich Begriffe auf keiner einzigen Wikipedia-Seite finden. Das führt zu Lücken in der Struktur, welche dann von Hand geschlossen werden müssen. In dieser Untersuchung war dies bei 444 von 12699 Begriffen der Fall (entspricht 3.4%).

Eine wesentlich größere und umfassendere Grundlage würden die gesammelten indexierten Webseiten von großen Suchmaschinen wie Google oder Microsofts Bing darstellen. Das wirft aber die Frage von Datenschutz und Privacy auf, da alle zu verknüpfenden Begriffe an diesen Anbieter übermittelt werden müssten.

Die Wikipedia-eigene Suche hingegen lässt sich inklusive den gesammelten Wikipedia-Inhalten komplett lokal am Heimcomputer realisieren. Die Datenschutzproblematik ergibt sich bei diesem Vorgehen nicht.

Literatur

Ohbrei, R. & Vitanyi, P.120071. The Google Similarity Distance. Knowledge and Data Engineering (31, 370.383).

Collins, A. & Lohns, E. 119751. A spreading-activation theory of semantic processing. Psychological Review (821, 407-428).

Scherner, Franz J. Schermer. Lernen und Gedächtnis 13., überarb. und erw. Aufl.). Urban-Taschenbücher: 8d. Bd. 559. Stuttgart: Kohlhammer.

Dr. Armin Kaser

Ich bin Psychologe in Innsbruck, spezialisiert auf Computerspiel-Sucht und biete dazu die Online-Sprechstunde per Video-Chat an.

Schreibe einen Kommentar