c't 2/2016
S. 32
News
15 Jahre Wikipedia

Teenagerjahre einer Online-Enzyklopädie

15 Jahre Wikipedia – und die Zukunft

Das unbestritten größte Nachschlagewerk der Weltgeschichte sucht neue Wege. Die Fakten-Plattform Wikidata macht Fortschritte, wird aber immer wieder infrage gestellt.

Histropedia macht geschichtliche Entwicklungen einfacher begreifbar. Die Daten für die Timelines stammen aus Wikidata.

Bereits zum 10. Geburtstag stand die freie Online-Enzyklopädie Wikipedia vor einer veritablen Krise. Das Projekt, das bisher nur exponentielles Wachstum gewohnt war, musste plötzlich mit einem rapiden Autorenschwund zurechtkommen. Das Verhältnis zwischen Community und Wikimedia Foundation war deutlich abgekühlt, nachdem die Wikimedia-Gründer Jimmy Wales vergeblich versucht hatte, einen Anti-Porno-Filter einzuführen. Schwesterprojekte wie Wikinews oder Wikibooks schafften nie den Sprung in die Relevanz.

Die Probleme sind zum 15. Geburtstag am 15. Januar 2016 geblieben. Doch trotz unzähligen Nachwuchs-Werbeaktionen ist es nicht einmal gelungen, die Zahl der Mitschreiber zu halten. Alleine in der englischen Wikipedia-Ausgabe ging die Zahl der aktiven Autoren von einst 50 000 auf mittlerweile knapp 30 000 zurück, in der deutschen Ausgabe von einst 9000 auf unter 6000. Schlimmer noch: Seit 2014 geht auch die Anzahl der Leser zurück. Von über 500 Millionen monatlichen Nutzern im Sommer 2013 sank die Besucherzahl auf inzwischen unter 400 Millionen. Von Platz 5 der weltweit meistbesuchten Webseiten ist die Enzyklopädie mittlerweile auf Platz 7 abgerutscht.

Artikelbestand verdoppelt

Zur befürchteten Katastrophe ist es jedoch nicht gekommen. Die Wissensmaschine Wikipedia funktioniert auch mit weniger Autoren. Innerhalb der letzten fünf Jahre hat sich die Zahl der Artikel von 14 auf über 33 Millionen mehr als verdoppelt. Als Wikipedia 2015 unter dem Titel „Wiki loves Monuments“ dazu aufrief, Fotos von Bau- und Naturdenkmälern einzureichen, kamen mehr als 230 000 Fotos zusammen, die nun unter freien Lizenzen jedermann zur Verfügung stehen. Immer mehr Institutionen arbeiten direkt mit Wikipedianern zusammen, stiften ihren Datenbestand oder laden Wikipedianer ein, mit ihnen zu kooperieren.

Die Daten für die Kurzinfos auf der Google-Suchergebnisseite stammen unter anderem aus Wikidata – vorbildliche Anwendung oder unerwünschte Konkurrenz?

Gerade in Krisensituationen erweist sich das Konzept der von Freiwilligen geschriebenen und kuratierten Wissenssammlung als erstaunlich robust. Nach Ereignissen wie den Anschlägen von Paris oder dem Erdbeben von Nepal informieren sich nicht nur Millionen in der Online-Enzyklopädie – in gemeinsamer Arbeit schaffen es die Autoren, unter den Vorgaben einer Online-Enzyklopädie auch schnell, informative Artikel zu schaffen, die nur etwas weniger aktuell sind als die Newsticker der etablierten Medien, dafür aber die Kontexte allgemeinverständlich aufbereiten. Grundsätze wie der neutrale Benutzerstandpunkt und die Pflicht, externe Belege für Faktenbehauptungen anzugeben, helfen dabei.

Die Relevanz kommt zu einem Preis. Unzählige PR-Arbeiter versuchen tagtäglich, ihre Arbeits- und Auftraggeber in der Enzyklopädie glänzen zu lassen. Gelegenheits-Manipulateure fallen dank eines aufwändigen Filtersystems relativ schnell auf. Doch mittlerweile haben einige PR-Firmen nachgerüstet. Ein kleiner Industriezweig spezialisiert sich inzwischen darauf, Inhalte in der Wikipedia einzupflegen – teils offen, teils verborgen.

Der Kampf gegen Spammer und Vandalen hat auch seine negativen Seiten. Angesichts der zur Verfügung stehenden Freiwilligen, die sich der drögen Aufgabe widmen, Zigtausende von Änderungen durchzusehen, setzt Wikipedia zunehmend auf Automatisierung. Ein ausgefeiltes System schleust alle Beiträge durch halbautomatische Filter, die Änderungen auf Spam und andere Verdachtsmomente durchleuchten. Wer auf der Titelseite Penisbilder unterbringen will oder ohne Begründung ganze Kritikabschnitte entfernt, fliegt schnell auf. Administratoren und etablierte Autoren können verdächtige Änderungen mit einem Klick wieder löschen.

Folge: Ungeschickte Änderungen stehen sofort unter Manipulationsverdacht. Die Beiträge neuer Autoren werden in vielen Wikipedia-Ausgaben schon seit einigen Jahren nicht sofort live geschaltet. Wenn zudem die ersten Gehversuche eines Neulings sofort wieder gelöscht werden, kommt der wahrscheinlich nicht so schnell wieder. „Unsere Studien zeigen, dass die Wiederkehrrate von wohlmeinenden Autoren eingebrochen ist, als diese Tools eingeführt wurden, schreiben Aaron Halfaker und Dario Taraborelli, die die Situation in der Wikipedia untersucht hatten.

Neustart oder Kannibalisierung?

Ihre Lösung dafür ist der „Objective Revision Evaluation Service“, ein selbstlernender Algorithmus, der künftig eine bessere Analyse liefern soll und als Webservice in 50 bis 100 Millisekunden eine Bewertung der Beiträge liefern kann. Inwieweit die Änderung im Backend tatsächlich für ein freundlicheres Klima auf Wikipedia sorgen wird, muss sich aber noch erweisen.

Hoffnungsprojekt der Wikipedia-Bewegung ist Wikidata. Werden in der Wikipedia komplette Artikel geschrieben, wird auf Wikidata Fakt für Fakt maschinenlesbar abgelegt: von Namen und Geodaten über Verwandtschaftsbeziehungen bis hin zu einem Werkverzeichnis der erfassten Künstler. Die Idee hinter dem Projekt ist, Daten für alle 280 Sprachausgaben der Wikipedia zentral bereitzuhalten – ähnlich wie auf der Multimedia-Plattform Wikimedia Commons Bilder, Filme und Musikstücke für alle Wikipedia-Ausgaben abgelegt werden.

Nach Zahlen ist das neue Projekt ein beispielloses Erfolgsmodell: Drei Jahre nach Start hat Wikidata bereits 15,5 Millionen Einträge – drei Mal mehr als die englische Wikipedia. Es gibt mittlerweile auch eine Reihe von Anwendungen, die die Daten nutzen. So erstellt Histropedia aus den verzeichneten Ereignissen historische Timelines, der Buchkatalogisierungs-Service Inventaire.io greift auf die Autoren- und Titeldaten zu. Auch Wikipedia-Artikel profitieren bereits. So wird den Artikeln über Gene automatisiert eine Infobox aus Wikidata zur Seite gestellt – für alle Sprachen einheitlich.

Qualität

Dennoch ist das Projekt bis heute umstritten. Wikipedianern misstrauten immer voll automatisierten Systemen. Maschinell übersetzte und automatisch generierte Artikel sind verpönt. Doch diese Haltung hat ihre Grenzen: Wer in Deutschland wohnt, kommt eher nicht darauf, Artikel über afrikanische Monumente oder südamerikanische Literatur zu verfassen. Wikidata würde dieses Problem zumindest teilweise nivellieren: Was die Autorencommunity am einen Punkt der Welt zusammenträgt, steht auf diese Weise auch anderen Ausgaben zur Verfügung.

Kritiker befürchten aber, dass Wikidata das Freiwilligenprojekt irrelevant macht. So beantwortet Google eine Frage der Art „Wie hoch ist der Eiffelturm?“ direkt auf der Suchergebnisseite. Zwar wird der Wikipedia-Artikel zum Bauwerk immer noch als erstes Suchergebnis verlinkt. Doch der Nutzer hat weniger Grund, auf den Link zu klicken – seine Frage ist ja schon beantwortet. Somit sinkt auch die Wahrscheinlichkeit, dass sich ein Wissenssuchender mit eigenen Beiträgen selbst einbringt. Einige Wikipedianer führen die sinkenden Leserzahlen direkt auf diese Entwicklung zurück.

Auch wird die Qualität der Wikidata-Einträge infrage gestellt. So weist der Wikipedianer Andreas Kolbe in dem Newsletter „Wikipedia Signpost“ darauf hin, dass viele Einträge in der Faktendatenbank nicht durch externe Quellen belegt sind. „Heute fehlen noch grundlegende Qualitätsmechanismen in Wikidata“, schreibt Kolbe. Er verweist damit auf ein Problem, dass die Wikipedia mit den Jahren immer öfter hat: So landen unbelegte Behauptungen aus der Wikipedia oft in der Presse. Die so zustande gekommenen Presseartikel dienen wiederum als Belege, die in die Wikipedia eingepflegt werden.

Wikidata-Projektmanagerin Lydia Pintscher räumte Probleme ein, baut aber darauf, dass das alte Wikipedia-Prinzip funktionieren wird: Wenn mehr Nutzer auf die Daten zugreifen, werden sich auch mehr Nutzer finden, die die Qualität sicherstellen.

Auch wenn Wikipedia durch den weltweiten Erfolg viele Kämpfe für sich entschieden hat, kann sich die Enzyklopädie nicht in Sicherheit wiegen. So hat beispielsweise die chinesische Regierung entschieden, dass die eigene Bevölkerung recht gut ohne Wikipedia auskommen kann und sperrte die Seite komplett. Auch in Russland eckt Wikipedia in jüngster Zeit wieder an. So beklagen Regierungsoffizielle die westliche Voreingenommenheit des Projekts. Der Leiter der Präsidialbibliothek kündigte gar eine staatsfinanzierte Wikipedia-Alternative an. Gleichzeitig haben die 2012 verabschiedeten Internetgesetze Wikipedia zum Ziel der neuen Internetaufsicht gemacht, die zum Beispiel Artikel über Drogenkonsum und Selbstmord verbietet.

Das ausgiebigste Konfliktpotenzial herrscht aber nach wie vor innerhalb der Wikipedia selbst; die Meinungsverschiedenheiten zum Zweck der Wikipedia und den erprobten Arbeitsweisen eskalieren immer wieder. Viele offene Fragen bleiben also auch zum 15 Geburtstag der Online-Enzyklopädie. (jk@ct.de)