Ir al contenido

Curso de alemán nivel medio con audio/Lección 062c

De Wikilibros, la colección de libros de texto de contenido libre.
Zum Anfang des Buches
Lección 061c ← Lección 062c → Lección 063c


Das Cover des Buches
Quelle für den Text der Lektionen 051c bis 063c Lektionen ist das Buch
Alles über Wikipedia und die Menschen hinter der größten Enzyklopädie der Welt
Das Buch erschien unter einer freien Lizenz (Creative Commons Attribution-ShareAlike 3.0 Unported, CC-by-sa).
fuente: Allesueberwikipedia.pdf - CC-BY-SA Creative Commons Attribution-ShareAlike 3.0 Unported, CC-by-sa - CC-BY-SA
Inhalt
Inhalt
VORWORT 9
EINLEITUNG 11
DIE ENTSTEHUNG DER DEUTSCHEN WIKIPEDIA 15
Von Nupedia zu Wikipedia:Wie alles anfing ... 15
Odyssee ins Jahr 2001: Die Anfänge der deutschen Wikipedia 23
Ein Blick zurück von der anderen Seite der Diskette 31
Zehn Jahre Wikipedia: Meilensteine 35
Der millionste Artikel für die deutsche Wikipedia 41
Wikipedia: Eine kritische Sicht 43
DIE WIKIPEDIA-ARBEIT 47
Grundkenntnisse 47
Was braucht ein »guter« Artikel? 59
Ein Begrüßungslöschantrag 63
Von der IP zum Bürokraten: die »Karriere« eines Wikipedianers 64
Da kann ja jeder reinschmieren! 67
Wo erhalten Benutzer Hilfe und Unterstützung? 71
WIE GUTE ARTIKEL ENTSTEHEN 81
Die Qualität von Wikipedia: Anspruch und Wirklichkeit 81
Geständnis eines Kleinvandalen 100
Die Zebrarennschnecke:Vom Kindermund zum enzyklopädischen Artikel 101
Wer rastet, der rostet 104
Listen über Listen 105
Nicht zu benutzen 107
Wikipedia organisiert 108
Schon gewusst? - oder: Wie kommt man flott auf die Hauptseite? 115
Masse mit Klasse 118
Die Todesopfer an der Berliner Mauer 121
MOTIVATION: FREIWILLIG FÜR FREIES WISSEN 125
Unverhofftes Wiedersehen 125
Von Metzgern und Schlachtern - oder: Wenn's sonst keiner macht ... 127
Wikipedia-Mitarbeit hält die Festplatte am Drehen 130
Der Traum von einer eigenen Enzyklopädie 131
»Wikipedia and I« 133
Wikipedia - der erste Schuss ist gratis 138
Damenfang 140
Wikipedia: Ein persönlich gefärbter (was sonst?) Erfahrungsbericht 141
Warum ich immer noch mitspiele 144
Der Büchermessie 147
Wikipedia-Momente 149
KOMMUNIKATIONSKULTUR 151
Möglichkeiten und Grenzen demokratischer Strukturen in derWikipedia 151
Wissen ist Macht 162
Exklusionisten gegen Inklusionisten ein enzyklopädischer Bruderkrieg 164
Exklusionismus: In den Maschinenräumen von Wikipedia 173
Inklusionismus: Mehr Toleranz! 178
Mit 80 + dabei 182
DIE DUNKLE SEITE DER WIKIPEDIA 187
Am Anfang war der Streit 187
Kaffeeservice und Bügelbrett: Von der Wikipedia ohne Umweg in die Köpfe 210
Aus der Löschhölle an die Wand 214
Von der »Hassenstein-Debatte« zu allerlei Erfreulichem 216
Trollosophie 222
DIE WISSENSCHAFT ZU WIKIPEDIA 225
Wikipedistik 225
Wikipedia als Forschungsobjekt 241
Die Wikipedia als Werkzeug für individuelle und kooperative Lernprozesse 243
Verborgenes Wissen in Wikipedia 246
Die Enzyklopädie und der Elfenbeinturm - wie Wikipedia und Wissenschaft zueinander finden können 247
»Sag bloß keinem, dass du da mitmachst!« 266
Durch Kooperation zum Erfolg: Die Johann-Heinrich-ZedlerMedaille 268
Wikipedia und Wissenschaft aus der Sicht der Akademieforschung 269
Einstieg mit Hürden 273
Wikipedia als Lebensweise 274
Wikipedia und Speziallexika im Wettstreit 276
DIE TECHNIK HINTER WIKIPEDIA 283
MediaWiki - oder: Das Web 0,0 283
Hardware: Betrieb der Wikipedia 295
Das Werden und Wachsen der Helferlein: Bots, Skripte und Werkzeuge 300
AUSBLICK: WIKIPEDIA 2021 311
ANHANG 327
Glossar: Wikipedia-Jargon für Anfänger 327
Die Autoren 333
Creative Commons License 344



MC551 - MC560

[editar]

MC551

Ein anderer Ansatz, der seit Jahren gelegentlich ergebnislos diskutiert wird, trägt den Namen »WikiData«. Ähnlich Wikimedia Commons, das über acht Millionen Dateien unter freier Lizenz zur Nutzung in Wikipedia und »web-weit« zugänglich macht, könnte ein solches Projekt Daten zentral sammeln und allen Wikipedia-Sprachversionen (und auch sonst jedem) zur Verfügung stellen. Albert Einstein wurde am 14. März 1879 geboren; dieses Datum muss momentan auf Wikipedias in mehreren hundert Sprachen von Hand eingestellt und auf Vandalismus überwacht werden. Das gilt nicht nur für Geburtstage, sondern für unzählige andere Arten von Daten. Wenn sich ein solcher »Datenpunkt« ändert (zum Beispiel die Oberfläche des Toten Meeres), muss dieser Wert in Hunderten von Wikipedias angepasst werden. Das ist vor allem bei Sprachen mit noch wenigen Benutzern ein Problem. Es wäre effizienter, solche Daten zentral zu speichern und dann von allen Wikipedias nur noch auslesen zu lassen. Technische Probleme, komplizierteres WikiMarkup und das WikiData-Projekt als potenziell besonders »lohnenswertes« Ziel für Vandalen haben bisher jeden Versuch zunichtegemacht.




MC552

Vokabeln:


MC553

Als dritten Aspekt möchte ich die großen Mengen an Rohdaten erwähnen, die in den letzten Jahren weltweit freigegeben wurden. Von Buchkatalogen der Bibliotheken über Wetterdaten zur Klimaerwärmung bis hin zu Regierungsdaten (WikiLeaks zähle ich hier ausdrücklich nicht mit!) stehen der Öffentlichkeit zunehmend große Datensätze zur Verfügung, ohne dass sie bisher, von kleineren Projekten abgesehen, effizient genutzt werden können.
Alle diese Aspekte schreien geradezu nach Konvergenz, aber der richtige Ansatz für ein maschinenlesbares, datenverarbeitendes MediaWiki wurde bisher noch nicht gefunden. Wie die Zukunft hier auch immer aussehen wird, ich bin überzeugt, sie wird Möglichkeiten zur Partizipation offenhalten.



MC554

Vokabeln:


MC555

Hardware: Betrieb der Wikipedia
VON DANIEL KINZLER
---
Wikipedia ist eine der zehn meistgenutzten Webseiten weltweit. Doch die Anzahl der Server, auf denen Wikipedia und die anderen Wikimedia-Projekte laufen, ist vergleichsweise winzig: Auf nur rund 400 Servern betreibt Wikimedia eine der beliebtesten Webseiten der Welt, während Anbieter ähnlich populärer Dienste wie Facebook oder E-Bay weit über 10 000 Server einsetzen.
---
Die Anfänge
Als Wikipedia 2001 gegründet wurde, war sie nur eine von vielen Webseiten, die auf einem Server bei Bomis liefen. 2002 war die Wikipedia dafür bereits zu groß, Bomis kaufte einen eigenen Server für Wikipedia und nannte ihn Pliny, nach Plinius dem Älteren, dem Autor der Naturalis Historia und damit einem der ersten Enzyklopädisten.
Schon bald war auch Pliny überfordert, und so wurde im Frühjahr 2003 ein zweiter Webserver angeschafft, eine Celeron namens Larousse, nach Pierre Athanase Larousse, dem Autor des in den Jahren 1864 bis 1876 erschienenen Grand dictionnaire universel du XIX. siècle. Die Tradition, Server nach Enzyklopädisten und Lexikographen zu benennen, war etabliert und wurde noch viele Jahre lang beibehalten.



MC556

Vokabeln:


MC557

2003 war das Jahr, in dem Wikipedia bekannt wurde und rapide wuchs. Für die ehrenamtlichen Server-Administratoren bedeutete das einen verzweifelten Kampf gegen die permanente Überlastung, die zu vielen Ausfällen führte. Die Situation schien aussichtslos, da Bomis die Idee aufgegeben hatte, mit Wikipedia einmal Geld zu verdienen, und daher nicht weiter in den Betrieb investieren wollte.
Die Rettung kam erst Anfang 2004: Nachdem im Juni 2003 die Wikimedia Foundation als Betreiber von Wikipedia gegründet worden war, konnte im Dezember endlich eine Spendenkampagne durchgeführt werden. Wikimedia nahm etwa 30 000 Dollar ein und investierte dieses Geld sofort in die Anschaffung von neun neuen Servern. Endlich war nun die benötigte Rechenleistung vorhanden, die Administratoren konnten durchatmen.
Über die nächsten Monate wuchs die Zahl der Anfragen an Wikipedia erneut rapide an. Auch in den folgenden Jahren konnte Wikimedia kaum schnell genug Server anschaffen, um mit den wachsenden Anforderungen Schritt zu halten.



MC558

Vokabeln:


MC559

Der Server-Zoo
Heute werden in jeder Sekunde durchschnittlich etwa 6000 Wiki-Seiten angeschaut. Da für jede Seite mehrere Dateien wie zum Beispiel Bilder zu laden sind, ergibt das im Schnitt etwa 60 000, zu Spitzenzeiten bis zu 120 000 Anfragen pro Sekunde, die mit etwa einem Gigabyte Daten von den Servern beantwortet werden. Davon entfällt etwa die Hälfte allein auf die englischsprachige Wikipedia. Die deutsche Sprachversion, knapp hinter der japanischsprachigen und gleichauf mit der spanischsprachigen Wikipedia, macht ungefähr sieben Prozent des Gesamtvolumens aus.
Um solche Datenmengen verarbeiten zu können, mussten sich die Ingenieure von Wikimedia einiges einfallen lassen.
Als Wikipedia noch in den Kinderschuhen steckte, kam auf den Servern die klassische LAMP-Architektur zum Einsatz: ein Linux-Host mit Apache-Webserver, auf dem die PHP-Anwendung MediaWiki läuft, die ihrerseits auf eine MySQLDatenbank zugreift.
Prinzipiell gilt diese Architektur noch heute, allerdings wurde sie den wachsenden Anforderungen angepasst und erweitert. Insbesondere wurden Cache-Server hinzugefügt, die die meisten Seitenaufrufe direkt aus dem Arbeitsspeicher - und damit deutlich schneller - beantworten können.
Die derzeitige Architektur besteht aus folgenden Komponenten:




MC560

Vokabeln:


MC561 - MC570

[editar]

MC561

Web-Caches
Web-Caches, auch »Reverse Proxies« genannt, dienen als Puffer für Webseiten: Fordert ein Web-Browser eine Seite von Wikipedia an, so geht diese Anfrage zunächst an einen Web-CacheServer. Dieser schaut nach, ob er schon eine Antwort für die Anfrage kennt. Wenn ja, wird die Anfrage direkt aus dem Speicher des Caches beantwortet. Wenn nicht, wird die Seite von einem Application-Server angefordert. Gut 90 Prozent aller Anfragen werden auf diese Weise ressourcenschonend beantwortet, ohne dass Media Wiki auf den Application-Servern etwas tun muss.
Die Wikimedia Foundation betreibt derzeit (Anfang 2011) insgesamt rund 110 Web-Cache-Server. Etwa die Hälfte davon steht in einem Rechenzentrum bei Amsterdam und bedient Anfragen aus Europa. Die anderen stehen in Tampa, Florida, zusammen mit den übrigen Servern.
Die Software, die auf diesen Servern zum Einsatz kommt, ist zum größten Teil Squid. Auf einigen Servern wird bereits das leistungsfähigere Varnish eingesetzt, das bald Squid auf allen Servern ersetzen soll.


MC562

Vokabeln:


MC563

Web-Server
Im Wikimedia-Cluster gibt es zwei Arten von Web-Servern. Die einen liefern nur statische Inhalte aus, insbesondere die Bilder, die in Wiki-Artikeln verwendet werden. Die andere, interessantere Art sind die Application-Server, auf denen Media Wiki läuft. Für den Betrieb der Wiki-Software MediaWiki kommt auf rund 130 Maschinen die Apache-Software zum Einsatz. Hier geschieht ein Großteil der eigentlichen Arbeit: Wiki-Seiten werden geladen, verändert, gespeichert, in HTML umgewandelt etc. Auch die Verwaltung der Artikel-Versionsgeschichte, die Benutzerverwaltung sowie Benachrichtigungen per E-Mail finden hier statt.
Interessant ist, dass einzelne Server nicht für ein bestimmtes Wiki, zum Beispiel die deutschsprachige Wikipedia oder Wikimedia Commons, reserviert sind. Vielmehr bedienen alle Server die über 700 Wikis, die Wikimedia betreibt. Auf welche Inhalte zugegriffen werden soll, entscheidet sich anhand des Domain-Namens, der für die Anfrage verwendet wurde.
Knapp 30 der Application-Server sind für API-Anfragen (application programming interface) reserviert: Hier werden Anfragen beantwortet, die nicht für die Anzeige als Webseite gedacht sind, sondern Daten liefern, die von Programmen wie Bots, Skripten und Werkzeugen weiterverarbeitet werden.



MC564

Vokabeln:


MC565

Datenbank-Server
Neben den Application-Servern sind die Datenbank-Server der wichtigste Teil des Wikimedia-Clusters: Sie speichern den Inhalt der Wikis zusammen mit Informationen über die verschiedenen Versionen, Benutzer, Logs und Ähnliches. 30 Datenbank-Server stehen hierfür zur Verfügung. Dabei gibt es für jedes Wiki nur einen Master-Server, in den neue Informationen geschrieben werden können, während für die vielen Lesezugriffe jedem Wiki mehrere Slave-Server zur Verfügung stehen, die stets eine aktuelle Kopie der Daten des Master-Servers enthalten.
Momentan gibt es sieben Master-Server, die die Daten der über 700 Wikis unter sich aufteilen. Dabei wurden die Wikis so auf die Server verteilt, dass diese jeweils ungefähr dieselbe Datenmenge zu verwalten haben, ob nun aus wenigen großen oder vielen kleinen Wikis. So enthält zum Beispiel der Server si nur die englischsprachige Wikipedia, der Server S5 nur die deutschsprachige, S4 enthält Wikimedia Commons. Dagegen bedient der Server S3 rund 700 kleine Wikis, während S2, s6 und S7 jeweils die Daten einer Handvoll mittelgroßer Wikis enthalten.



MC566

Vokabeln:


MC567

Such-Server
Eine weitere sehr wichtige Aufgabe ist das Suchen von Wikipedia-Seiten. Das übernehmen die etwa 20 Such-Server, auf denen Apache Lucene läuft. Neben normalen Suchanfragen liefern diese Server auch die Suchvorschläge, die automatisch eingeblendet werden, wenn ein Benutzer etwas in das Suchfeld einträgt. Sie stellen zudem die Vorschläge bereit, die als »meinten Sie ...« auf der Suchseite angezeigt werden, wenn eine andere Schreibweise zu einem besseren Ergebnis geführt hätte. Auch Suchergebnisse aus Schwesterprojekten können die SuchServer liefern, zum Beispiel aus Wiktionary oder Wikimedia Commons.
---
Zusammenfassung
Wikimedia betreibt mit Wikipedia eine der beliebtesten Webseiten der Welt. Obwohl die Wikimedia Foundation fast ein Drittel ihrer Einnahmen in Beschaffung, Wartung und Betrieb der Server steckt, ist der Server-Park mit rund 400 Maschinen vergleichsweise winzig. Das kleine Team, das die Server betreut, vollbringt täglich Wunder, um Wikipedia und die anderen Wikimedia-Projekte am Laufen zu halten.
Für die Zukunft steht neben dem graduellen Ausbau der Server-Kapazität für Ende 2011 die Bereitstellung eines neuen Datacenters an: Die Wikimedia-Projekte werden dann von Ashburn, Virginia, aus ausgeliefert, wobei etwa 300 zusätzliche Server online gehen werden. Das alte Datacenter in Tampa bleibt aber zur Sicherheit erhalten. Sollten einmal die Server in Ashburn nicht funktionieren oder nicht erreichbar sein, würden die Maschinen in Tampa wieder übernehmen.


MC568

Vokabeln:


MC569

Das Werden und Wachsen der Helferlein: Bots, Skripte und Werkzeuge
VON CONRAD NUTSCHAN
--
Die Projekte von Wikimedia stellen nicht nur Freie Inhalte in Form von Text, Bild und Ton zur Verfügung, sondern setzen auch Freie Software für die Erarbeitung der textlichen Inhalte ein. Die Grundlage dafür bilden neben der MediaWiki-Software auch die Linux-Betriebssysteme der Server, die verwendeten Datenbankverwaltungssysteme oder die Software für die Kommunikation. Dazu gehören unter anderem Ubuntu, Apache-HTTP-Server, MySQL-Server, GNU Mailman oder das »Open Ticket Request«-System. :Mit dieser Offenheit war eine Grundlage für Tüftler geschaffen, über Schnittstellen auf aktuelle Daten der Projekte zuzugreifen und diese unkompliziert auszuwerten, um sie für die Bearbeitung von Wikipedia-Artikeln zu nutzen. Des Weiteren sind die Quelltexte der eingesetzten Programme und der bereits erstellten Artikelinhalte aufgrund der gewählten Freien Lizenz für alle einsehbar, wodurch auch in diesen Bereichen geforscht und gebastelt werden konnte - alles zur Verbesserung von Wikipedia und ihrer Schwesterprojekte.
Als begeisterter Nutzer der sogenannten »Helferlein« von Wikipedia1 begann ich nach zweijähriger Mitarbeit am Projekt im Juni 2006 mit der Erstellung einer Liste, um den Überblick über die für mich wichtigen Skripte und insbesondere die Werkzeuge zu behalten. Diese Liste2 ist über die Jahre auf etwa 80 Einträge gewachsen, wobei von einer weitaus größeren Anzahl vorhandener Helferlein ausgegangen werden kann.



MC570

Vokabeln:


MC571 - MC580

[editar]

MC571

Warum Helferlein?
Die Hauptgründe, warum viele freiwillige Entwickler begannen, Helferlein zu programmieren, lagen vermutlich darin, dass verschiedene Aufgaben auf Dauer zu langweilig, zu zeitaufwendig oder einfach unüberschaubar wurden. Außerdem lechzten einige Benutzer nach statistischen Auswertungsmöglichkeiten sowie der Anzeige von Benutzern mit bestimmten Verhaltensweisen, was die MediaWiki-Software zu jener Zeit nicht hergab.
Wie im Abschnitt über MediaWiki bereits erwähnt, gab es auch eine Reihe von Spezialseiten, die wegen der wachsenden Datenmenge nicht mehr schnell genug funktionierten oder deaktiviert waren. Für diese wurden daraufhin Ersatzskripte geschrieben, die parallel zur vorhandenen Software-Struktur arbeiten konnten. Die Spezialseiten können somit als die ersten integrierten Helferlein auf Wikipedia angesehen werden.




MC572

Vokabeln:


MC573

Grundlagen
Nach der ersten internationalen Konferenz »Wikimania« in Frankfurt am Main stand ein gestifteter leistungsfähiger Server zur Verfügung, der zukünftig als Arbeitsumgebung für Entwickler dienen sollte. Es war nun für bekannte Mitglieder der Community sehr einfach, Zugangsdaten für eine eigene Oberfläche zu bekommen. Interessierte konnten die Programmierarbeit vom eigenen Rechner auf ein schnelleres System mit aktuelleren Daten verlagern und dieses bequem von zu Hause aus kostenfrei nutzen. Dazu zählten im Wesentlichen aktuelle Gesamtkopien der Datenbanken, die aus dem erarbeiteten Text aller Projekte bestehen. Auch gab es völlig unbürokratisch von Anfang an in mehr oder weniger regelmäßigen Abständen aktuelle Fassungen aller Artikel ohne Versionsgeschichte zum Herunterladen für das heimische Computersystem.
Heute besteht der Toolserver-Cluster in Amsterdam aus mehr als zehn Servern. Diese bieten neben Arbeitsumgebungen und Echtzeitkopien der Datenbanken beispielsweise auch Rechenkapazität für die Erstellung von OpenStreetMap-Karten, die in Wikipedia-Artikel eingebunden sind. Ebenfalls grundlegend für die Entwicklung von Skripten und deren Verbreitung war die Möglichkeit, MediaWiki unkompliziert anzupassen. In jedem Benutzerkonto kann man individuell und für jeden lesbar eigene Einstellungen des Layouts (Cascading Style Sheets) vornehmen und die Browser-Ausgabe durch JavaScript anpassen oder auch im laufenden Betrieb verändern.
---
Konzepte
Wie schon die Überschrift verrät, gibt es verschiedene Möglichkeiten, wie ein Wikipedia-Helferlein aufgebaut sein kann und welche Schnittstellen es nutzt, um seine Arbeit zu verrichten. Dabei muss jedes Werkzeug von seinem jeweiligen Nutzer vorbereitet werden, teilweise sind Anpassungen an das Vorhaben oder die Arbeitsumgebung notwendig. Im Folgenden werden drei Bereiche von Helferlein aus Nutzersicht beispielhaft vorgestellt, wobei diese nicht vollständig voneinander zu trennen sind und einige Skripte sehr einfachen Werkzeugen ähneln können.


MC574

Vokabeln:


MC575

Bots
Bei Bots handelt es sich um automatische Prozesse, die mit Wikipedia - vor allem mit dem geschriebenen Text der Artikel interagieren. Dabei können verschiedene Programmiersprachen oder Bibliotheken verwendet werden. Besonders populär ist neben den derzeit elf verschiedenen Bot-Projekten3 das »Python Wikipedia Robot Framework« (pywikipedia).
Seinen ursprünglichen Schwerpunkt hatte das »Python Wikipedia Robot Framework« in der Sammlung von InterwikiLinks. Dabei geht es um die Eintragung möglichst vieler Verweise auf fremdsprachige Artikel in das jeweilige Heimatprojekt. Der Bot tastet sich hierbei automatisch durch bereits vorhandene Sprachversionen des jeweiligen Artikels und schaut wiederum in diesen nach, ob sich darin neue, in der deutschsprachigen Wikipedia noch nicht vorhandene Verweise auf unbekannte Sprachen befinden. Wenn eine fehlende Sprache gefunden wird, trägt der Bot diese im Heimatprojekt ein. Bei den etwa 280 existierenden Sprach- und Dialektversionen von Wikipedia wäre diese Arbeit von Hand sehr aufwendig.


MC576

Vokabeln:


MC575

Bei einer Änderung meines Frameworks ConBot vom 5. November 2005 stellte sich beispielsweise heraus, dass es über die Stadt Dresden bereits Artikel in Litauisch und Sizilianisch gab, die daraufhin in der deutschen Ausgabe durch den Bot verlinkt wurden.
Damals wuchs das Interesse an diesen sozusagen halbautomatischen (von Benutzern gesteuerten) Skripten, die den jeweils im Fokus stehenden Artikeltext eigenständig aufriefen, auswerteten und dann Änderungen unabhängig von einem BrowserFenster durchführten. Die derzeit 312 angemeldeten Bots haben dabei etwa neun Prozent der Änderungen an der deutschsprachigen Wikipedia durchgeführt.
In der folgenden Zeit übernahmen Bots außerdem Aufgaben der Textersetzung, der Anpassung von Vorlagen, der Listenpflege durch gewonnene Daten aus der Personennamendatei, das Hochladen von freien Bildern aus anderen Projekten oder die automatische Archivierung von Diskussionsseiten.
Bei letzterer Aufgabe kann man beispielsweise dem ArchivBot den Auftrag geben, Beiträge der eigenen Diskussionsseite dann zu archivieren, wenn ein Eintrag älter als 14 Tage ist und mindestens eine Antwort enthält. Dadurch bleibt die Diskussionsseite übersichtlich. In der Anfangszeit bildeten sich gerade die Vorlagen, Kategorien und Taxoboxen heraus, die noch vielfach angepasst werden mussten. Ein Bot konnte eine Änderung an diesen Objekten in vielen Artikeln anpassen, ohne dass diese alle händisch aufgerufen und geändert werden mussten.




MC578

Vokabeln:


MC579

In Kombination mit dem Werkzeug CatScan (siehe unten) werden heutzutage die Arbeitslisten der Redaktionen automatisch aktuell gehalten. Dazu gehört neben der Auflistung der neuen Artikel im jeweiligen Themenbereich beispielsweise auch die Sammlung von Artikeln, die von anderen Benutzern durch das Einfügen eines Bausteins als unvollständig markiert wurden.
Andere Sprachversionen von Wikipedia benutzen Bots, um große Mengen von rudimentären Ortsartikeln automatisch anzulegen oder bereits vorhandene Artikel durch einfache Fakten zu ergänzen, die aus verschiedenen Sammlungen Freier Daten stammen. Dies führt zwar zu einem schnellen Wachstum der Artikelzahlen, ist aber vielfach von geringer Qualität geprägt. Erkennbar sind diese Bot-Einsätze an Sprüngen in den Artikelstatistiken der jeweiligen Sprachen.


MC580

Vokabeln:


MC581 - MC590

[editar]

MC581

Skripte
Bei der Anwendung von Skriptsprachen geht es in erster Linie um die überschaubare Aneinanderreihung von mehreren Befehlen sowie die Anpassung der Bot-Ausgabe. Man kann sozusagen das Aussehen und die Funktionen von Wikipedia verändern, ohne besonders umfangreiche Programmierkenntnisse zu besitzen oder gar in den Quelltext von MediaWiki einzugreifen.
Die einfachsten Skripte blenden das Wikipedia-Logo aus, entfernen das Hintergrundbild, markieren farblich Administratoren in der Versionsgeschichte oder zeigen Rechtschreibfehler automatisch an. Sie sollen den Arbeitsalltag vereinfachen, die Ladezeit verkürzen oder das Aufrufen von Spezialseiten ersparen. Weiterhin ist es möglich, auf Knopfdruck einen eingestellten Text durch einen Hinweisbaustein, beispielsweise wegen einer Urheberrechtsverletzung, zu ersetzen oder auf Klick einen neuen Benutzer auf seiner Diskussionsseite zu begrüßen. Gestalterisch können Schriftgrößen angepasst und Menüs verändert werden, sodass sich die Arbeitseffizienz des Benutzers verbessert.
Auch besonders zeitaufwendige Aufgaben rückten ins Visier der Entwickler, so gab es bald die Möglichkeit, nicht mehr aktuelle, »tote« Links automatisch zu markieren. Da eine ständige Kontrolle nicht möglich ist, führt das Skript diese beim Aufruf des Artikels im Hintergrund durch und gibt dem Autor entsprechende Hinweise.





MC582

Vokabeln:


MC583

Manche Fehler wurden von vielen verschiedenen Autoren immer wieder gemacht. Gerade bei einer Community mit hoher Fluktuation redet man sich bei der Verständigung über bestimmte Konventionen den Mund »fusselig«. So wurden Skripte entwickelt, die beim Speichern eines Artikels Formfehler wie fehlende Leerzeichen oder Tausendertrennpunkte einfügen, automatisch die Reihenfolge von Kategorien anpassen oder eigenständig defekte Tabellen reparieren.
Nicht alle Benutzer sind jedoch dem Projekt gegenüber wohlgesinnt. Manche versuchen, erstellte Artikel zu zerstören oder Text und Bilder einzufügen, die mit dem Artikel nichts zu tun haben. Da jede Änderung im Projekt gespeichert wird, gelingt es mittels der Versionsgeschichte, den alten Artikelzustand wiederherzustellen. Zur Bekämpfung von solchem Vandalismus kann mit Hilfe von Skripten die Änderung durch einen einzigen Klick entfernt und der Benutzer ermahnt werden.
Einige Skripte schafften es später auch in die MediaWikiSoftware. Dazu gehörte das automatische Umwandeln von »ß« in »ss«, wenn der angemeldete Wikipedianer ein Schweizer ist.
Mit dem umfangreichen Skript »Navigations-Popups« gibt es für den Leser eine schnelle Einblendung des ersten Absatzes eines Artikels, auf den er verwiesen wird. Der Textausschnitt, der beim Überstreifen mit der Maus sichtbar wird, gibt dem Benutzer die Möglichkeit, einzuschätzen, ob der Artikel für ihn brauchbar ist, und erspart ihm damit unter Umständen einen zeitaufwendigen Aufruf des Stichwortes. Das über Nacht entstandene Skript »GeoHack« gestattet es dem Leser, bei Ortsartikeln die geographische Position des gewählten Ortes bei verschiedenen Kartenanbietern im Internet zu sehen.


MC584

Vokabeln:


MC585

Werkzeuge
Eine Besonderheit von Werkzeugen besteht darin, dass sie meist völlig losgelöst von der MediaWiki-Software aktiv werden und dann eine Liste zur Abarbeitung, eine Umwandlung des eingegebenen Textes oder eine statistische Aufbereitung ausgeben. Es soll im Folgenden wiederum beispielhaft aufgezeigt werden, wozu Werkzeuge fähig sind. Der englische Fachbegriff ist »tools«, was erklärt, wie der Toolserver zu seinem Namen kam. Die hier geschilderten Beispiele sind nicht mit dem Menü »Werkzeuge« in MediaWiki zu verwechseln; es handelt sich vielmehr um Funktionen, die direkt auf die jeweiligen Datenbanken zugreifen.
Erste Werkzeuge dienten zur Erstellung von Statistiken über die geleistete Arbeit, wie beispielsweise der Bearbeitungszähler (englisch edit counter) oder die Statistik zur Versionsentwicklung von Artikeln. Das erstgenannte Werkzeug ermöglicht es nun, abzuschätzen, wie aktiv ein Benutzer im Projekt ist und wo seine Arbeitsschwerpunkte liegen. Es gibt auch einen Überblick darüber, wie sich die Teilnahme des jeweiligen Benutzers über die Zeit entwickelte und welchen Anteil die tatsächliche Artikelarbeit im Vergleich zu Diskussionen oder Projektseiten hatte. Mit Hilfe des zweiten Werkzeugs lässt sich nachvollziehen, wer maßgeblich an einem bestimmten Artikel beteiligt war. Weiterhin gibt es zuverlässige Informationen darüber, wie viel Zeit durchschnittlich zwischen den Änderungen eines Benutzers vergangen ist, wann dieser das letzte Mal etwas bearbeitet hat und wie viele Benutzer insgesamt am Artikel mitgewirkt haben.




MC586

Vokabeln:


MC587

Um den Überblick über stark frequentierte Seiten zu behalten - insbesondere, was den Wikipedia-Namensraum betrifft gibt es eine zusammenfassende Statistik zu den letzten Änderungen. Viele Abstimmungen und Diskussionen werden in diesem Namensraum durchgeführt. Das Werkzeug ermöglicht dem Benutzer einen schnellen Einblick in wichtige Rubriken und Aktionen wie beispielsweise die Löschkandidatenseiten oder die Anzahl der Artikellöschungen. Es ist ohne Aufwand möglich, einen beteiligten Benutzer auszuwählen und seine Aktionen der letzten 24 Stunden zu analysieren.
Ein weiteres sehr vielseitiges Werkzeug ist »CatScan«. Da alle Wikipedia-Artikel mindestens über eine Kategorie verfügen, können mit diesem Werkzeug themengebunden die letzten Änderungen gefiltert, neue oder besonders kleine Artikel einer Kategorie zusammengestellt, Unterkategorien aufgelistet oder die verwendeten Bilder der Artikel nach Themenbereich angezeigt werden. So ist es beispielsweise einfacher möglich, freie Bilder zum Thema Käfer zu finden.
Die Veranschaulichung von Wikipedia-Inhalten kommt besonders bei Veranstaltungen mit Besuchern zum Tragen, die noch wenig über die Ablaufstrukturen von Wikipedia wissen. Mit dem Werkzeug »Vandal Fighter« kann man einen Eindruck von der Veränderungsgeschwindigkeit des Projekts bekommen. So bietet das unter Java programmierte Werkzeug eine Echtzeitansicht auf die letzten Änderungen. Eindrucksvoll zeigen sich im Sekundentakt Zeile für Zeile Hinweise, wo gerade etwas geändert oder neu angelegt wurde. Zum reinen Betrachten der Änderungen eignet sich das Werkzeug »WikiStream« hervorragend.




MC588

Vokabeln:


MC589

Dank der farblichen Hervorhebung der Zeilen kann man gut den Anteil der anonymen Bearbeiter sehen oder große Änderungen feststellen. Auf einen Blick bieten sich weiterhin der Bearbeitungsumfang und die Zusammenfassungszeile der Änderungen, die nach Belieben mit einem Klick im Browser angeschaut werden können. Wenn eine dem Projekt nicht zuträgliche Änderung entfernt wurde, wird diese automatisch bei anderen Anwendern, die das Werkzeug zur selben Zeit nutzen, ausgeblendet. Dadurch wird die Menge der Doppelarbeit reduziert.
Wie »Vandal Fighter« wurde auch das »Programm Huggle« für die schnelle Erkennung von Vandalismus konzipiert. Huggle bietet hierfür eine Rundumlösung, um diejenigen Nutzer zu finden, die vorsätzlich falsch handeln, und deren Schäden unkompliziert zu suchen und zu beseitigen. Mit einem Klick kann man Vandalen verwarnen, auf ihr jeweiliges Fehlverhalten hinweisen und sie, wenn notwendig, für eine Sperrung melden.
Durch Bots, Skripte und Werkzeuge ist es möglich, mit den täglich neu hinzukommenden Inhalten von Wikipedia zu spielen und Probleme, die den Arbeitsalltag prägen, wesentlich zu vereinfachen. Dieser Beitrag kann nur einen kleinen Einblick bieten. Die Welt der Helferlein ist viel spannender, umfangreicher und einfacher anzuwenden, als man es vermuten mag.


MC590

Vokabeln:


MC591 - MC600

[editar]

MC591

AUSBLICK: WIKIPEDIA 2021
VON MARKO TERNICK
---
Wie kann, wie soll, wie wird Wikipedia 2021 aussehen? Ihre grundlegenden Eigenschaften werden sich vermutlich nicht ändern. Sie wird weiterhin frei zugänglich und immer noch die größte deutschsprachige Online-Enzyklopädie sein. Statt der 1.170.000 Artikel Anfang 2011 dürften 2021 mehr als zweieinhalb Millionen existieren. Dann werden größere Gebiete vollständig sein, so wie es bereits heute die Reichstagsabgeordneten sind. Trotzdem wird es noch viele anzulegende Artikel geben. Im Januar 2011 gab es fast 2,1 Millionen gewünschte Artikel, erkennbar an der roten Verlinkung in bereits bestehenden Artikeln, das heißt im Schnitt etwa 1,7 rote Links pro Artikel. In der englischsprachigen Wikipedia schwankte dieses Verhältnis in der Zeit von Januar 2003 bis Januar 2006 zwischen 1,6 und 1,9, lag im Januar 2011 bei 1,52 und wird voraussichtlich auch 2021 noch in der Nähe des heutigen Werts liegen. Ein deutliches Unterschreiten dieses Wertes dürfte das Wachstum der Enzyklopädie erheblich verlangsamen. Insgesamt sind nach den heutigen Aufnahmekriterien mindestens 15 Millionen Artikel in der deutschsprachigen Wikipedia möglich, wahrscheinlich sogar mehr als 25 Millionen. Das Wachstum könnte also noch Jahrzehnte im bisherigen Tempo weitergehen.
Die Anzahl der Bild-, Ton- und Videodateien wird sich sogar noch deutlich stärker erhöhen: Von rund acht Millionen am 1. Januar 2011 auf mehr als 25 Millionen im Jahr 2021. Ebenso wird die durchschnittliche Länge der Artikel zunehmen. Weil nicht jeder Nutzer die Zeit haben wird, den gesamten Text zu einem Stichwort zu lesen, werden eine kurze prägnante und vor allem allgemeinverständliche Einleitung und eine übersichtliche Artikelstruktur mehr und mehr an Bedeutung gewinnen.



MC592

Vokabeln:


MC593

Interaktiv
Bisher gibt es - neben dem Bearbeiten-Button - nur sehr wenige interaktive Elemente in der Wikipedia. Durch einen Klick auf das Symbol »0« im Kopf einer Tabelle kann man die entsprechende Spalte sortieren. Eine farbliche Hervorhebung der Tabellenzeile, auf die man mit der Computermaus zeigt, gibt es allerdings noch nicht. Wirklich interaktiv ist bisher nur die Openstreetmap-Karte. Sie öffnet sich beim Klick auf den Link »(Karte)«, der in vielen Artikeln zu Orten oder Sehenswürdigkeiten ganz oben rechts eingebunden ist. Auf dieser Karte sind weitere Orte kenntlich gemacht, zu denen Wikipedia-Artikel und teilweise auch Bilder existieren. Satelliten- oder Luftbilder sind allerdings noch nicht verfügbar, was sich hoffentlich bis 2021 ändern wird.
Bis dahin wird es auch einige weitere interaktive Elemente geben. Man wird chemische und Biomoleküle in verschiedenen Modellen anschauen können (Stäbchen-, Kugel-Stab-, Kalottenoder Bänder-Modell) und sie im Raum drehen können, so wie es heute schon auf Proteopedia möglich ist. Auch einige Museumsstücke, Michelangelos David oder Martin Behaims Erdapfel können von allen Seiten und dreidimensional betrachtet werden - bis 2021 werden sich wohl Monitore durchgesetzt haben, auf denen ein räumlicher Eindruck erzeugt wird, ohne dass man spezielle Brillen tragen muss. Für anatomische Artikel wäre es außerdem sehr gut, wenn man durch eine 3D-Repräsentation des menschlichen Körpers navigieren könnte. Artikel zu physikalischen und technischen Themen würden von interaktiven Experimenten und bewegbaren Modellen sehr profitieren.



MC594

Vokabeln:


MC595

Für den Leser wird es die Möglichkeit geben, die Qualität von Artikeln zu bewerten. Er kann bis zu zehn Punkte in den Kriterien Korrektheit, Verständlichkeit, Vollständigkeit, Aktualität, Neutralität, Sprache (Rechtschreibung, Zeichensetzung, Grammatik), Multimedia (genügend Bilder, Videos, Ton), Überprüfbarkeit (Sind die notwendigen Quellen angegeben?) und Interessantheit vergeben. Außerdem wird er zu jedem Punkt Kommentare hinterlassen können, warum der Artikel seiner Meinung nach nicht die volle Punktzahl verdient. Wortbeiträge kann man zwar schon heute auf der Seite »Diskussion« anbringen, die es zu jedem Artikel gibt - das wird aber nicht sehr oft genutzt. Durch die Bewertung kann der Leser eingebunden werden und auf Mängel hinweisen, die dann behoben werden können. Der Autor des Artikels bekommt Feedback und sieht, dass seine Arbeit geschätzt wird.
Der Leser wird selbst entscheiden können, welche Geschlechtsform er sehen möchte (»Lehrer«, »Lehrerinnen« etc.) und ob er lieber die wissenschaftliche Aussprache »[mi'ljol]« oder einen möglicherweise nicht ganz exakten, aber allgemeinverständlichen Hinweis »(ausgesprochen: Milljöh)« angezeigt haben will. Mitarbeiter können auswählen, ob sie die Hilfeseiten mit der Anrede »Du« oder »Sie« lesen wollen. Auch wird es möglich sein, sich den Artikel (der auf Standarddeutsch gespeichert ist) in Schweizer oder österreichischem Hochdeutsch anzeigen zu lassen. Vielleicht wird man sich die Inhalte sogar in einem deutschen Dialekt ansehen können. Damit würde die Arbeit an den Wikipedias in deutschen Dialekten nicht mehr nötig sein. Eine gute automatische Übersetzung von Artikeln beispielsweise der englischsprachigen Wikipedia halte ich für 2021 noch nicht für realistisch - auch wenn die Computerübersetzung bis dahin deutliche Fortschritte gemacht haben wird.
2021 könnte es auch folgende Funktion geben: »Nutzer, die diesen Artikel gelesen haben, haben auch ... gelesen«. Weil dafür die besuchten Artikel irgendwo gespeichert werden müssten, würde diese Funktion aus Datenschutzgründen nur für Benutzer zur Verfügung stehen, die sich dazu bereit erklärt haben.


MC596

Vokabeln:


MC597

Maschinenverständlichkeit
2021 wird Wikipedia maschinenverständlich sein. Dazu wird man nicht alle Informationen mit Metadaten versehen müssen: es wäre auch ein ganz unrealistisches Unterfangen, alle wichtigen Informationen im Artikeltext manuell zu kennzeichnen. Stattdessen werden Computer intelligent genug sein, den Fließtext zu verstehen und Information zu extrahieren. (Bis 2021 wird ein Computer wahrscheinlich den einfachen Turing-Test bestanden und damit die Silbermedaille des Loebner-Preises gewonnen haben.) Um den Artikeltext zu verstehen, könnte man zum Beispiel die Verlinkung nutzen (sowohl zu anderen deutschsprachigen Wikipedia-Artikeln als auch zu WikipediaArtikeln in anderen Sprachen), ebenso die Kategorien im Ursprungsartikel und in den verlinkten Artikeln. Auch Informationen aus Vorlagen, etwa Info- und Taxoboxen, geographische Koordinaten oder Personendaten, sowie Tabellen dürften nützlich sein. Außerdem könnte Wiktionary, das freie Wörterbuch aus der Wikimedia-Familie, benutzt werden, um die Wortart und bei Substantiven das Geschlecht zu bestimmen, und es so dem Programm erleichtern, den Text zu verstehen.
Sind die Artikel erst einmal computerverständlich, ist ein Abgleich der Informationen zwischen den Artikeln der deutschen Ausgabe und auch mit anderen Sprachversionen möglich, ebenso Hilfe bei der Auflösung von Links zu mehrdeutigen Begriffen. Aus den Vorlagen »Taxobox« oder »Ahnentafel« wird man Stammbäume der Lebewesen oder von Herrscherhäusern erstellen können, bei denen sich interaktiv bestimmte Äste einund ausblenden lassen. Auch die Suchfunktion kann dadurch verbessert werden: Man kann zukünftig auch Fragen in die Suchmaske eingeben und bekommt - zusätzlich zu den Treffern der Suche - eine verständliche und hoffentlich richtige Antwort. Zum Beispiel auf die Frage »Wann trat das Grundgesetz in Kraft?« - »Das Grundgesetz für die Bundesrepublik Deutschland trat am 23. Mai 1949, 24:00 Uhr, in Kraft. Zu anderen Grundgesetzen siehe die Liste von Grundgesetzen.« Das Unterstrichene ist dabei verlinkt. Durch die Möglichkeit, Feedback zu geben (Hat Ihnen das Suchergebnis weitergeholfen? Ja/ Nein), kann die Suchfunktion »lernen«.


MC598

Vokabeln:


MC599

Automatisierung
Die Automatisierung der Arbeitsprozesse wird in Zukunft eine sehr wichtige Voraussetzung werden, um die ständig wachsende Anzahl von Artikeln mit vertretbarem Aufwand warten zu können. Einige Seiten werden nur noch automatisch von Computerprogrammen gepflegt werden; das gilt hauptsächlich für Listen, wie heute schon die »Liste der Biographien«. Auch die Einwohnerzahl der Gemeinden einiger Staaten muss schon nicht mehr per Hand aktualisiert werden. So existiert für jedes deutsche Bundesland eine Vorlage, in der die neuesten Daten des jeweiligen statistischen Landesamts gespeichert sind. Diese werden dann automatisch in den Gemeindeartikel eingebunden. Im Moment muss diese Vorlage noch in jeder Sprachversion der Wikipedia existieren und aktuell gehalten werden. In Zukunft wird es ein gemeinsames freies Datenarchiv geben. Auf dieses »Wikidata« wird dann von allen Wikimedia-Projekten zugegriffen werden können - natürlich auch von außerhalb. Im Idealfall würden die statistischen Ämter der ganzen Welt ihre neuesten Daten direkt dort hochladen. Auch Geodäten und Genome, Personendaten und Verlinkungen von WikipediaArtikeln zum gleichen Thema in verschiedenen Sprachen sowie - in Kooperation mit den Nationalbibliotheken - bibliographische Daten zu Büchern und Aufsätzen (auf die sich dann mit ISBN und DOI zugreifen ließe) könnten dort abgelegt werden.
Auch bei der Aufdeckung von Urheberrechtsverletzungen, Spaßartikeln und Redundanzen werden automatisierte Abläufe den Autoren viel Arbeit abnehmen. Andere Prozesse laufen halbautomatisch, zum Beispiel die Formatierung, interne Verlinkung, Kategorisierung oder die Suche nach Rechtschreibfehlern, aber letztlich entscheidet immer noch ein Mensch. Vandalismus in Artikeln kann durch sogenannte »Missbrauchsfilter« auch heute schon teilweise erkannt und verhindert werden. Diese Werkzeuge werden verbessert werden und kaum noch Unsinn durchlassen.


MC600

Vokabeln:



índice
Lección 061c ← Lección 062c → Lección 063c
Lección 061Lección 062Lección 063