28 oktober 2011

De geschiedenis bewerken en verwijderen


Gisteren werd ik geattendeerd op het artikel What Wikipedia Deletes, and Why.

In 2010 werden zo'n 47.1 miljoen (!) bewerkingen in Wikipedia uitgevoerd. Daarvan betroffen maarliefst 56.000 bewerkingen complete verwijderingen van content. Volgens Wikipedia: "a revision with libelous content, criminal threats or copyright infringements may be removed afterwards."

Onderzoekers van de Universiteit van Pennsylvanië wilden de exacte redenen achter die verwijderingen in kaart brengen, om zo te achterhalen welke content er online kon zijn gezet, die blijkbaar zo gevaarlijk was, dat Wikipedia-moderatoren besloten die voor altijd te verwijderen.

Uit het onderzoek blijkt dat het - niet verrassend - meestal om schendingen van iemands auteursrecht gaat.

De teller van het aantal Wikipedianen dat content compleet kan verwijderen stond in mei 2010 trouwens nog op 40, maar op dit moment al op 1.800. En dan nóg duurt het gemiddeld 21 dagen voordat de gewraakte content wordt verwijderd.

Vertrouwen
Maar het mooie van Wikipedia vind ik zelf altijd de bewerkingsgeschiedenis, die voor een flink deel ook mijn vertrouwen in de artikelen bepaalt. Daarin zijn immers bewerkingen (en verwijderingen) allemaal terug te vinden, en je ziet daar dan ook heel concreet hoe de community de inhoud van Wikipedia steeds verbetert. Vertrouwen door transparantie.

Opvallend genoeg las ik dan ook - ik wist dat eerder helemaal niet - dat het bewerken en verwijderen van content door Wikipedia-moderatoren óók de geschiedenis van artikelen betreft. Dat voelt als het ingrijpen in het archief, en inderdaad als het ondermijnen van de transparantie van de encyclopedie. En daarmee dus ook van het (in ieder geval mijn) vertrouwen daarin. De onderzoekers:

Wikipedia is at that paramount example of open-source transparency. (...) So when you see them behaving in a nontransparent manner, you want to see what motivates them to do this.

Maar goed, om hier echt iets zinnigs over te kunnen zeggen, zou ik eigenlijk meer moeten weten van dit onderwerp, bijvoorbeeld door het lezen van de volledige paper What Wikipedia Deletes: Characterizing Dangerous Collaborative Content. En voorbeelden moeten hebben van wat er zoal in de geschiedenis is bewerkt en verwijderd. Zouden ze vernietigingslijsten hebben?

Afbeelding: shirt dat je tot 31 oktober via Archief 2.0 kunt bestellen

2 opmerkingen:

  1. Het zijn gelukkig maar 4 pagina's, maar die staan wel bomvol wiskundige frasen. Die begrijp je niet meteen, dus dat vergt verder lezen. Heb ik nog niet gedaan.
    Wat ik wel zag, was dat ze onderzoek hebben gedaan in de public delete-logs. Wat bij mij dan de vraag oproept of er ook secret delete-logs zijn. Misschien te achterdochtig geredeneerd, geef ik toe.
    Ander punt: een archivaris kan alleen maar geschiedenis manipuleren als hij of zij de enige bezitter van een stuk is. Zo niet, dan wordt alleen een stukje weggegooid. Ik kan me geen archivaris voorstellen die een uniek stuk zou weggooien.
    Er bestaan tenslotte nog foto's waar Trotsky wèl onder het spreekgestoelte staat waar Lenin een toespraak houdt.
    Als jij zou besluiten om mijn reactie weg te gooien, en ik heb er nergens een kopie van, dan haal je mijn beleving van de geschiedenis weg. Je verdonkeremaant dan alleen de informatie over die geschiedenis, niet de geschiedenis zelf. Maar dit neigt weer naar haarkloverij.

    BeantwoordenVerwijderen
  2. @Richard: Dank voor je reactie. Op Twitter reageerde Yvette Hoitink ook al. Ze stelde allereerst dat het, vanuit het standpunt van de bescherming van het auteursrecht, heel begrijpelijk is dat de bewerkingsgeschiedenis in dergelijke gevallen ook wordt weggegooid. Een aantekening van die bewerking/verwijdering blijft dan over in het verwijderingslogboek.

    Maar mijn reactie daarop was - en die sluit aan bij de jouwe - dat dit waar is, maar niet mijn punt. Mijn punt is vertrouwen, het verkrijgen daarvan, het behouden daarvan en het verliezen daarvan. Dat vertrouwen heeft deels plaatsgemaakt voor wantrouwen (wat jij "misschien te achterdochtig" van jezelf vindt).

    Nou goed, dat andere punt dan: archivarissen gooien zelfs heel veel unieke stukken weg. Eigenlijk worden er vanaf het moment dat archieven worden aangelegd (vanaf het moment dat documenten 'ontstaan') ook alweer documenten weggegooid. In veel gevallen zal die informatie nog wel elders zijn gebleven (een rekening wordt overgenomen in een grootboek) maar niet altijd. Dan daarbij: stel dat zich in mijn archief een doorslag bevindt van een brief die ik aan jou heb verstuurd. En jij zou die brief weggooien. De informatie in die brief blijft via de doorslag wel bewaard. Maar... hoe is voortaan met zekerheid te zeggen dat jij hem ooit hebt ontvangen? Naast content is ook context belangrijk.

    Overheden/organisaties leggen vaak agenda's of zo aan van ingekomen brieven - stel dat een brief wordt vernietigd, dan blijft het bewijs van ontvangst daar... tenzij natuurlijk het archief wordt bewerkt.

    En dan zijn we weer terug bij Wikipedia.

    BeantwoordenVerwijderen