25 november 2010

Archiefontsluiting door nerd-sourcing


Ziek zijn heeft zo z'n voordelen: vandaag zag ik kans om door de scriptie Ontsluiting van series. Bijdragen aan digitale toegankelijkheid door archiefgebruikers van Erik Visscher te lezen:

Archivistische beschrijvingen van series als "ingekomen en minuten van uitgaande stukken" zeggen weinig over de inhoud van de documenten. Archivarissen kunnen echter niet alle series in archieven inhoudelijk ontsluiten. In deze scriptie staat de vraag centraal hoe gebruikers van archieven via internet kunnen bijdragen aan verbeterde toegankelijkheid van series met web 2.0-toepassingen. Het klassieke herkomstbeginsel is hierbij van belang. In de scriptie komen literatuuronderzoek, bestudering van praktijkvoorbeelden en experimenten aan bod.

Op een lekker vlotgeschreven manier behandelt Erik hoe archivarissen van in den beginne ("De Handleiding") tot nu hebben aangekeken tegen en zijn omgegaan met het toegankelijk maken van series archiefdocumenten. De inzet daarbij van gebruikers is erg vanzelfsprekend. Vrijwilligers zijn immers al van vroeger uit kind aan huis bij archivarissen en in een modern jasje gestoken noemen we dat tegenwoordig crowdsourcing. Vreemd dus dat er blijkbaar maar zo weinig literatuur over voorhanden is:

In de 'leeslijst' is (...) nauwelijks literatuur opgenomen over het benutten van bijdragen van archiefgebruikers, web 2.0 of niet. Het is echter niet nieuw dat archiefgebruikers kennis hebben. Archivarissen hadden al gedurende tientallen jaren kunnen nadenken hoe deze kennis zou kunnen bijdragen aan verbeterde toegankelijkheid, maar het is veelzeggend dat ze dit weinig hebben gedaan. Het duidt op een van oudsher geringe waardering door archivarissen voor bijdragen van gebruikers. (...) Onder invloed van web 2.0 staan gebruikersbijdragen nu wel, of althans: meer, in de belangstelling. (blz 30)

Nou goed, dat er geen teksten over gebruikersparticipatie in die 'leeslijst' (bedoeld wordt de zogezegde canon voor het archiefvak) te vinden zijn is niet goed, maar dat er helemaal geen teksten over te vinden zouden zijn, dat weet ik niet. En anders moeten we daar eens over na gaan denken. Ik heb de laatste tijd namelijk steeds vaker het gevoel dat dezelfde bronnen steeds herkauwd worden, terwijl andere bronnen steeds links blijven liggen. Dat laatste betreft dan vooral de bronnen die exclusief online voorhanden zijn, zoals weblogs. Punt van zorg en aandacht.

Terug naar de scriptie.

De weg die Erik zoekt is er, geïnspireerd door het project Polar Bear Expedition Digital Collections, wel eentje waarin de autoriteit van de archivaris niet verloren mag gaan. Talloze voorbeelden passeren de revue, maar eigenlijk zitten er slechts een paar aansprekende, succesvolle projecten tussen. En de vraag is dan ook meteen: waarom krijgen die zo weinig navolging?

Als voorbeeld noemt Erik de Virtuele Studiezaal van het Haags Gemeentearchief, die toch alweer een tijdje online staat en waarin iedere voorbijganger kan meehelpen met het indiceren van aktes van de burgerlijke stand. Het werkt allemaal wat lastig in Den Haag, maar het idee erachter verdient zeker navolging - zou willen dat we dit bij het BHIC deden!

Misschien speelt hier, net als bij de literatuur, mee dat onbekend ook onbemind maakt. Wederom iets om over na te denken... Een soort lijstje op Archief 2.0 of in de ArchiefWiki met goede literatuurverwijzingen en voorbeeldprojecten?

Terug weer naar de scriptie.

Het allerleukste is namelijk wanneer Erik zelf gaat experimenteren. Hij maakte een weblog waarop hij dag- en nachtrapporten van de Schiedamse politie publiceerde en gebruikte ook andere toepassingen, zoals Google Maps om locaties aan te duiden die in de rapporten voorkomen, of Delicious om te taggen. Een klein groepje gebruikers en archivarissen kreeg enkele opdrachten te verwerken bij deze rapporten, bijvoorbeeld om te beschrijven welke personen daarin voorkomen.

De experimenten hebben een hoog hobbykamergehalte en voor zover Erik er al conclusies aan kan verbinden is de vraag hoe waardevol deze zijn. Niet belangrijk voor nu. Ik kreeg in ieder geval een vrolijk gevoel bij het doorlezen van zijn verhaal over het opzetten van de experimenten. Vooral werd ik getriggerd door gebruiker 'Goof', die door Erik slechts terloops wordt genoemd. Goof heeft namelijk online wel talloze politierapporten zitten transcriberen door reacties op blogposts achter te laten. Erik had zijn testpersonen juist expliciet gevraagd niet de blog te gebruiken (want dan zouden ze kunnen 'afkijken' van elkaar) en weet ook niet wie er achter de naam 'Goof' schuilgaat is. Misschien is het niet eens een van de testpersonen.

In ieder geval doet Goof me terugdenken aan Ben Brumfield, die reageerde op mijn bespreking van het crowdsourcingsproject Transcribe Bentham en stelde:

what does it mean to crowdsource from a small number of active users? This is something that was discussed at "What can the vulgus do? Crowd-sourcing for medievalists", in which "magistra" differentiated between crowd-sourcing by "mass volunteers" and "nerd-sourcing". As I wrote there, I'm convinced that nerd-sourcing works: over a thousand pages of the Julia Brumfield Diaries were transcribed by a single volunteer recruited from a very limited pool of potential volunteers. The challenge for the Transcribe Bentham project will be in finding those motivated nerds -- essentially a matter of community research and targeted marketing.

Alwéér die nerd dus! Vooral opmerkelijk omdat zo'n zelfde nerd voor Erik reden was om de politierapporten als onderwerp van zijn experimenten te nemen:

In de studiezaal van het Gemeenearchief Schiedam is regelmatig een archiefgebruiker te vinden die nauwgezet de dag- en nachtrapporten van de politie onderzoekt. Deze persoon is met name op zoek naar personen die op bepaalde adressen woonden. In de archivistische beschrijving in de toegang is over hun namen of het adres niets terug te vinden. Juist daarom kan het werk van de onderzoeker vanuit het oogpunt van de ontsluiting interessant zijn. (blz. 31)

Wie kent er niet dergelijke studiezaalbezoekers? Met de tegenwoordige aandacht voor crowdsourcing vergeten we bijna dat andere goud wat vaak al binnen handbereik is: nerd-sourcing dus! Zo doen we als BHIC wel mee aan het Amsterdamse crowdsourcingsproject rond militieregisters, maar wil het daarnaast niet echt vlotten met het verwerken van de talloze digitale gegevens (indexen, regesten en transcripties) die al gewoon door onze bestaande studiezaalbezoekers zijn en nog steeds worden gemaakt. Massa's schepenprotocollen en notariële aktes zijn al digitaal ontsloten op namen, plaatsen, onderwerpen en data, en aan ons afgegeven, maar staan nog altijd niet online. En dan heb ik het nog niet eens over al het materiaal wat we wel aangeboden krijgen, maar simpelweg niet (meer) aannemen, omdat we er zogezegd geen raad mee weten.

Waar zijn we soms toch mee bezig...?

Gelukkig had ik dat laatste al op m'n lijstje staan voor als ik weer beter ben. Over beter worden gesproken... Misschien de laptop eens ontkoppelen?!

2 opmerkingen:

  1. Wij proberen in ieder geval wel wat aan "nerd-sourcing" te doen. De term behoeft wel aanpassing, want ik associeer toch altijd een computer bij de term nerd.
    Wij hebben een vrijwilliger die al heel veel toegangen heeft gemaakt uit het protocol van Oisterwijk, voor onze dienst een belangrijke gemeente. Er zijn ook vrijwilligers die al jarenlang noest regesten of indexen maken van notariële protocollen uit de 16de en 17de eeuw.
    Er zijn vast meer archiefdiensten die op deze manier de kracht van een individu inzetten om nadere toegangen te maken.

    Let's hear it!

    BeantwoordenVerwijderen
  2. @Luud: Jawel hoor, wij maken er ook wel gebruik van. Onze databases met (straf)vonnissen worden bijvoorbeeld op die manier gevuld. Maar er zijn er nog veel meer waar we eigenlijk slechts half werk van maken. En da's jammer. Met wat extra aandacht - voor die bestanden en die bezoekers/vrijwilligers - had je in een handomdraai een berg extra indexen waarin het stikt van de namen en plaatsen. Vooral van oude rechterlijke en notariële archieven, die minstens zo interessant zijn als de militieregisters. Nou ja, misschien heb ik die blogpost meer naar mezelf geroepen: note to self. ;-)

    Wat de term 'nerd-sourcing' betreft: ik neem slechts over wat een ander al gebruikte, maar zodra je een beter woord hebt, volg ik je.

    BeantwoordenVerwijderen