Posts tonen met het label Gebruikersparticipatie. Alle posts tonen
Posts tonen met het label Gebruikersparticipatie. Alle posts tonen

8 juli 2013

Destination: Australia


Wéér een blog over een mooi project van onze collega's in Australië: Destination: Australia

The Destination: Australia website aims to draw on the stories of the people and their family members featured in the photographs showcased on the site to create an in-depth history of Australia’s post-war immigration.
(...)
The site is continuing until at least 2015 and the information shared will become part of the Archives’ RecordSearch system as a permanent part of Australia’s history.
You are able to tag people who you know, tag where they came from and came to, add descriptions and comments, and comment on others’ contributions, or scan photographs to explore what Australia’s post-war immigration boom was really about.

Er is een onderhoudende doch niet noodzakelijke webcast beschikbaar (waarvoor je bovendien eerst je naam en adres moet opgeven) waarin Geoff Mason van de Australische National Archives uitleg geeft bij de website.

Semantisch
Geoff vertelt daarin wat ikzelf ook al had opgemerkt toen ik de helppagina's bekeek: het toevoegen van informatie gaat op een manier zodat het semantisch web er straks ook nog wat aan heeft. Je kunt bijvoorbeeld een locatie bij een foto opgeven, maar ook specificeren of die locatie de plek betreft waar de foto is genomen, waar de persoon op de foto vandaan komt of de plek van de haven waar die persoon in het nieuwe land is gearriveerd. En aangezien op een foto meerdere personen kunnen staan, kunnen er dus ook een veelvoud aan gespecificeerde locaties aan worden gehangen. Personen worden zoals bij Flickr en Facebook getagd en verder kun je natuurlijk simpelweg trefwoorden en reacties (met links en afbeeldingen) achterlaten, favorieten opslaan en zo meer.

Vooral het taggen van personen en locaties gaat vernuftig. Hoe meer tags, hoe meer betekenisvolle relaties er in en tussen foto's worden gelegd. Het maakt heel specifiek, heel krachtig zoeken mogelijk. Maar goed, dan moet de content er wel zijn... en dat wordt tijdens de webcast ook onbedoeld gedemonstreerd.

Crowd
Na wat rondklikken moet ik namelijk constateren dat ik nog weinig beeld krijg van het aantal gebruikersbijdragen aan de site. Geen reacties kwam ik tegen en slechts her en der een tag, waarvan de herkomst me onduidelijk is. Wat dat betreft mogen ze een voorbeeld nemen aan een ander project van zichzelf, om alle activiteit inzichtelijk te maken.

Uit de webcast wordt duidelijk dat er leaderboards zijn en dat je daarop terechtkomt als je door je bijdragen voldoende puntjes hebt verzameld. Het waarom daarachter ontgaat me en het lijkt een beetje op iets wat als 'gewoon leuk' is ingebracht. Alhoewel sommige gebruikers er toch weer een sport van hebben gemaakt om zoveel mogelijk te taggen (om vervolgens te vragen of ze van het leaderboard konden worden verwijderd, omdat ze zich schaamden voor de tijd die ze op de site spendeerden).

Kortom
Hoe dan ook, nog geen onverdeeld crowdsourcingssucces misschien, maar de site ziet er prima uit en de manier van taggen vind ik erg goed doordacht. Check tot slot ook even de featured stories voor wat Hollandse inbreng in Australië. Gewoon leuk.

Aanbevolen leesvoer
- Ondertussen in Australië... wordt er gescand
- Maak je eigen Metadata Game! En iets over 'critical play'

Foto: Dutch couples' cake shop draws media attention - Pieter and Cor Ermstrang

(Tip via Bob Coret)

28 september 2012

Je bent pas een échte Bosschenaar als...


...je blijkbaar lid wordt van deze Facebook-groep.

Op de welkomstpagina eerst een melding over provocerende foto's en vervelende reacties, maar die zijn door de beheerders inmiddels weggehaald, want zelf kwam ik er geen meer tegen. En hoe moeilijk kan het verder zijn?

De bedoeling van deze groep is om op een leuke, gezellige manier herinneringen op te halen met behulp van Bossche foto's en anekdotes. (...) Bossche gezelligheid staat wat ons betreft voorop!

Meer dan 5.000 (oud-)Bosschenaren werden al lid, er zijn al honderden foto's gepost en het aantal reacties tikt lekker door. Hyperlokaal, heerlijk nostalgisch, geschiedkundig misschien weinig verheffend, "maar wel keileuk om te zien", om een van de reageerders te citeren.

Als je mensen weer in contact wilt brengen met hun verleden, met hun stad, met hun buurtgenoten. En als je dat verleden voor hen van betekenis wilt laten zijn, dat ze hun eventueel gezamenlijke identiteit ontdekken, elkaar ontmoeten en kortweg in het heden met het verleden een 'keileuke' tijd hebben. Als je dat wilt, ook als archiefdienst, dan hier weer een prachtvoorbeeld voor het grijpen.

Soort historisch Facebook, zeg maar.

Gerelateerd leesvoer
Inspiratietopper: Jeugdsentimenten.net
Open Monumentendag 2012 in Den Bosch: hoven, hofjes en binnenplaatsen

(Tip via collega's van het Bossche stadsarchief)

Foto: fontein De Draak, gezien vanaf het Stationsplein in de richting van het centrum, circa 1931 (bron: Stadsarchief 's-Hertogenbosch, fotonr. 26511)

28 juni 2012

Waar ik blij van word #kvan12


Richting het einde van de KVAN-dagen vroeg Wim Karels mij van welk project op het BHIC ik het afgelopen jaar blij was geworden. Dat zijn er een heleboel, maar als concreet voorbeeld gaf ik hem het projectje rond onze notaris- en schepenaktendatabase die een jaartje geleden werd gelanceerd. Onder de noemer geven en krijgen schreef ik er al eens eerder over.

Scannen en bladeren
Al lange tijd stonden er op onze website scans van veel schepenprotocollen online, maar zonder index. Voor de onderzoekers betekende dit kortom: zelf bladeren door de online boeken en zelf ontcijferen van het oude handschrift. Fijn dat de scans beschikbaar waren, maar echt publieksvriendelijk was het natuurlijk niet.

Veel onderzoekers, maar ook heemkundige werkgroepen en verenigingen werken echter hard aan het maken van eigen indexen en samenvattingen, een klus waarmee ze soms al jaren zoet zijn. Het resultaat van hun arbeid publiceren ze vaak in boeken of als doorgaans platte tekst op allerlei websites, zodat zoveel mogelijk mensen ervan kunnen profiteren.

Acquireren
Na contact te hebben gezocht met een aantal van hen, bleek dat zij ook graag bereid waren tot samenwerking met het BHIC. Onze website heeft natuurlijk een veel groter publieksbereik dan al die aparte websites, is makkelijker te doorzoeken, de continuïteit van de online beschikbaarheid van alle gegevens is gegarandeerd, en bovendien kunnen indexen en samenvattingen rechtstreeks aan de gescande akten worden geknoopt. Acquisitie van indexen dus, die akte voor akte de reeds gescande registers toegankelijk maken.

Onze credits gaan naar de makers van al die nadere toegangen. Maar het mooiste vinden ze toch wel dat hun toegangen ontzettend veel en vaak geraadpleegd worden. Bezoekers van onze website zijn razend enthousiast en vinden veel nieuwe informatie. Dat enthousiasme blijkt niet alleen uit de statistieken, maar ook uit de vele berichten in genealogische discussiegroepen, op fora, in onze mailbox en zo meer.

En bovendien uit het toenemend aantal mensen en clubs dat ons weet te vinden voor het aanleveren van huisgemaakt materiaal. Al die aangeleverde bestanden worden vanuit Word, Excel, html enzovoort keurig in onze database gepompt. Zo schurkt die laatste op dit moment al aan tegen de 100.000 samenvattingen van akten, samen goed voor misschien al wel een miljoen namen van personen en plaatsen!

Leerproces, sociaal proces
Op het BHIC hebben we geleerd dat goed genoeg, goed genoeg is. Een eigen indiceringsproject werd jaren geleden stopgezet wegens te geringe voortgang (vandaar al die scans online zonder index). Standaardlijstjes voor aktesoorten, afzonderen van persoonsnamen, normalisaties van plaatsnamen en specifieke velden voor belendingen; allemaal mooi en aardig, maar het betere is ook hier de vijand van het goede gebleken.

Het eenvoudige invoerformat dat door onze huidige toeleveranciers van toegangen wordt gehanteerd, in combinatie met full text doorzoekbaarheid van de database, in combinatie met een koppeling naar de gescande akten, werkt namelijk prima. Waar makkelijk mogelijk sturen we ietsjes bij, maar even zo goed en makkelijk laten we dat.

Het sociale proces en de voortdurende communicatie met mensen en groepen vormen de kern van dit project. Een project dat trouwens bijna 'zomaar' is ontstaan, met als eerste aanzetje een vermakelijke discussie op het stamboomforum van het BHIC (waar een actieve forumcommunity al niet goed voor is!). Je plant een zaadje, geeft het water en aandacht, het blijkt te ontkiemen, het groeit wat door en voor je het weet wortelt het zich in je organisatie.

In dit geval met veel dank aan mijn collega's Anton, die het hele conversieproces voor z'n rekening neemt, en Annemarie, die inmiddels de inhoudelijke begeleiding op zich heeft genomen.

Hoe nu verder?
Naast indexen en samenvattingen zijn we een tijdje terug ook maar terloops gestart met het acquireren van foto's van akten. Zo staan er al duizenden foto's klaar van complete registers die door bezoekers van het BHIC zijn gefotografeerd, bij toegangen die vaak weer door anderen zijn of worden gemaakt en soms ook al online staan. Het wachten is slechts op een upgrade van onze software en dan kunnen we die foto's zelf online zetten.

Daarnaast zijn we iets actiever aan het werven geslagen. Er staan nog heel wat scans van schepenprotocollen zonder index online en binnen één genealogische discussiegroep hadden enkele mensen aangegeven best bereid te zijn daarvan een deel te willen ontsluiten. Prima, dus een soort van klein projectje daarvoor opgezet. Bij enig succes zullen we dat gaandeweg richting andere groepen (zoals ons eigen forum) uitbouwen.

En natuurlijk liggen er naast indexen en samenvattingen van notaris- en schepenakten nog veel meer bronnen om te worden ontsloten. Aan sommigen wordt her en der vast al gewerkt. Kansen genoeg dus!

Kortom
Crowdsourcing in optima forma. Zonder hippe website als bijvoorbeeld VeleHanden (waar we ook aan meedoen hoor), zonder sowieso al te veel techniek en in ieder geval zonder kosten. Maar met heel veel resultaat. En met heel veel tevreden onderzoekers. Kijk, daar word ik nou blij van!

Aanbevolen leesvoer
- Alle gebruikersparticipatie nog aan toe!
- Alles over VeleHanden

Afbeelding: schilderij met blij fruit (in een serie kinderkamerkunst)

5 juni 2012

Archieven in Transitie


Al op 14 maart hield SNAAI haar jaarlijkse scriptiemiddag. Plaats van handeling was dit keer het BHIC, net als in het jaar dat ik zelf van SNAAI afscheid nam als voorzitter. Drie interessante presentaties en leuke discussies kleurden de middag.

Waaronder de presentatie van Bas Bergervoet over zijn masterthesis Archieven in Transitie. Een exploratief onderzoek naar de digitalisering van archieven. Bas studeerde Nieuwe Media & Digitale Cultuur aan de Universiteit Utrecht en liet vanuit dat perspectief het geluid van een buitenstaander klinken over het thema digitalisering van archieven. Hoe goed is dat?

Goed! Door literatuuronderzoek en interviews met een negental experts uit de praktijk, van onze algemene rijksarchivaris Martin Berendse tot de oprichter van The Internet Archive Brewster Kahle (en, oh ja, ook nog met mij) komt hij tot leuke constateringen en opvallende verschillen in benadering.

Wat is archief, wat zijn archieven?
Is het archief een plek waar vooral een bepaald beeld van het verleden wordt bewaard, waar iedereen gebruik van kan maken en het zijne van kan denken? Of is het een soort open opslagplaats die je kunt koppelen aan andere opslagplaatsen (denk databases en zo), waaraan iedereen kan bijdragen, waarin iedereen een eigen ordening kan aanbrengen en zo meer? Of iets daartussenin? Maar waar dan precies?

En daarmee eigenlijk ook meteen het onderscheid tussen de zogezegd 'officiële' archiefdiensten zoals het BHIC, en de vooral online ontstane en bestaande archieven zoals The Internet Archive. Bas noemt ze institutionele en niet-institutionele archieven, waarbij vooral de eerste categorie de tweede met argwaan bekijkt. Terwijl die tweede toch echt veelal dezelfde doelen nastreeft en niet minder professioneel daarvan werk maakt.

Opvallend is in ieder geval dat met de blik op andere instellingen gericht, zoals bibliotheken en musea, de niet-institutionele archieven veel mínder verschillen zien tussen hen en hun. En voor zover ze die wél zien, zien ze die vooral verdwijnen en smelt het allemaal naar elkaar toe. De institutionele archieven daarentegen zien dat een stuk minder snel gebeuren. Ze benadrukken vooral de eigen, unieke (wettelijke) opdracht, methoden van werken en zo nog wat zaken. Zelf maak ik me daar trouwens ook regelmatig 'schuldig' aan.

Alles online
In de literatuur wordt er voortdurend vanuit gegaan dat al het papier op den duur gedigitaliseerd zal zijn. In de praktijk worden vooral nog hobbels gezien, zoals geld, auteursrecht (vooral voor beeld en geluid) en voor wat betreft de distributie van materiaal ook de complexiteit van digitale bestanden. Voor de archivaris ziet ook Bas een rolverandering, van inhoudelijk expert naar coach, van kenner van de inhoud naar kenner van de systemen.

Interessant wordt het als Bas het in den brede getrokken aspect 'democratie' aan de discussie toevoegt. Door digitalisering pretenderen we meer toegankelijkheid en openheid te creëren, maar volgens Bas ontstaat er tegelijkertijd een extra laag van institutionele selectie. Het is immers doorgaans de archivaris die bepaalt wat er precies wordt gedigitaliseerd. Of zelfs externe geldschieters. De gebruiker zelf heeft nauwelijks invloed.

Er werd nog even gesuggereerd dat we toch lekker bezig zijn met allerlei scanning-on-demand initiatieven, maar dat is allemaal op kosten van de gebruiker zelf, dus niet wat hier wordt bedoeld. Ik voeg daar zelf aan toe dat het effect zelfs sterker is, want al wat níet gescand is, wordt in relatieve zin steeds óntoegankelijker en minder 'open'.

Lock-in
Gebruikersparticipatie (Bas toont het model van de Digital Content Life Cycle om aan te geven op welke momenten we de gebruiker allemaal mee zouden kunnen laten doen) wordt op dit moment nog slechts op kleine, veilige schaal toegestaan. Het gaat meestal om kleinere projecten, waarbij de user generated content nog goed van het archief en van het werk van de archivaris te scheiden is. We laten de gebruiker toe, maar niet te veel, niet te snel en slechts tot een veilige afstand van onszelf.

Nieuw voor mij was het principe van lock-in, waarvoor Bas ons nog waarschuwde. In You Are Not A Gadget: A Manifesto van Jaron Lanier wordt dit nader toegelicht: aan het begin van een proces is alles nog mogelijk, maar gaandeweg maak je keuzes en wordt je meer en meer door die eigen keuzes beperkt in je verdere mogelijkheden (bijvoorbeeld door het bouwen van applicaties rond een bepaalde standaard, waardoor het updaten van de standaard steeds lastiger wordt, zelfs als de standaard gaat wringen).

Aanbevelingen
Tot slot Bas' aanbevelingen voor archieven:

  • Betrek gebruikers veel meer bij de selectie van te digitaliseren archieven.
  • Expliciteer het selectieproces en communiceer dit naar gebruikers.
  • Investeer geld en aandacht aan het opzetten en onderhouden van een actieve gebruikerscommunity.

Wisten we dat nog niet? Dat misschien wel, en het zijn ook geen schokkende tips, maar goede tips kun je niet vaak genoeg krijgen. Zeker niet als je al die vorige keren niet goed hebt geluisterd...

Kortom: fris perspectief, goed verhaal, lezenswaardige scriptie.

Aanbevolen leesvoer

20 maart 2012

Mag ik even aandacht? (Over dat websites bouwen alleen niet genoeg is)


We willen dat mensen vanalles op onze websites doen, als wij er zelf maar niks voor hoeven doen.

Gisteren werd ik weer eens gewezen op vantoentotlater.nl, een website van BiblioPlus voor de Limburgse dorpen Bergen, Gennep en Mook en Middelaar: "een plek waar jong en oud al bladerend door foto's hun eigen geschiedenis kunnen ontdekken, herinneringen kunnen ophalen en verhalen kunnen delen."

Een site die er fris uitziet, intuïtief werkt en met een doordacht uploadformulier. Maar ook een site waar de gebruikersactiviteit tegen het nulpunt aanschurkt. Volgens de rss dateert de laatste upload alweer van vorig jaar, met de reacties op foto's gaat het niet veel beter.

Daar zijn natuurlijk legitieme redenen (lees: zogenaamde oorzaken) voor, zoals reorganisaties en vertrekkende mensen. Maar gelukkig is de redding nabij in de vorm van goede intenties. De site zal zelfs nog breder worden uitgerold...

Aandacht
Met deze site op zich is niet zoveel mis, met ons meestal des te meer. We hebben het te vaak te druk met onszelf. We lanceren nieuwe websites omdat we het (vaak met de hulp van rijke subsidies) kunnen, en vergeten vervolgens te investeren in de gebruikers daarvan. Niet over nagedacht? We hebben niet de juiste focus, niet de juiste houding en stellen niet de juiste prioriteiten.

Alleen bouwen van een website voor ze is niet voldoende. Mensen hebben aandacht nodig. Veel aandacht. En dat vraagt om het investeren van tijd. Veel tijd. Content moet verleiden, uitnodigen en bovenal regelmatig vernieuwd en aangevuld. Jij moet activeren, reageren, stimuleren en verbinden. Actiever dan de actiefste leden van je in opbouw zijnde community. Als je twijfelt over die investering, bouw dan gewoon die website niet.

Hopelijk komt het met vantoentotlater.nl gewoon nog goed. Na maanden van stilte is er deze week ineens zowaar een nieuwe fotovraag toegevoegd. Zonder reacties nog, dat wel.

Hoe zou het toch zijn met...
Bij de partners achter vantoentotnu.nl staat ook het BHIC vermeld. Eerlijk gezegd, zegt dat mij niks - volgens mij is het gewoon een lijstje met links - maar wie weet. In ieder geval is de site gesponsord door de provincie Limburg.

Zo ken ik er nog eentje, gesponsord door de provincie Noord-Holland: Oneindig Noord-Holland. Hoe zou het daar toch mee zijn? Ik had tijdens mijn webtest al ernstige twijfels over hoe succesvol die site zou blijken op het vlak van gebruikersparticipatie. Heb ik daarin ongelijk gekregen? Nee, helaas niet. Er wordt regelmatig nieuwe content toegevoegd, maar allemaal door een redactie en/of de samenwerkende instellingen. Verhalen van burgers vind ik zo snel niet en bij de tien willekeurige verhalen die ik aanklikte, ontbrak ieder spoor van een reactie.

Een paar maanden daarvoor lanceerde ook het Regionaal Archief Leiden een nieuwe website, waarin gebruikers via een profiel verhalen of wat dan ook konden publiceren. Eveneens een webtest, eveneens twijfels. En nu? De afdeling met uw verhalen telt over het afgelopen jaar maar liefst tien verhalen, waarvan drie door medewerkers van het archief zelf...

Jammer.

Het gaat niet vanzelf. Echt niet.

Gerelateerd

Foto: een oude ezel die aandacht wil (door Jeremiah Blatz)

16 maart 2012

Tips voor "de eerste keer"


Mijn collega's heb ik het tot vervelens toe op het hart gedrukt: reageren op ieder bericht. Of het nu een vraag op een forum, een reactie op een foto, een opmerking bij een akte of wat dan ook is. Reageer!

Later kun je daarin iets soepeler worden, bijvoorbeeld als een gebruikerscommunity dusdanig actief is geworden, dat ze je het reageren veelal uit handen neemt (zoals op de forums van het BHIC gebeurt). Maar zelfs dan blijft in veel gevallen mijn mantra overeind.

Dat geldt zéker als het gaat om iemands éérste bijdrage aan je website en/of community. Het resultaat van "de eerste keer" is namelijk iets wat je enorm sterk bijblijft en wat zelfs in grote mate bepaalt of je in de toekomst nog eens dezelfde actie zult ondernemen. Uit een usabilitytest van een aantal archiefwebsites bleek bijvoorbeeld al:

Een eenmaal succesvol gebleken zoekstrategie is voortaan (...) heilig, zelfs als diezelfde strategie daarna helemaal niet meer zo succesvol is.

En omgekeerd geldt dat natuurlijk ook. Over het reageren schreef ik al:

Want ga eens bij jezelf na hoe jij je voelt als je bijvoorbeeld op iemands blog een reactie achterlaat en je krijgt geen reactie terug? En hoe voel jij je als je dat een tweede keer wéér gebeurt? Je vraagt je dan vast af of je reactie wel is gelezen, of je reactie wel wordt gewaardeerd en of het eigenlijk wel zin heeft dat je reageert. Grote kans dat die tweede keer op die blog ook meteen je laatste keer is geweest.

De eerste keer is dus superbelangrijk. Zo werkt dat op de forums van het BHIC ook. Omdat archiefmedewerkers zelf zo actief en attent waren ten aanzien van het reageren op berichten, zéker als het een eerste bericht was van iemand, is er nu een actieve community van forumgebruikers gegroeid die ons datzelfde werk grotendeels uit handen neemt. Ter illustratie: ons aandeel in het aantal berichten op het genealogisch forum is vanaf 2007 gedaald van ongeveer 30% naar 3%, terwijl het gemiddelde aantal reacties per nieuw bericht in die jaren steeg van ongeveer 1 naar 8.

En dat begint met héél veel eerste reacties.

Tips
Op het gebied van communitymanagement volg ik graag het weblog FeverBee van Richard Millington. Deze week schreef hij precies over ditzelfde onderwerp. En zijn krachtige tips wil ik jullie niet onthouden. Archivarissen-communitymanagers, spits uw oren:

The response to a user's initial contribution is a big factor in determining the amount of time someone is an active member of a community. (...)
Your response needs to be quick. If a member had to wait a few days for a response, they're gone.
Your response has to be genuine. You have to response to what they say. You need to acknowledge the quality of the question and provoke further debate. 
You might also want your volunteers/regular members to participate. Responses from 5 people including 2 long-term members is better than a quick response from the community manager.
If you're finding that many of those whom make a first contribution never make a second, you might want to work harder at crafting a better response to that first contribution.

Dat derde is ook een waarheid als een koe, weet ik uit eigen ervaring. Op Archief 2.0 moest ik bijvoorbeeld zeker in het begin oppassen dat het niet steeds m'n eigen kop was die bovenaan ieder lijstje met reacties prijkte. Want die lijstjes worden daardoor steeds korter. En in plaats van stimuleren creëer je dan het effect van doodslaan.

Nou, hoe dan ook: leer van Richards aanbevelingen. En volg zijn blog.

En reageer! Zeker op eerste keren.

Gerelateerd
- Reageer!
- Communitymanagers: we kunnen er geen genoeg van hebben!

Foto: van een blog voor paardenliefhebbers

26 januari 2012

You Can Transcribe It! (En iets over broodkruimels)


Twee dagen geleden blogde ik nog dat het er aan zat te komen. En gisteren was het er ineens: de transcribeermodule van NARA.

Iedereen kan meehelpen, je hoeft jezelf niet te registreren en je kunt zelf kiezen wat je wilt gaan doen. Er zijn drie niveau's (beginner, intermediate en advanced) en verder kun je documenten selecteren op jaar en status (not yet started, partially transcribed en completed).

Makkelijk begin(nen)
De documenten variëren van een telegrammetje van president Abraham Lincoln aan zijn vrouw (een paar regels) tot het complete dagboek van Robert E. Peary, een Amerikaans ontdekkingsreiziger (105 pagina's).

De interface voor het transcriberen kan nog wat intuïtiever - vooral het bewegen door de afbeelding - maar het werkt allemaal erg makkelijk en eenvoudig hoor. Lastig vind ik alleen dat je nogal vaak stuit op pagina's die locked zijn. Dat wil zeggen dat iemand anders er al mee bezig is. Het zou fijn zijn als je dat al vóór de muisklik ergens aan kon zien. Of dat zo'n pagina gewoon wordt overgeslagen.

Uit de tips leid ik af dat er betrekkelijk lage eisen aan je werk worden gesteld, zeker als je dat bijvoorbeeld vergelijkt met de eisen die Transcribe Bentham stelt, een soortgelijk crowdsourcingsproject rond transcriberen van archiefdocumenten. Maar er wordt dan ook op een andere doelgroep gemikt.

Behapbaar
Het is een goede zet van NARA om overzichtelijke hoeveelheden documenten aan te bieden, in dit geval zo'n 300 stuks (in totaal zo'n 1.000 pagina's). Dat werkt waarschijnlijk beter dan zomaar een transcriptiemogelijkheid in je website plempen, zoals bijvoorbeeld het geval op gahetNA. Ik ben (nog steeds) benieuwd naar wat die laatste manier oplevert. Misschien dat ze daar ook met de module van NARA kunnen gaan werken? Die is immers gebouwd in Drupal.

Wat de manier van aanbieden betreft - in behapbare blokken - lijkt de module van NARA eigenlijk wel op Transcribe Bentham of de Tilburgse Charterbank. Verschil met die laatste twee is de laagdrempeligheid, maar samenhangend daarmee (bijvoorbeeld door het gebrek aan een inlog) dat er weinig aandacht is voor communityvorming. Via Twitter leerde ik dat dit mogelijk in de toekomst wel gaat komen.

Broodkruimels
Ik vind het prachtig. Maar aan de andere kant gaat het natuurlijk maar om kruimels. Pak ik als voorbeeld even Transcribe Bentham - een van de meest succesvolle transcriberen-via-crowdsourcen-projecten die ik ken, dan leer ik dat op dit moment (en we zijn sinds september 2010 onderweg) zo'n 45% van al de te transcriberen manuscripten daadwerkelijk is getranscribeerd. In aantallen: het betreft 2.561 van de in totaal 5.580 manuscripten. Dat is heel veel en goed werk. Tegelijkertijd zijn het eigenlijk peanuts.

Toegegeven, Transcribe Bentham stelt wel erg hoge eisen aan de transcripties, dus als je met wat minder genoegen neemt, dan gaat het een stuk sneller. Maar op de enorme aantallen papier die wij in onze depots opgeslagen hebben liggen, en waarvan grote delen al zijn gescand, zijn enkele duizenden transcripties betrekkelijk weinig.

Vooralsnog proef ik dan ook dat dit soort crowdsourcingsprojecten vooral goed uit te voeren zijn rond duidelijk afgebakende collecties of delen van collecties. Daar is sowieso makkelijker een project rond te bouwen. Voor het overige lijkt het me beter om vooral ook keihard te blijven investeren in OCR voor oude handschriften. Want dan gaan we pas écht meters maken met transcriberen.

Alle transcripties helpen
Maar tot slot een positieve noot (en da's ook de insteek van NARA): iedere transcriptie is er eentje. Iedere transcriptie maakt in ieder geval een klein stukje archief beter toegankelijk. En iedere transcriptie betekent ook een relatie tussen de archiefdienst en een klant.

En sinds gisteren is er al héél wat getranscribeerd in Amerika; het tonen van een voortgangsmetertje zou dat nog verder kunnen stimuleren.

Gerelateerd
- Alle gebruikersparticipatie nog aan toe (24 januari 2012)
- De transcribiwiki van Transcribe Bentham (29 september 2010)
- Monk: OCR voor oude handschriften (5 maart 2011)
- Thema: Crowsourcing

Afbeelding: NARAtions

24 januari 2012

Alle gebruikersparticipatie nog aan toe!


In november 2011 werd het Citizen Archivist Dashboard van het NARA aangekondigd. Z'n dashboard vond ik toen al een gouden greep. Inmiddels is het dan echt gelanceerd en raakt het steeds beter gevuld met knopjes. Check hier!

Op de startpagina lees je eigenlijk precies waar het om draait:

One Day... All of our records will be online. You can help make it happen.
You can become a citizen archivist - just click one of the options below to get started.

Duidelijk. Zo kun je simpelweg eens beginnen met taggen:

By adding keywords, terms, and labels to a record, you can do your part to help the next person discover that record.

Ook duidelijk. Mooi vind ik dat er vervolgens voor al die citizen archivists steeds een soort spelletje van wordt gemaakt. De te taggen foto's en documenten worden bijvoorbeeld aangeboden in thematische blokken van materiaal die missions worden genoemd, en aan ieder blok is een moeilijkheidsgraad verbonden. Zo is taggen van World War II Posters voor beginners, maar houd je wel van een uitdaging, dan kun je je op deze foto's van de 19e-eeuwse fotograaf William Henry Jackson storten storten. Jammer is dan wel dat het er, nadat je het dashboard verlaat, ineens niet meer als een spelletje aan toegaat. Ook beginners moeten die oorlogsposters namelijk gewoon in de toch wel advanced catalogus taggen.

De tool waar ik het nieuwsgierigst naar was, voor het maken van transcripties, is helaas nog niet af. Maar je kunt al wel wat uitleg en screenshots bekijken. Straks valt er te kiezen uit zo'n 300 te transcriberen documenten waarbij je kunt selecteren op niveau, jaar of bewerkingsstatus. Je werkt met z'n allen samen aan dezelfde transcriptie van een document en kunt daar ook over discussiëren. De wiki way dus. Tot deze module af is, later in 2012, kun je natuurlijk als smaakmakertje nog altijd meehelpen met het transcriberen van NARA-documenten op Wikisource.

De andere knoppen op het dashboard laten weinig nieuws zien of zijn nog niet goed uitgewerkt, dus ik laat ze verder maar buiten beschouwing. Wat dat aangaat doet het dashboard niets meer of minder dan het handig bundelen van alle participatiemogelijkheden die NARA biedt. Maar die bundeling alleen al geeft veel meerwaarde, in mijn ogen.

Kortom
Vooral sterk vind ik dat het dashboard in korte en krachtige taal duidelijk maakt hoe je door een tag te plaatsen, een transcriptie te maken of wat dan ook te doen, meehelpt bij het (beter) toegankelijk maken van archieven. Ook vind ik sterk dat er via een soort spelniveau's keuzemogelijkheden zijn, zodat iedereen het gevoel krijgt direct een zinvolle bijdrage te kunnen leveren. Tot slot vind ik de afgebakende missions ook goed bedacht. Daardoor krijg je het idee dat je niet aan een mission impossible begint; het zijn overzichtelijke taken. Duidelijk en laagdrempelig dus, met steeds een duidelijke call to action om aan nobele zaak bij te dragen.

Gerelateerd
Faciliteren van burger-archivarissen (of wie dan ook) (3 juli 2010)
Zo kan het ook: Wikipedian In Residence (6 juni 2011)
Het semantisch web tag voor tag (9 juli 2011)
- Geven en krijgen (5 september 2011)

Foto: Bundle of Bunnies

12 november 2011

Wat gebeurt er? Laat het zien!


Een van de belangrijkste dingen die sites als Twitter en Facebook ons leren, is dat gebruikers bij hun bezoek aan de site vooral geïnteresseerd zijn in het hier en nu. Wat gebeurt er nu? Wat is er gebeurd sinds mijn laatste bezoek? Welke berichten zijn nieuw? Welke foto's zijn er gepost? Welke reacties zijn er gegeven? Enzovoort.

Als je dus een gebruikerscommunity wilt creëren rond je archiefwebsite, is het van het grootste belang dat je die community goed faciliteert wat betreft de activiteit in die community. Maak die activiteit zichtbaar! Pakweg 99% van onze homepages en vervolgpagina's slaagt daar bedroevend genoeg niet in. De enige actuele content bestaat doorgaans uit nieuwskoppen, maar voor je community zijn die over het algemeen niet het interessantst.

Laatste reacties gevraagd
Amersfoort op de Kaart is zo'n mooie website. Een week geleden vroeg ik aan Henk (die sinds kort de redactie voert) of hij enig zicht had op de activiteit van gebruikers. Je kunt namelijk op punten op de kaart reageren, maar ik kwam nauwelijks iets tegen aan reacties. En als ik al iets tegenkwam, dan zag ik geen reactie van het archief.

Henk vertelde me dat er gewerkt werd aan een overzicht van laatste reacties en dat overzicht is er nu. Mooi werk! Dit overzicht is een goed begin. Je ziet nu in ieder geval de tien laatste reacties, maar kunt helaas niet verder scrollen. Beetje beperkt dus. En het overzicht zit ook nog wat verstopt in het menu. Bovendien kan ik het niet vanaf een afstandje bijhouden - ik moet echt zelf naar de site surfen om te zien of er nieuwe reacties zijn (en die zijn er misschien niet... of ze zijn niet meer actueel... of ik heb ze al gemist).

Tips
Mede naar aanleiding daarvan en vooral gebaseerd op mijn ervaring met het stimuleren van de gebruikersparticipatie rond de website van het BHIC, twee simpele tips:

  1. Zet op je website op de homepage of onder een duidelijke link of knop direct een overzicht waar je alle recente activiteit rond je website bundelt, zoals nieuw toegevoegde verhalen, laatste reacties, nieuwe forumberichten, toegevoegde foto's, gemaakte transcripties en zo meer. Het BHIC heeft een onvolmaakt, onvolledig en weinig sexy overzicht, maar het werkt als een speer.
  2. Stel je gebruikers in staat om ook op andere manieren die activiteit in de gaten te houden, bijvoorbeeld via een rss-feed en mailnotificaties. Niet alleen bij het volledige overzicht trouwens, maar zeker bij de items waar gebruikers al actief zijn geworden. Bijvoorbeeld een rss-feed op alle nieuwe reacties en mailnotificaties bij nieuwe reacties op een foto waarop een gebruiker al heeft gereageerd.

Deze twee tips maken de gebruikersactiviteit op je website niet alleen zichtbaar(der), ze stimuleren ook nieuwe activiteit. En wat dat stimuleren betreft, kan ik uiteindelijk maar één gouden tip geven: reageer!

Update
Een half uurtje na publicatie van deze blogpost reageerde @abcmedia via Twitter: "We hebben snel een RSS-link toegevoegd op bit.ly/sViJxE Je kunt ook wat verder terug scrollen nu. U blogt wij draaien ;-)" Super! Goede service!

23 augustus 2011

Vele, vele, VeleHanden.nl


De website VeleHanden.nl (waar binnenkort militieregisters en op termijn ook andere archiefbronnen geïndiceerd kunnen gaan worden) gaat in oktober live voor de crowd. De bouwers leggen er nu de laatste handjes aan, de testers zijn enthousiast bezig met indiceren en verder wordt er druk gescand. Een update.

Tijdens de testersbijeenkomst, gisteren gehouden in Amsterdam, verzuchtte Ellen Fleurbaay (projectleider) dat hun grootste zorg was, of er in oktober nog wel genoeg scans zouden zijn om te indiceren. Er wordt namelijk vreselijk hard geïndiceerd: de namen op zo'n 15.000 scans zijn door een groep van zo'n 150 testers al ingevoerd en gecontroleerd! Extra scans zijn al aangerukt.

Controle
De komende periode wordt de controlesoftware uitgebreid getest. Tijdens de controle worden verschillen in de dubbele invoer opgelost en worden extra punten toegekend bij een juiste invoer. 'Juist' wil in dit geval zeggen: de invoerder heeft z'n best gedaan. Met andere woorden: alleen bij complete onzin krijg je geen extra puntje.

Daar was wel even discussie over, aangezwengeld door @lottebelice. Die stelde voor om iedereen gewoon standaard extra punten toe te kennen - uit andere projecten blijkt immers dat er nauwelijks onzin wordt ingevoerd - en de controleurs eventuele onzin gewoon te laten rapporteren (zeg maar een soort "dit is niet ok" knopje). Dat straalt ook meer vertrouwen uit naar je crowd.

Wie overigens die controleurs worden, dat is nog niet bekend. Misschien personeel of vrijwilligers van het archief, misschien wel de actiefste leden onder de invoerders. Bij leesproblemen kun je trouwens ook tijdens het invoerproces al een specialist van het archief aanroepen. Daar is een knopje voor. De controletool ziet er verder prima uit - tijdens het testen zullen er nog wel verbeterpuntjes uitrollen.

Lijstjes en badges
Nieuw in de volgende release van de indiceersoftware (die vandaag online komt voor de testers) is, naast het al bestaande algemeen klassement, ook een lijstje met de top invoerders van de huidige en de vorige week. Zoals ik al eens eerder blogde, stimuleert dat de betrokkenheid van nieuwe invoerders. Dan hebben zij ook nog (of weer) een kansje. Daarnaast wordt aan medailles gedacht - zeg maar badges - en dat lijkt mij ook een goeie. Of lintjes, om in militaire sferen te blijven?

Er werd wel gedicussieerd over zin en onzin van deze en andere competitie-elementen. Een van de testers merkte op dat al die competitie mensen ook af kan schrikken, en zelfs demotiverend kan werken. De aanwezige spelelementen moeten naar mijn mening dan ook een balans houden tussen 'leuk voor de competitie, binnen de community' (zoals de lijstjes) en 'leuk voor jezelf' (zoals de badges). Laat iemand bijvoorbeeld van soldaat via luitenant en kolonel opklimmen tot maarschalk, na het bereiken van bepaalde aantallen geïndiceerde scans. Dan is er niet alleen een 'strijd' met anderen, maar ook met jezelf. Een hogere rang is een mooi doel om nog wat extra scans door te worstelen, ook al zou je sergeant in een leger van kolonels worden.

Kinderachtig
Verder gaat er nog getest worden met het laten kiezen van een plaats waarvan je scans wilt invoeren, ook al iets waarover ik al eerder blogde. Voordeel daarvan is dat je gebruik kunt maken van specifieke, lokale kennis. Nadeel is natuurlijk dat je jezelf afhankelijk maakt van een kleinere groep invoerders. Hoe dan ook fijn dat het uitgeprobeerd wordt!

Tot slot nog een opmerkelijk feitje dat uit de vragenlijst naar voren kwam, die veel testers hadden ingevuld: het filmpje op de homepage wordt kinderachtig van toon gevonden. Hmm... Waar hebben we dat eerder van gehoord?

En nog een observatie: wat streven niet alleen wij archivarissen, maar ook veel van onze vrijwilligers naar volledigheid en perfectie! En wat zouden we toch graag al het reeds gedane werk half overnieuw doen, wanneer we tussentijds de regels veranderen! Archivarissen klonen zichzelf in hun klanten. Een valkuil waar we voor moeten uitkijken...

Kortom
Zelf indiceren is mij niet gegeven - ik deed nog geen twintig scans in totaal - maar ik volg het project met grote belangstelling. Crowdsouring werkt als een speer en ik zou graag zien dat het BHIC met extra scans mee gaat doen. Misschien dat dit positieve voortgangsverslag daartoe een steentje bijdraagt.

Zie ook:

22 augustus 2011

Collectiecommunity's leren runnen met RunCoCo

British Soldiers on the Piave, 1918

Een van de betere crowdsourcingsprojecten die ik ken, en vaste gast in mijn presentaties over archieven en sociale media, is het project The Great War Archive - uit 2008 alweer - van de Oxford University:

The Great War Archive contains over 6,500 items contributed by the general public between March and June 2008. Every item originates from, or relates to, someone's experience of the First World War, either abroad or at home. Contributions were received via a special website and also through a series of open days at libraries and museums throughout the country.

Maar het allermooiste is, dat het project doorging nadat het was afgelopen:

Although the submission process ended in June, as an exit strategy, the project has used Flickr to allow further items to be contributed (though without the formal submission and metadata process) and we are currently assessing the potential for user tagging and comments.

Dus if you build it, they will scan! Gebaseerd op onder andere het succes van dit project, is vervolgens het project RunCoCo opgezet, Run a Community Collection Online:

Community Collection....where the general public or members of a particular community are invited to contribute to a project by uploading their own content or adding information to existing resources.

The RunCoCo Project (...) provided a series of training events for organisations interested in harnessing the power of the Internet to run their own Community Collection initiative. Although the project has now ended this web site continues to make available information, guidance, software and useful links for others wishing to RunCoCo.

Op de website vind je onder andere een rapport met handige tips, maar ook open source software voor je eigen project en talloze presentaties.

Het idee is ook geëxporteerd, bijvoorbeeld naar Duitsland, waar ze nu het Erster Weltkrieg in Alltagsdokumenten project hebben, op initiatief van Europeana. Daarover kun je onderstaande presentatie eens bekijken:



Foto: Flickr/Rob Langham

21 augustus 2011

Footnote wordt Fold3


Ik was een fan van Footnote. De vraag is of ik ook een fan van Fold3 wordt, maar ik denk van wel.

Footnote was een gebruiksvriendelijke site met vooral heel, heel, heel erg veel content: miljoenen archiefdocumenten, gescand in hoge resolutie en nagenoeg perfect toegankelijk gemaakt. In oktober 2010 werd Footnote opgekocht door Ancestry en dan weet je al dat veranderingen niet uit zullen blijven.

En die zijn ook gekomen: tussen al het drama op Pukkelpop door, werden mijn Netvibes en Twitter eergisteren ineens gevuld met berichten over de verandering van Footnote naar Fold3. De blogpost daarover riep vooral veel vragen en afkeuring op, een nieuwe blogpost geeft enkele antwoorden.

Maar
Fold3 zal zich uitsluitend richten op militaire bronnen (die in Footnote al populair waren) maar alle bestaande content blijft ook beschikbaar. Er wordt online veel geklaagd over de nieuwe naam en over niet kunnen inloggen. Dat verder niet iedereen meteen even goed uit de voeten kan met een nieuwe site, dat is niks nieuws, en er blijkt ook slecht gecommuniceerd over de veranderingen, getuige de vele verontwaardige reacties.

Los daarvan heb ik ook wel enkele inhoudelijke kanttekeningen bij de verandering:

Ten eerste de content: focus is altijd goed, maar het is jammer dat de verscheidenheid in bronnen verdwijnt. Ik ben wat dat betreft ook heel benieuwd hoe dit uitpakt voor de Amerikaanse National Archives, die toch een mooie deal hadden gesloten met Footnote. Het lijkt me dat die deal met het nieuwe beleid van Fold3 minder interessant wordt voor het archief (en haar gebruikers).

Ten tweede de gebruikers: naast de enorme hoeveelheid content, vind ik vooral de gebruikers een meerwaarde van en voor Footnote. Ze reageren en annoteren niet alleen, ze voegen ook eigen content toe. Upload je eigen schoenendoos, als het ware. Maar met de nieuwe focus van Fold3 op militaire bronnen wordt het veel minder aantrekkelijk om die site te gebruiken als persoonlijke, digitale schoenendoos.

Focus
Maar goed, over het eerste is vast nagedacht en gesproken, en aangaande het tweede heb ik in het verleden al eens mijn twijfels geuit. Blijft staan: focus is goed. Ik ben benieuwd hoe het verdergaat. En ben ook benieuwd naar jullie mening. Denk jij dat de verandering positief of negatief zal uitpakken?

Oh ja, en even het 20e archiefding aanpassen...

9 juli 2011

Het semantisch web tag voor tag #fmtc


Het toekennen van tags of labels is nog steeds de meest vrije, simpele en laagdrempelige manier voor de crowds om jouw toegangen inhoudelijk te verrijken. We zouden het allemaal veel vaker moeten gebruiken, maar goed, verder dan een stilgevallen pilot is het op het BHIC ook nog niet gekomen.

Gisteren las ik op NARAtions dat je als gebruiker van de catalogus van NARA, het Amerikaanse Nationaal Archief, nu ook tags kunt toevoegen aan documenten in de collectie. Mooi! Helaas nog wel alleen voor geregistreerde gebruikers en zelfs dan nog worden je tags eerst gescreend. In een reactie op de weblog heb ik naar de achtergrond van die keuze gevraagd, maar in de FAQ lichten ze die al gedeeltelijk toe: ze willen simpelweg geen anonieme user generated content, maar alleen tags waarvoor iemand zogezegd verantwoordelijk gehouden kan worden. Je account zal trouwens later tot een heus profiel worden uitgebreid, een beetje zoals ons Nationaal Archief gahetNA nu al heeft. Maar het blijft toch een leuke optie. Een voorbeeld van de nieuwe functionaliteit vind je bij deze brief uit 1861.

Nóg veel interessanter vond ik de eerste reactie op die blogpost, waarin gevraagd word of machine tags, zoals op Flickr, mogelijk zijn. Flickr, dat trouwens voor NARA de inspiratiebron vormde voor deze nieuwe mogelijkheid in hun catalogus.

Machine tags? Nooit van gehoord!

Ik ben niet zo'n held in dit soort technische dingen, maar bekijk bijvoorbeeld deze foto van zielige kinderen in Californië, gefotografeerd door Dorothea Lange. Onder de tags aan de rechterkant zie je een uitklaplijstje voor de machine tags, waaronder deze: dc:creator=http://nla.gov.au/nla.party-899601

Ziet er dus uit als metadata volgens een Dublin Core-schema, waarmee de maker van het object wordt beschreven, maar de machine tag werkt verder als een doodnormale tag in Flickr. Plak je echter de url uit de tag in de adresbalk van je browser, dan kom je uit bij een record in de database van de National Library of Australia over Dorothea Lange. En dat geeft ook meteen het nut aan van die machine tags boven normale tags: je weet nu wat de relatie is van Dorothea Lange tot de foto (namelijk ze heeft hem gemaakt) en je weet precies over welke Dorothea Lange het gaat (namelijk die van dat record in de personendatabase van de Australische nationale bieb).

Met machine tags maak je dus rijkere tags, tags met metadata zeg maar, waardoor je specifieker kunt zoeken omdat je tags meer betekenis krijgen. Inderdaad spin je door het maken van een machine tag dus een draadje van het semantisch web. Erg interessant! Al gaat het me nog een beetje boven de pet.

Het is goed om over de machine tag challenges te lezen. Ook foto's van ons gahetNA Nationaal Archief hebben trouwens al machine tags toegekend gekregen. Voor de liefhebbers onder ons van linked data!

Update 20 juli 2011
Inmiddels heeft Jill, de Social Media Manager van NARA, geantwoord op mijn vragen (zie de reacties). Tot nu toe hebben ze al 700 tags binnengehengeld. En naast het verwijderen van een aantal tags die duidelijk als test waren bedoeld, zijn er geen andere tags door de 'tagpolitie' tegengehouden.

Interessant is nog dat ze zegt misschien in de toekomst gebruik te willen maken van leden uit de community zelf om tags te monitoren. Daar zijn ze weer: citizen archivists

15 juni 2011

Geboren in Friesland in 1811


Dit jaar bestaat de Burgerlijke Stand precies 200 jaar en ook Tresoar doet wat duiten in het feestzakje. Op de website Fryslân 1811 staan die duiten overzichtelijk bij elkaar, waaronder het project Geboren in 1811. Bob Coret schreef daar al uitgebreid over en inderdaad, het project toont (behalve de naam alleen) sterke gelijkenis met het project Geboren in 1809 van de collega's in Tilburg. Alleen werden er in 1811 maarliefst 4151 Friezen geboren tegenover slechts 338 Tilburgers in 1809.

Belangrijke overeenkomst is dat beide projecten mikken op het verkrijgen van biografieën van alle borelingen. De manier waarop Regionaal Archief Tilburg en Tresoar dat doel proberen te bereiken is echter totaal verschillend.

Verschil
Bob is op zijn blog vooral enthousiast over het feit dat de Friezen iedereen de mogelijkheid geven om mee te werken aan de biografieën. De werkelijkheid is minder spannend: het gaat slechts om een reactiemogelijkheid bij enkele basisgegevens die uit de geboorteaktes zijn gehaald. Echt samenwerken zoals in een wiki is er dus niet bij. De huidige reacties (waarvan er trouwens al meer dan 500 zijn) beperken zich veelal tot losse feitjes, het betere kopieer- en plakwerk, pogingen tot leesbaar verhaal of zijn een enkele keer simpelweg leeg.

Ze komen in ieder geval (nog) niet in de buurt van de verhalen die Tresoar zelf al heeft toegevoegd (en die dus als voorbeeld mogen dienen voor wat ze uiteindelijk zitten te willen), zoals die over de voorouder van Foekje Dillema of die van Pieter Jelles Troelstra (in het Fries zelfs). Maar wat niet is, dat kan nog komen: voor een verhaal heb je allereerst natuurlijk goede bouwstenen nodig.

Het grootste verschil tussen beide manieren van werken is dat in Tilburg met een vaste club vrijwilligers werd gewerkt, die door middel van cursussen, uitstapjes en zo meer werd samengesmeed tot een echte community (zie het artikel in het Archievenblad daarover), terwijl in Friesland allereerst wordt gegokt op de crowds, om pas later tijdens een speciale Friezendag zoveel mogelijk van de deelnemers bij elkaar te krijgen. Omdat wordt uitgegaan van personen geboren in 1811 zullen daar vooral genealogen op af komen. Die hebben immers in hun stamboom al een mogelijke aansluiting gevonden met een of meerdere van de borelingen.

Overeenkomst
Een belangrijke overeenkomst dan: waar beide projecten géén gebruik van hebben gemaakt, is van de typische wikifunctionaliteit om met verschillende mensen aan dezelfde tekst te kunnen sleutelen. In Tilburg kreeg iedere deelnemer een bepaalde boreling toegewezen, in Friesland kun je slechts reacties achterlaten. Dat laatste is inmiddels ook in Tilburg het geval, sinds alle persoonsgegevens zijn overgeheveld naar de nieuwe Tilburg Wiki. Maar welke archiefdienst durft een keer die stap verder te maken?

Wat Friesland betreft: ik ben nieuwsgierig naar de verdere reacties. Hopelijk komen er gaandeweg leuke verhalen los bij al die borelingen!

13 juni 2011

Verslagreeks #kvan11 - Crowdsourcing: vele handen maken licht werk


Dit is de derde blogpost in een reeks posts over de KVAN-dagen 2011.

Eind juli 2010 blogde ik over het Amsterdamse crowdsourcingsproject rond militieregisters. Tijdens de KVAN-dagen gaven Annemarie Lavèn en Nelleke van Zeeland een sneak preview van de in ontwikkeling zijnde websites en de indiceringsapplicatie. Ik was daar nieuwsgierig naar, niet alleen omdat ik een warme belangstelling heb voor crowdsourcing, maar ook omdat het BHIC participeert in het project.

Hieronder een verslag van deze demonstratiepresentatie, met als voorschotje op de testfase tussendoor wat eigen ideeën en tips.

Goed gejat
Ter voorbereiding op het project werden allereerst verschillende bestaande crowdsourcingsprojecten bekeken. Als meest leerzame werden genoemd: FamilySearch.org (548 miljoen records geïndiceerd), Ancestry.com (6 miljard records geïndiceerd) en Australian Newspapers (een succesvol ocr-correctieproject, dat uitgebreid werd geëvalueerd). De eerste twee hebben vooral als nadeel dat de indiceringssoftware gedownload moet worden. Even tijdens je lunchpauze wat aktes indiceren is er dus niet bij. In het derde project was de kwaliteit van scans en viewer minder goed, maar valt er veel te leren van het doen groeien van een actieve vrijwilligerscommunity.

Uiteindelijk werden een aantal lessen getrokken uit de buitenlandse voorbeelden: de website en software moeten gebruiksvriendelijk en snel zijn, voorzien van een duidelijke uitleg (bijvoorbeeld door een instructiefilmpje of een demo), er moeten veel mensen tegelijkertijd mee kunnen werken, het resultaat van hun werk moet snel zichtbaar zijn en tot slot moet daarvoor een beloning mogelijk zijn.

Inmiddels wordt er druk gescand en gebouwd. De website Militieregisters.nl (niet de huidige weblog, maar de nieuwe publiekswebsite met zoekmachine en webwinkel) wordt gebouwd door Toutatis (bekend van de Amsterdamse archiefbank) en de website VeleHanden.nl (de indiceringswebsite, die al wel achter de schermen is te bekijken) wordt gebouwd door Pictura. In ieder geval die laatste bouwt voor eigen risico, maar naderhand mag Pictura de indiceringswebsite exploiteren richting vervolgprojecten. Archieven betalen natuurlijk voor scanning van hun bronnen en vervolgens voor de hosting daarvan en voor het gebruik van de (indicerings)website. Als tegenprestatie krijgen ze een database retour.

VeleHanden.nl
De indiceringswebsite werd live gedemonstreerd. Een aantal kenmerken:

  • Er is een grappig promotiefilmpje gemaakt, dat wel een heel simpele voorstelling van zaken geeft, maar ongetwijfeld zal het een aantal mensen enthousiast maken voor dit project.
  • Er zijn indiceeroefeningen beschikbaar, zodat je weet waar je aan begint. Ook is er een uitleg in de vorm van een stripverhaal van een paar plaatjes.
  • Er is zowel op het niveau van een project (bijvoorbeeld het indiceren van militieregisters) als op het niveau van de hele website een voortgangsmeter. Hoeveel staat er online? Hoeveel is er al gedaan? Hoeveel mensen helpen er mee? Dat soort weetjes.
  • Er is per project duidelijke uitleg over wat voor soort informatie de indicering oplevert en hoeveel punten (als beloning) je ermee kunt verdienen.
  • Er is een duidelijke knop om jezelf aan te melden.
  • Er is een lijstje met de vijf actiefste indiceerders. Over zo'n zelfde soort lijstje schreef ik al eerder, met tips om ze voor iedereen interessant te houden.
  • Er is per project een forum waar vrijwilligers elkaar kunnen helpen. Ook de projectmedewerkers van het stadsarchief zijn daar actief, maar de bedoeling is eigenlijk dat uit de community een soort super users opstaan, die op de meeste vragen gaan antwoorden. Ben benieuwd. Een forumcommunity ontstaat niet zomaar, weten we op het BHIC. Tip: notificatiemogelijkheden zijn van belang. Bijvoorbeeld via rss en email.
  • Als deelnemer krijg je een profielpagina die veel lijkt op die van een sociaal netwerk, met een fotootje en wat informatie over jezelf. Anoniem indiceren is dus niet mogelijk. Inloggen kan trouwens met een eigen account, maar ook via Google, Yahoo!, Hyves, Facebook, Twitter en OpenID.
  • Op je profielpagina zie je aan welke projecten je meewerkt, je ziet je statistieken en je kunt direct aan de slag. Niet onbelangrijk als motivatie: je ziet ook het aantal punten wat je al hebt vergaard.

Aan de slag!
Het indiceren zelf werkt prima. Militieregisters hebben een vaste indeling en een vast aantal inschrijvingen per blad. Per scan indiceer je dus een zeker aantal records en de software koppelt deze records automatisch aan de juiste inschrijving in het register. Binnen een week is je ingevoerde record ook via Militieregisters.nl doorzoekbaar en te bestellen.

Na het invoeren van een record krijg je direct feedback (het record wordt geel van kleur en wordt bovendien letterlijk afgevinkt) en je gaat vanzelf naar het volgende record. Punten worden verkregen door het invoeren van een record, en extra punten als bij controle blijkt dat de invoer ook juist was. Tenminste, de controlerende partij (ook een vrijwilliger) bepaalt of je de extra punten krijgt. Als feedback moest ik zelf in plaats van aan het vinkje meteen denken aan een smiley. Het effect van een smiley werd bij Monk al direct zichtbaar: mensen maken jacht op smiley's. Overigens ook aan wegen met van die borden die je snelheid meten werken smiley's prima. Vast beter dan een vinkje. :-)

Punten en andere prikkels
Het ging dus regelmatig over stimuleren tot goed en veel indiceren. En het ging daarbij vooral over het scoren van punten. In Amsterdam is namelijk veel nagedacht over het beloningssysteem achter VeleHanden.nl en indiceren voor een materiële beloning wordt gezien als beste prikkel. Uiteindelijk wordt er trouwens zowel immaterieel als materieel beloond.

Bij immateriële beloningen moet je vooral denken aan indiceren voor de eer, een notering in een of ander lijstje, de wetenschap dat je werk in het maatschappelijk belang is en het plezier en de contacten die je eraan overhoudt.

Bij materiële beloningen moet je denken aan de punten, die vervolgens ingewisseld kunnen worden voor gratis scans in de webwinkel. Maar wie weet ook voor een kopje koffie bij studiezaalbezoek of een rondleiding. Er wordt verder gedacht aan extra punten als bonus (bijvoorbeeld als een bepaald aantal records is geïndiceerd) of als winst in een loterij.

Over beloningen bij crowdsourcing is al veel gezegd en geschreven. Er is zelfs wetenschappelijk onderzoek naar gedaan. In Amsterdam wordt dus vooral ingezet op punten voor gratis scans. Dat zal prima werken als de scans (nog) niet elders beschikbaar zijn of komen, maar daarna verliezen punten letterlijk hun waarde. Ook de collega's van Bergen op Zoom doen bijvoorbeeld mee en zij hebben bedongen dat ze de scans van hun militieregisters, die nu al gratis via de eigen website worden aangeboden, daar ook gedurende het project mogen laten staan. Zonder index weliswaar, maar toch. De onderzoeker die wat extra moeite wil doen, haalt daar zijn scans dus voor niks. Als iedereen het straks zo doet, is indiceren voor de punten niet nodig. Je moet dan op zoek naar andere stimulansen.

Zelf word ik bijvoorbeeld vooral geprikkeld door spelelementen. Een goed voorbeeld daarvan vind ik Old Weather, waar je begint als kadet en door het indiceren van scheepslogs kunt klimmen in rang. Ook blinkt dat project uit in de vrolijke en visuele manier waarop de op zich saaie bron tot leven wordt gewekt.

Invloed op wat je indiceert - het een zal je meer stimuleren dan het ander - is er eigenlijk nog niet, maar ze willen er wel mee gaan experimenteren. Voorbeeldje: bevordert het de productiviteit als je 'steden' tegen elkaar laat indiceren? Zijn mensen eerder geneigd te indiceren als ze zelf het register (de plaats) kunnen kiezen? Goed dat ze daarmee experimenteren en de resultaten daarvan zullen ongetwijfeld worden gedeeld.

Kortom
Vanaf 20 juni gaat de software uitgebreid getest worden en vanaf oktober gaan beide websites live voor het grote publiek. Op dit moment zijn er (bij potentiële deelnemers) nog vooral veel vragen en op bepaalde punten is er nog wat onduidelijkheid. Maar dat dit een project met toekomst is, dat is duidelijk. Laten we hopen dat het een groot succes wordt en dat het daarna wordt voorgezet voor andere bronnen. Daar worden archieven toegankelijker van en dat is in ieders belang.

Eerdere blogposts in deze verslagreeks:
- 'Het landschap staat in mij geschreven': landschapsverbeelding in archieven (Bert Looper)
- Gevaarlijk gebied, door geen mens te betreden (Kester Freriks)

4 februari 2011

Website getest: Oneindig Noord-Holland


Een week of wat terug werd de website Oneindig Noord-Holland (ONH) gelanceerd. Een website - platform kan ik beter zeggen - zo bomvol functionaliteit en zo breed van opzet, dat het moeilijk zal worden daar een adequate blogpost over te schrijven. Maar ik ga een poging wagen.

Eerst maar eens de uitleg van de website over de website:

Oneindig Noord-Holland is een alsmaar groeiend platform van verhalen over het rijke verleden van Noord-Holland. Geschreven verhalen, maar ook beelden, video's en geluidsfragmenten. Oneindig Noord-Holland verbindt verhalen achter gebeurtenissen in de geschiedenis, mensen, plekken en monumenten, met collecties van musea, archieven en culturele instellingen.

Het idee van ONH lijkt inderdaad oneindig, want houdt niet op bij een website alleen:

Ook in de werkelijke wereld is Oneindig Noord-Holland op veel manieren aanwezig. Op straat bij monumenten, in het landschap via routes en informatieborden, bij exposities en culturele evenementen, in kranten en op radio en TV, via applicaties op je mobieltje; noem maar op!

Kortom: je zult ONH tot vervelens toe tegenkomen! ;-) Maar serieus, dit concept klinkt in ieder geval erg sterk en als je bedenkt dat er maarliefst bijna dertig partners samenwerken in ONH, dan zul je begrijpen wat voor moois het platform te bieden heeft.

Gelukkig is aanbieden niet het enige wat ONH doet, want er is volop ruimte voor de gebruiker:

Én je kunt de wereld van Oneindig Noord-Holland oneindig vergroten. Door zelf verhalen, beelden, video's en geluidsfragmenten toe te voegen. Of door te reageren op de toevoegingen van anderen. Zo wordt Oneindig Noord-Holland steeds rijker en interessanter.

Tot zover de theorie van de website zelf. We gaan de praktijk testen!

Bij binnenkomst
De homepage biedt me een sfeervolle foto van het Noord-Hollandse landschap op de achtergrond, maar verder vind ik hem saai en rommelig. Dat laatste vooral door het gebruik van de verschillende lettertypes, een vormgeving met allerlei kaders - het grootste is zelfs sfeerdodend zwart - en als uitsmijter een provinciekaart op postzegelformaat. Dat kaartje blijkt klikbaar en het geeft vervolgens een geografische ingang op de inhoud van de site. Geen idee waarom het zo klein is, want het zwemt in marge.

Ik kan zoeken of klikken door de inhoud en als volleerd archivaris begin ik natuurlijk met zoeken. Meest in het oog springend op het scherm is een groot zwart vlak, met rechtsboven in de hoek een zoekveld. Helaas, het blijkt de zoekfunctie voor zoeken op omgeving. Da's niet wat ik wilde en zeker niet wat ik verwachtte.

Dus vervolg ik mijn weg en pas nadat ik verschillende keren tot de homepage ben teruggeraakt, valt het me op dat linksboven in het scherm een algemeen zoekveld staat. Mijn eerste oogopslag en beoordeling van dat kader deed me denken dat het een soort titelbanner was. Maar niet dus. Ik ga zoeken...

Zoekerdeklik
De website bevat al ongelofelijk veel content (verhalen, afbeeldingen, video's, geluid en informatie over objecten, personen en gebeurtenissen) en het is dus fijn dat je zoekresultaten langs verschillende wegen kunt verfijnen: thema's, tijdvakken, locatie enzovoort.

Helemaal bovenaan staat de verfijningsmogelijkheid 'partner', wat me voor een bezoeker nou net de minst relevante lijkt. Misschien relevant voor de instellingen zelf, evenals het feit dat bij iedere treffer in de resultatenlijst de naam van de partner wordt genoemd die het item heeft aangeleverd. Relevante informatie, maar zeker niet op dit moment. Waarom moeten die partners zo veel en vroeg in beeld?

Wel erg leuk is om naast de gebruikelijke lijst- en tegelweergave van resultaten, ook een kaartweergave aan te bieden.

De content zelf is natuurlijk mooi, vooral het beeldmateriaal. Helaas zijn de meeste verhalen nogal onpersoonlijk en lang. Ze spreken mij in ieder geval niet erg aan, maar ik kom dan ook niet uit de streek. Alle verhalen zijn voorzien van de gebruikelijke deelknopjes voor sociale media en - heel prettig - van TinyUrl's. Verder wordt doorgelinkt naar allerlei gerelateerde content, zodat je nooit uitgeklikt raakt. Jammer is dat je foto's niet kunt embedden op je eigen website of blog.

Reageren
Natuurlijk kun je ook reageren en daarmee gaat ONH zwáár de mist in. Willekeurig het eerste verhaal wat ik aanklik - namelijk het eerste verhaal wat op de homepage wordt getoond - betreft een filmpje over Mina van Marken en ene Marijke heeft op 14 januari een probleem met het afspelen van dat filmpje... en nog steeds is er geen reactie van de redactie.

Nog veel merkwaardiger is het feit dat bij de reactie van Marijke staat te lezen dat de redactie Marijke's reactie blijkbaar op 17 januari nog heeft gewijzigd. Ik begrijp er niks van, maar heb toch maar zelf gereageerd. Dit soort negeeracties doet me gewoon pijn. (Zojuist bleek trouwens dat er wéér iemand had gereageerd. Dat had ik eerder gemist, want een notificatiemogelijkheid bij verdere activiteit ontbreekt helaas.)

Profiel
Genoeg gelezen en gezien, ik ga zelf wat toevoegen. ONH biedt daarvoor de mogelijkheid om een profiel aan te maken. Je kunt jezelf zelfs via bijvoorbeeld Google of Facebook aanmelden (alhoewel je vervolgens toch nog een heel profiel moet aanmaken, maar goed). Vervolgens kun je zelf content toevoegen of bestaande content selecteren en toevoegen aan een vitrine (een mogelijkheid die ik overigens niet nader heb bekeken).

Mis gaat het als ik me weer opnieuw wil aanmelden. Mijn eerste aanmelding liep via Google, maar bij iedere volgende keer word ik toch weer gevraagd een nieuw profiel aan te maken. Dat ben ik natuurlijk niet van plan - één onbereikbaar profiel lijkt me meer dan voldoende - en sowieso krijg ik de melding dat mijn gebruikersnaam al bestaat. Natuurlijk, want die maakte ik al eerder aan! Nou goed, balen dus, en later nog maar eens proberen te herstellen.

Gelukkig heb ik die eerste keer toch wat kunnen oefenen.

Participeren
Heel erg sterk aan ONH vind ik de begeleiding die je krijgt als je nieuwe content gaat toevoegen. Stap voor stap word je gegidst en uitgelegd waar je welk veldje kunt of moet invullen en hoe je eigen foto's kunt uploaden. Groot nadeel is dat er wel erg veel veldjes zijn en redelijk wat stappen. Een titel, eventueel ondertitel, bron, zo exact mogelijke datum, locatie of regio, sleutelwoorden... Alsof je een archivaris bent.

Ook het maken van een verhaaltje is nog niet makkelijk. Je bouwt je verhaal op uit allerlei blokken met tekst of afbeeldingen en die blokken kun je onderling verschuiven. Dat lijkt flexibel, maar is het niet, want makkelijk een zin van hot naar her verplaatsen en een plaatje even een alinea opschuiven is er niet bij.

Op dit vlak vergt ONH dus behoorlijk wat van het publiek. Blijft staan dat ik in beginsel erg gecharmeerd blijf van die stapsgewijze aanpak.

Ik vraag me af hoe het actieve gebruik van deze participatiemogelijkheid is. Al zoekende door de site kom ik nog weinig gebruikerscontent tegen, maar misschien zoek ik verkeerd. Erg jammer vind ik daarbij dat de homepage maar niet lijkt te veranderen. Ik blijf dezelfde verhalen zien, die ook nog eens in een schijnbaar willekeurige volgorde staan opgesteld. Wat zijn de nieuwste verhalen? Wat hebben andere gebruikers toegevoegd? Welke reacties zijn recentelijk binnengekomen? Alleen een rss-feed geeft iets daarvan prijs, maar die zit helemaal onderaan in de hoek verstopt.

Misschien wordt nieuwe content trouwens niet in eerste instantie bij de individuele bezoeker gezocht, maar wordt gemikt op de inzet van zogenoemde regiocorrespondenten. Die term valt een keer of twee, maar verder vind ik daar geen informatie over.

Op pad
Nou goed, genoeg over de website. Buiten de website kun je je weg namelijk vervolgen, bijvoorbeeld via QR-codes. Daar worden speciale routes voor ontwikkeld (en hopelijk wordt ook gebruik gemaakt van al bestaande routes), zodat je via je mobieltje onderweg informatie kunt opvragen over zaken die je passeert. Verder om begrijpelijke redenen niet getest. (Wat me natuurlijk wél weer opviel, was dat op de reactie op de pagina met uitleg wéér geen reactie van de redactie is gekomen!)

Ook erg leuk lijkt me de applicatie in Layar, waarbij oud en nieuw worden verenigd in één beeld. Mensen zonder smartphone kunnen trouwens ook informatie via sms ontvangen. Goed bedacht.

Goed bedacht, dus?
Daarmee wil ik ook eindigen, met die woorden: goed bedacht. Want eigenlijk geldt dat voor de hele website: goed bedacht. Maar in mijn ogen op veel punten slecht uitgevoerd.

In een blogpost op Erfgoed 2.0 wordt nader ingegaan op enkele achtergronden van het platform. Zoals we van Theo gewend zijn, zette hij in zijn advies voor ONH vooral in op de website als ontmoetingsplek, voor conversaties en zo min mogelijk voor zenden. Ik moet helaas constateren dat dit zeker niet is gelukt (of je moet toevallig tijdens het fietsen langs QR-codes met een andere fietser aan de praat raken).

Geconverseerd wordt er waarschijnlijk vooral door de provincie (de initiatiefnemer) en de vele samenwerkingspartners, maar niet met de gebruikers. In hoeverre ingegaan wordt op de vraag naar het zelf vertellen van verhalen en uploaden van foto's, dat weet ik niet, maar vooralsnog blijft de mogelijkheid tot conversatie beperkt tot het kunnen reageren op content. En die reacties worden simpelweg niet beantwoord.

Eind goed
De website zelf zit enorm degelijk in elkaar, maar dat werkt niet altijd uitnodigend. Toch is het zeker niet allemaal kommer en kwel, want de site bevat ook zeer veel goede elementen. Als absolute favoriet geldt voor mij het stapsgewijs helpen bij het vertellen van je eigen verhaal. Maar ook de combinatie met QR-routes door de provincie lijkt me in al z'n eenvoud doeltreffend en waardevol. Dat zou in Brabant zeker niet misstaan, als uitbreiding op het bestaande knooppuntensysteem en een website als Thuis in Brabant.

In Noord-Holland is in ieder geval nog werk te doen.

25 november 2010

Archiefontsluiting door nerd-sourcing


Ziek zijn heeft zo z'n voordelen: vandaag zag ik kans om door de scriptie Ontsluiting van series. Bijdragen aan digitale toegankelijkheid door archiefgebruikers van Erik Visscher te lezen:

Archivistische beschrijvingen van series als "ingekomen en minuten van uitgaande stukken" zeggen weinig over de inhoud van de documenten. Archivarissen kunnen echter niet alle series in archieven inhoudelijk ontsluiten. In deze scriptie staat de vraag centraal hoe gebruikers van archieven via internet kunnen bijdragen aan verbeterde toegankelijkheid van series met web 2.0-toepassingen. Het klassieke herkomstbeginsel is hierbij van belang. In de scriptie komen literatuuronderzoek, bestudering van praktijkvoorbeelden en experimenten aan bod.

Op een lekker vlotgeschreven manier behandelt Erik hoe archivarissen van in den beginne ("De Handleiding") tot nu hebben aangekeken tegen en zijn omgegaan met het toegankelijk maken van series archiefdocumenten. De inzet daarbij van gebruikers is erg vanzelfsprekend. Vrijwilligers zijn immers al van vroeger uit kind aan huis bij archivarissen en in een modern jasje gestoken noemen we dat tegenwoordig crowdsourcing. Vreemd dus dat er blijkbaar maar zo weinig literatuur over voorhanden is:

In de 'leeslijst' is (...) nauwelijks literatuur opgenomen over het benutten van bijdragen van archiefgebruikers, web 2.0 of niet. Het is echter niet nieuw dat archiefgebruikers kennis hebben. Archivarissen hadden al gedurende tientallen jaren kunnen nadenken hoe deze kennis zou kunnen bijdragen aan verbeterde toegankelijkheid, maar het is veelzeggend dat ze dit weinig hebben gedaan. Het duidt op een van oudsher geringe waardering door archivarissen voor bijdragen van gebruikers. (...) Onder invloed van web 2.0 staan gebruikersbijdragen nu wel, of althans: meer, in de belangstelling. (blz 30)

Nou goed, dat er geen teksten over gebruikersparticipatie in die 'leeslijst' (bedoeld wordt de zogezegde canon voor het archiefvak) te vinden zijn is niet goed, maar dat er helemaal geen teksten over te vinden zouden zijn, dat weet ik niet. En anders moeten we daar eens over na gaan denken. Ik heb de laatste tijd namelijk steeds vaker het gevoel dat dezelfde bronnen steeds herkauwd worden, terwijl andere bronnen steeds links blijven liggen. Dat laatste betreft dan vooral de bronnen die exclusief online voorhanden zijn, zoals weblogs. Punt van zorg en aandacht.

Terug naar de scriptie.

De weg die Erik zoekt is er, geïnspireerd door het project Polar Bear Expedition Digital Collections, wel eentje waarin de autoriteit van de archivaris niet verloren mag gaan. Talloze voorbeelden passeren de revue, maar eigenlijk zitten er slechts een paar aansprekende, succesvolle projecten tussen. En de vraag is dan ook meteen: waarom krijgen die zo weinig navolging?

Als voorbeeld noemt Erik de Virtuele Studiezaal van het Haags Gemeentearchief, die toch alweer een tijdje online staat en waarin iedere voorbijganger kan meehelpen met het indiceren van aktes van de burgerlijke stand. Het werkt allemaal wat lastig in Den Haag, maar het idee erachter verdient zeker navolging - zou willen dat we dit bij het BHIC deden!

Misschien speelt hier, net als bij de literatuur, mee dat onbekend ook onbemind maakt. Wederom iets om over na te denken... Een soort lijstje op Archief 2.0 of in de ArchiefWiki met goede literatuurverwijzingen en voorbeeldprojecten?

Terug weer naar de scriptie.

Het allerleukste is namelijk wanneer Erik zelf gaat experimenteren. Hij maakte een weblog waarop hij dag- en nachtrapporten van de Schiedamse politie publiceerde en gebruikte ook andere toepassingen, zoals Google Maps om locaties aan te duiden die in de rapporten voorkomen, of Delicious om te taggen. Een klein groepje gebruikers en archivarissen kreeg enkele opdrachten te verwerken bij deze rapporten, bijvoorbeeld om te beschrijven welke personen daarin voorkomen.

De experimenten hebben een hoog hobbykamergehalte en voor zover Erik er al conclusies aan kan verbinden is de vraag hoe waardevol deze zijn. Niet belangrijk voor nu. Ik kreeg in ieder geval een vrolijk gevoel bij het doorlezen van zijn verhaal over het opzetten van de experimenten. Vooral werd ik getriggerd door gebruiker 'Goof', die door Erik slechts terloops wordt genoemd. Goof heeft namelijk online wel talloze politierapporten zitten transcriberen door reacties op blogposts achter te laten. Erik had zijn testpersonen juist expliciet gevraagd niet de blog te gebruiken (want dan zouden ze kunnen 'afkijken' van elkaar) en weet ook niet wie er achter de naam 'Goof' schuilgaat is. Misschien is het niet eens een van de testpersonen.

In ieder geval doet Goof me terugdenken aan Ben Brumfield, die reageerde op mijn bespreking van het crowdsourcingsproject Transcribe Bentham en stelde:

what does it mean to crowdsource from a small number of active users? This is something that was discussed at "What can the vulgus do? Crowd-sourcing for medievalists", in which "magistra" differentiated between crowd-sourcing by "mass volunteers" and "nerd-sourcing". As I wrote there, I'm convinced that nerd-sourcing works: over a thousand pages of the Julia Brumfield Diaries were transcribed by a single volunteer recruited from a very limited pool of potential volunteers. The challenge for the Transcribe Bentham project will be in finding those motivated nerds -- essentially a matter of community research and targeted marketing.

Alwéér die nerd dus! Vooral opmerkelijk omdat zo'n zelfde nerd voor Erik reden was om de politierapporten als onderwerp van zijn experimenten te nemen:

In de studiezaal van het Gemeenearchief Schiedam is regelmatig een archiefgebruiker te vinden die nauwgezet de dag- en nachtrapporten van de politie onderzoekt. Deze persoon is met name op zoek naar personen die op bepaalde adressen woonden. In de archivistische beschrijving in de toegang is over hun namen of het adres niets terug te vinden. Juist daarom kan het werk van de onderzoeker vanuit het oogpunt van de ontsluiting interessant zijn. (blz. 31)

Wie kent er niet dergelijke studiezaalbezoekers? Met de tegenwoordige aandacht voor crowdsourcing vergeten we bijna dat andere goud wat vaak al binnen handbereik is: nerd-sourcing dus! Zo doen we als BHIC wel mee aan het Amsterdamse crowdsourcingsproject rond militieregisters, maar wil het daarnaast niet echt vlotten met het verwerken van de talloze digitale gegevens (indexen, regesten en transcripties) die al gewoon door onze bestaande studiezaalbezoekers zijn en nog steeds worden gemaakt. Massa's schepenprotocollen en notariële aktes zijn al digitaal ontsloten op namen, plaatsen, onderwerpen en data, en aan ons afgegeven, maar staan nog altijd niet online. En dan heb ik het nog niet eens over al het materiaal wat we wel aangeboden krijgen, maar simpelweg niet (meer) aannemen, omdat we er zogezegd geen raad mee weten.

Waar zijn we soms toch mee bezig...?

Gelukkig had ik dat laatste al op m'n lijstje staan voor als ik weer beter ben. Over beter worden gesproken... Misschien de laptop eens ontkoppelen?!