30 april 2013

Itinera Nova and its Volunteer Program


De komende blogs doen verslag van het colloquium "Tools, People and History" dat op 25 en 26 april plaatsvond in Leuven. Aanleiding was het project Itinera Nova van het Stadsarchief Leuven waarin het archief van de Leuvense schepenbank digitaal toegankelijk gemaakt wordt.

Claire Dejaeger
Claire Dejaeger is een van de 35 vrijwilligers die meewerken binnen het project Itinera Nova. Hun leeftijd varieert van 20 tot 80 jaar, hun groep bestaat uit 24 mannen en 11 vrouwen, hun achtergrond is divers. Gezien de aard van het werk - transcriberen van schepenakten - kun je je voorstellen dat de genoten opleiding hoog is.

Net als haar collega-vrijwilligers is Claire trots en dankbaar dat ze mee kan werken binnen Itinera Nova. Het werk geeft hen een zinvolle, uitdagende tijdsbesteding, ze hebben het idee maatschappelijk nuttig bezig te zijn en als groep vormen ze inmiddels een hecht gezelschap. Hun interesse in Middeleeuwse geschiedenis en de stad Leuven komt binnen het project goed tot hun recht, en de meesten is nauwkeurigheid en zelfs perfectionisme niet vreemd.

Het project wordt nogal eens als crowdsourcingsproject aangemerkt. Het hangt er natuurlijk vanaf hoe je 'crowdsourcing' definieert, maar als je nog eens goed kijkt, is Itinera Nova eerder georganiseerd als traditioneel vrijwilligersproject, waarin echter wel goed gebruik wordt gemaakt van een digitale transcriptietool. Crowdsourcing of niet, de vrijwilligers vormen een enthousiaste, actieve en loyale community.

Bestond het vrijwilligerswerk in eerste instantie uit transcriberen, inmiddels worden ook andere taken door vrijwilligers uitgevoerd: registers voorbereiden (materieel verzorgen, beschrijven), scannen, scans bewerken (watermerk toevoegen, afgeleide afbeeldingen maken) en natuurlijk transcriberen en annoteren.

De vrijwilligers komen regelmatig bij elkaar tijdens 'meet-INs', er worden trainingen (check ook deze nieuwe online cursus 15e-eeuwse paleografie) en lezingen georganiseerd (bijvoorbeeld over de historische context bij beschreven aktes), een jaarlijks uitstapje, een nieuwsbrief, online (Ning-)community en er is veel begeleiding en feedback vanuit de archiefmedewerkers. Kortom, er wordt alles aan gedaan om de vrijwilligers hun werk zo goed en prettig mogelijk te laten doen, op een manier dat ze er zelf ook nog veel voldoening aan overhouden. Er is zeker een fulltime job gemoeid met de vrijwilligersbegeleiding.

Volgens Claire een win-win situatie voor het archief, de vrijwilligers en de maatschappij. Van TEI wisten de vrijwilligers niets, maar ze waren blij met alle lof die het project die dag al toegezwaaid had gekregen. En terecht.

Kortom
Je kunt niet genoeg over de ervaringen van vrijwilligers horen. En leren over wat hen motiveert en gemotiveerd houdt. Het Stadsarchief Leuven mag trots zijn op hun vrijwilligerscommunity. En omgekeerd.

Gerelateerde verslagen
- Ben Brumfield, Itinera Nova in the world(s) of crowdsourcing and TEI
- André Streicher, The visual Annotation Tool in Itinera Nova
- Prof. Dr. Manfred Thaller, Development of the database, the website and the online transcription platform of Itinera Nova

Foto: scanoperator aan het werk; ze zoeken nog vrijwilligers (bron: Stadsarchief Leuven)

Itinera Nova in the world(s) of crowdsourcing and TEI

De komende blogs doen verslag van het colloquium "Tools, People and History" dat op 25 en 26 april plaatsvond in Leuven. Aanleiding was het project Itinera Nova van het Stadsarchief Leuven waarin het archief van de Leuvense schepenbank digitaal toegankelijk gemaakt wordt.

Ben Brumfield
Ben Brumfield heeft van crowdsourcing zijn specialisme gemaakt, volgt op zijn weblog alle initiatieven en relevante software en is betrokken bij de ontwikkeling van diverse platformen. Vanuit Amerika was hij daarom ingevlogen om Itinera Nova in internationaal perspectief te plaatsen.

Milieu als motor
Vanaf de jaren '90 ontstonden verschillende offline initiatieven om in eerste instantie vooral genealogische bronnen op een tabelarische manier te ontsluiten. Pas vanaf 2005 zijn de online tools in opkomst. Te denken valt op genealogisch gebied aan het succesvolle Family Search Indexing. Maar ook documenten zonder vaste structuur komen vanaf dan in de belangstelling, zoals Bens eigen FromThePage, waarin onder meer dagboeken worden ontsloten.

Vooral het milieu en klimaatverandering blijken een motor achter crowdsourcingsinitiatieven te zijn, met als absolute topper Old Weather (waarover ik eerder blogde), maar denk ook aan het meer recente Notes from Nature (waarover ik eveneens eerder blogde). Van vandaag de dag hebben we immers talloze data over het klimaat direct beschikbaar. Maar om een ontwikkeling in tijd te zien (en het klimaat is per definitie iets wat op de langere termijn betrekking heeft) moeten we onze toevlucht nemen tot oude, handgeschreven bronnen, zoals scheepslogboeken. Die dan nog wel moeten worden getranscribeerd dan wel geïndiceerd natuurlijk.

Macht en motivatie
Al vanaf het begin van crowdsourcing speelt de spanning tussen vrijwillige en professionele transcribeerders, en parallel daaraan de spanning tussen enerzijds eenvoudige tools en anderzijds krachtige maar daardoor ook complexe tools. Liever het gemakkelijk in gebruik maken van krachtige tools.

De vrees is namelijk altijd geweest wat er gebeurt als je vrijwilligers ('amateurs') loslaat op het transcriberen volgens professionele mark-up standaards zoals TEI. Als alternatief wordt, om het simpel te houden, dan vaak maar gekozen voor 'slechts' een platte tekst transcriptie.

Volgens Ben echter kan het hebben van macht (in de vorm van krachtige tools) vrijwilligers (en gebruikers in het algemeen) motiveren om mee te werken aan crowdsourcingsprojecten. Juist het niet hebben van die macht zorgt namelijk voor frustratie en afhaken. En mark-up is in de wereld van transcripties macht.

Ben illustreert dit met What's on the menu van de New York Public Library, een project waarbinnen oude menu's worden getranscribeerd. Om het de crowd niet te lastig te maken, werd gebruikers expliciet gezegd: "Don't worry about accents". Dit leidde online echter tot talloze frustraties, want op Duitse menukaarten is bijvoorbeeld 'Ruhreier' toch echt iets anders dan 'Rühreier'. Gebruikers voelden zich niet serieus genomen en misten in hun ogen de noodzakelijke tools ('macht') om hun taak naar behoren uit te kunnen voeren.

Text Encoding Initiative
TEI bestaat sinds 1990 en levert een krachtig datamodel voor digitale teksten, tools voor presentatie en analyse daarvan, en een actieve community voor het ontwikkelen van de standaard. Met TEI kun je teksten uit bijvoorbeeld een dagboek zelfs zo opmaken dat je de ontwikkeling in de tekst ziet. Zodat je bijvoorbeeld visueel kunt maken welke delen van de tekst eerder werden geschreven en welke daarna (relevant, want denk aan latere toevoegingen aan bestaande teksten).

Krachtig en machtig, maar ook ingewikkeld. Mede daarom maakt slechts een handjevol transcriptieprojecten gebruik van TEI. Itinera Nova is misschien wel de onbekendste daarvan. Onterecht, want ze maken er daar op een slimme manier gebruik van, door niet de gebruikers met TEI aan de slag te laten gaan, maar op basis van eenvoudige opmaak door gebruikers automatisch de software zelf de TEI-opmaak te laten toepassen. Volgens Ben zou deze manier van transcriberen wel eens een werkbare toekomst van TEI kunnen inluiden. Een complexe, krachtige tool, gemakkelijk toepasbaar gemaakt.

Dit in tegenstelling tot de andere bestaande manieren om te proberen TEI toegepast te krijgen, via het toekennen van TEI-opmaak door middel van knoppen (zoals in Transcribe Bentham) en menu's. Gebruikers groeien echter vaak over het gebruik van knoppen heen en nemen daarna hun toevlucht tot bijvoorbeeld sneltoetsen. Bovendien kun je maar een beperkt aantal knoppen gebruiken, om er niet in te verdrinken.

Daarom adviseert Ben TEI te gebruiken als datamodel en voor de representatie van teksten. Maar voor het transcriberen zelf (data entry) alternatieven te bekijken, zoals Itinera Nova doet. Zo heb je de voordelen, zonder de nadelen.

Kortom
Presentatie die een goed overzicht gaf van crowdsourcing door de jaren heen, de factor macht die zorgt voor motivatie, en het makkelijk in gebruik maken van krachtige tools; je hoeft een gebruiker niet met TEI lastig te vallen zonder op de achtergrond toch gebruik te kunnen maken van de voordelen van deze standaard. Sowieso interessant om meer te leren over de toepasbaarheid van TEI.

Wil je nog eens het hele verhaal lezen (en de slides bekijken) van Ben zelf, lees dan zijn blogpost.

Gerelateerde verslagen
- André Streicher, The visual Annotation Tool in Itinera Nova
- Prof. Dr. Manfred Thaller, Development of the database, the website and the online transcription platform of Itinera Nova

29 april 2013

The visual Annotation Tool in Itinera Nova


De komende blogs doen verslag van het colloquium "Tools, People and History" dat op 25 en 26 april plaatsvond in Leuven. Aanleiding was het project Itinera Nova van het Stadsarchief Leuven waarin het archief van de Leuvense schepenbank digitaal toegankelijk gemaakt wordt.

André Streicher
André Streicher van de Universiteit van Keulen werkt aan de nieuwe annotatietool van het Itinera Nova transcriptieplatform. Voordat hij echter aan het demonstreren daarvan toekwam, werden we 'getrakteerd' op een theoretische verhandeling over het fenomeen van annotaties, ook wel tags, korte tekstjes of tekeningetjes, gerelateerd aan specifieke locaties in een document.

Binnen Itinera Nova worden de Middelnederlandse aktes volledig getranscribeerd, maar voor de Latijnse aktes is dat eigenlijk onmogelijk. Voor die aktes wordt daarom gebruik gemaakt van annotaties, die samen een doorzoekbare index vormen op personen, beroepen, plaatsen en nog enkele andere categorieën.

De annotatiefunctie is gebaseerd op de software achter het Virtual German Charter Network en het Monasterium Collaborative Archive, beide Duitse projecten waarin oorkonden digitaal toegankelijk gemaakt worden.

Annotaties binnen Itinera Nova kunnen privé (alleen zichtbaar voor de gebruiker zelf) of publiek (voor iedereen zichtbaar) worden gemaakt. Nadat een stukje van een document is geselecteerd, wordt een categorie voor de tag opgegeven en de inhoud van de annotatie, vaak een transcriptie van bijvoorbeeld een persoonsnaam. De metadata wordt opgeslagen volgens de richtlijnen van TEI.

Dezelfde annotatie kan aan meerdere locaties in een document worden gekoppeld. Iedere gebruiker kan een overzicht weergeven van alle door hem of haar toegevoegde annotaties. Een toegevoegde annotatie wordt eerst 'voorgelegd' aan de moderator, die de annotatie moeten goedkeuren of, met feedback, terug neerleggen bij de gebruiker. Nadat de annotatie is goedgekeurd, wordt hij (in het geval van een publieke annotatie) voor iedereen zichtbaar. Andere gebruikers kunnen nog wel reageren op een annotatie, bijvoorbeeld als ze deze onjuist achten, en een melding daarvan komt wederom bij de moderator terecht.

Door middel van de annotatietool wordt het mogelijk aktes toegankelijk te maken zonder de volledige akte te transcriberen.

Maar net als bij het transcriberen is de moderatiefunctie ook hier wel enorm sterk aanwezig. Op mijn vraag of er misschien ervaring was opgedaan met annoteren door 'anonieme' (niet-geregistreerde) gebruikers (of welke andere meer 'open' vorm dan ook) kwam als antwoord dat dit niet is geprobeerd. Er is eigenlijk bij voorbaat al voor de zwaarst gemodereerde werkvorm gekozen, hoe dan ook. De kwaliteit van de toegang mag blijkbaar op geen enkele manier 'risico' lopen. Ik betwijfel eerlijk gezegd dan ook of een meer open werkwijze sowieso wel is overwogen.

Cantal
Door deze presentatie moest ik direct terugdenken aan de presentatie van archivaris-directeur Edouard Bouyé tijdens het Offene Archive congres in Speyer, Duitsland, die de website van zijn Archives départementales du Cantal in Frankrijk demonstreerde. Op die website mag echt iedereen annoteren en het archief had er ook bewust voor gekozen om die functie zo open mogelijk aan te vangen. Toegevoegde tags zijn meteen zichtbaar en vindbaar maar een moderator krijgt nog wel een seintje dat een nieuwe tag is toegevoegd. Het aantal fouten in of onzin tussen de toegevoegde tags bleek echter uitermate laag en bovendien kunnen gebruikers ook op reeds toegevoegde tags reageren. Inmiddels zijn er al meer dan 600.000 tags toegevoegd.

Het lijkt me dat ze in Leuven toch lering kunnen trekken uit deze Franse ervaring. Het toegankelijk maken van de aktes zal misschien vele malen sneller gaan indien een minder gesloten werkopzet wordt gekozen. Zeker in het geval van Latijnse aktes, waarvoor de benodigde talenkennis toch niet altijd lokaal aanwezig zal zijn. En ach, als het in Leuven niet goed werkt, dan kun je altijd de boel weer op slot gooien...

Kortom
Tot slot, André was op dit moment aan het experimenteren met HTML 5 waarmee het mogelijk is om naast rechthoekige selecties ook annotaties te koppelen aan polygonen. Vooral voor het annoteren van foto's is dit natuurlijk erg bruikbaar.

Al met al vooral een interessant tweede deel van de presentatie, alhoewel ik vraagtekens blijf zetten bij de enorme geslotenheid van de gekozen manier van werken. Ik denk dat ze zichzelf in Leuven tekort doen, al denk ik niet dat ze dit zelf zo ervaren.

Gerelateerd verslag
- Prof. Dr. Manfred Thaller, Development of the database, the website and the online transcription platform of Itinera Nova

Afbeelding: voorbeeld van annotaties

Development of the database, the website and the online transcription platform of Itinera Nova

De komende blogs doen verslag van het colloquium "Tools, People and History" dat op 25 en 26 april plaatsvond in Leuven. Aanleiding was het project Itinera Nova van het Stadsarchief Leuven waarin het archief van de Leuvense schepenbank digitaal toegankelijk gemaakt wordt.

Manfred Thaller
Prof. Dr. Manfred Thaller van de Universiteit van Keulen sprak over de techniek achter het transcriptieplatform van Itinera Nova, dat in Keulen wordt ontwikkeld. Dat systeem is ontwikkeld omdat bestaande oplossingen blijkbaar niet volledig aan de eisen van het project voldeden. Het transcriptieplatform voorziet natuurlijk in een transcriptiefunctie, maar ook in een (nieuwe) annotatiefunctie (waarover in de volgende blog meer). Transcripties en annotaties zijn gekoppeld aan een index op namen en plaatsen.

Transcripties worden opgemaakt volgens het Text Encoding Initiative (TEI), een internationale standaard voor het digitaal representeren van teksten. TEI bevat richtlijnen voor het coderen van bijvoorbeeld afkortingen en teksten in marges. Zie bijvoorbeeld een project als Transcribe Bentham (waarover ik eerder blogde). Binnen Itinera Nova worden vrijwilligers overigens niet direct blootgesteld aan TEI, maar een ingebouwde syntax checker markeert automatisch delen van de transcriptie volgens de richtlijnen van TEI, zodat ook foutjes in de transcriptie snel zichtbaar worden (heb je bijvoorbeeld alle haakjes wel goed gezet?). Door middel van een aparte archival editor kunnen ook transcripties vanuit een Word-document worden omgezet naar TEI-format.

Het platform is volledig gemodereerd. Ondanks dat het systeem nog wel eens als een wiki wordt omschreven, is dit niet juist. Per transcriptie is er slechts één, niet te wijzigen, auteur. Moderatoren krijgen een e-mail wanneer de status van een transcriptie is gewijzigd. Transcripties worden pas aan het publiek beschikbaar gesteld als alles is gedubbelchecked. De ontsluiting van de bron en het project zijn volledig gericht op (wetenschappelijk) historisch onderzoek. Kwaliteit staat fier voorop.

Inmiddels kent het platform zo'n 50 geregistreerde gebruikers. Per dag wordt het door zo'n 40 bezoekers bezocht, die samen zorgen voor een slordige 50 nieuwe database entries (ingangen; denk aan het toevoegen van een transcriptie of een naam aan de index). Dat lijkt niet veel, maar laat zien dat er een kleine, actieve community achter het project schuilgaat.

Kortom, een presentatie die niet bepaald swingend werd gebracht, maar die wel een aardige blik achter de schermen gaf.

24 april 2013

Crowdsourcing klimaatverandering: Notes from Nature


Prachtig project weer van Zooniverse: Notes from Nature

We have thousands of specimen images, labels and ledgers from museum collections and the biologists who maintain those collections. These contain information about the where and when a species was found in the past. We need you to help us transcribe that data and make it available for further use in biodiversity and conservation research. Along the way, you will be possibly be finding species that have never been observed anywhere else!

Kijk weer hoe soepel het werkt. En merk weer hoe ze de crowd inspireren en motiveren:

Why should you get involved?
- To improve our world.
- Transcribe with pride!
- You are contributing to real science. Thank you!

Het verzamelen van punten ver en ver voorbij. Dat vind ik prachtig!

Check ook het forum. Daar krijg je niet alleen een beeld van wat je zoal aan beestjes en plantjes tegen kunt komen en hoe mensen elkaar daarmee helpen. Maar je ziet meteen hoe waardevol het is als je meteen de scan erbij hebt waarover iemand een vraag heeft. Idee voor VeleHanden.

Chasing Ice
Over klimaatverandering gesproken: afgelopen week zag ik tot twee keer toe de docu Chasing Ice waarin fotograaf James Balog met zijn team werkt aan time-lapse opnames van zich steeds verder terugtrekkende gletsjers. Indrukwekkend! En schokkend.

Hieronder zijn TED Talk:


Aanbevolen leesvoer
- Help het milieu met transcripties
- Laat een ander het werk maar doen
- Crowdsourcen over de oceaanbodem

Foto: Een beestje om te transcriberen

16 april 2013

Genealogie: een kwestie van veilige seks


Genealogie is niet alleen een leuke hobby, het is ook een manier voor notarissen om erfgenamen te achterhalen, voor doktoren om erfelijkheidsonderzoek te doen. En voor IJslanders om veilige seks te hebben:

Op IJsland wonen heeft zo z'n nadelen: (...) er wonen maar 300.000 mensen - en die stammen allemaal van dezelfde familie af. Daardoor vragen veel IJslanders zich af: "Ben ik met mijn neef of nicht aan het daten zonder dat ik het weet?" Een nieuwe app wil die onzekerheid wegnemen.
De IslendingaApp houdt precies bij wie er van wie familie is in IJsland. Dat werd al bijgehouden op de site Islendingabok. (...)
Naast het traditionele opzoeken kun je de app ook gebruiken samen met de app Bump. Op die manier kun je jouw telefoon direct linken aan de telefoon van je liefje. Zo zie je in één oogopslag of je familie bent of niet.

Da's toch handig. Maar voorlopig alleen voor Android-gebruikers te downloaden (hoeveel zouden ze er daarvan hebben op IJsland?)

In het filmpje zie je hoe het werkt.


Bron: NOS op 3

Aanbevolen cartoons
- Neuken!
- Luke has a sister
- Sigmund

Foto: nóg een app voor veilige seks, een reminder voor condoomgebruik met timerfunctie. Bovendien registreert de app geluid en duur van je seksuele activiteit, maakt daarvan een profiel en stuurt die gegevens geanonimiseerd naar een centrale server... Jaja.

15 april 2013

Crowdsourcing met Crowdcrafting: geen appeltje-eitje


Afgelopen weekend speelde ik wat met Crowdcrafting, gebaseerd op PyBossa:

PyBossa is a free, open-source crowd-sourcing and micro-tasking platform. It enables people to create and run projects that utilise online assistance in performing tasks that require human cognition such as image classification, transcription, geocoding and more. PyBossa is there to help researchers, civic hackers and developers to create projects where anyone around the world with some time, interest and an internet connection can contribute.

Kortom: start je eigen crowdsourcingsproject!

Nou heb ik wel een flinke hoeveelheid handgeschreven reisverslagen van een oude Commissaris der Koningin in Noord-Brabant tot mijn beschikking (zoals deze van de bezoeken aan Waalwijk), dus besloot een kans te wagen om via Crowdcrafting een transcriptieproject te beginnen, zoals de voorbeeldapplicatie PDF Transcription.

Een profiel en project ('applicatie') aanmaken was zo gepiept, het inladen van de taken en pdf's ging ook nog wel goed. Maar mijn stoere plan stokte bij het inrichten van de interface ('task presenter'). Je kunt gebruikmaken van sjablonen, maar hoe langer ik bezig was, hoe dieper ik in de documentatie dook, hoe meer het me begon te dagen dat er uiteindelijk tóch weer geprogrammeerd moest worden.

Zal er nog eens een mail aan wagen richting het projectteam, maar vrees dat Crowdcrafting het voor mij vooralsnog niet gaat worden. Helaas. Even rondklikken in de bestaande (voorbeeld)applicaties geeft namelijk wel zicht op de goede mogelijkheden van het platform.

Crowdcrafting is een project van Open Knowledge Foundation en Citizen Cyberscience Centre. Meer info op de blog van OpenGLAM.

Aanbevolen leesvoer
- Transcriberen met Scripto
- Iedereen z'n eigen VeleHanden: Open Source Indexing!

Afbeelding: voorbeeld van zo'n reisverslag; goed te doen toch!

11 april 2013

WikiPlays: luisteren naar Wikipedia


Al een aantal weken flitsen er op YouTube video's voorbij waarin Wikipedia-artikelen door 'iemand' (het klinkt niet direct als zo'n kenmerkend irritante robotstem) worden voorgelezen. Deze week onder andere het lemma over de Archivist of the United States.

Het account van WikiPlays op YouTube bevat al een dikke 3.000 video's, maar het aantal weergaves blijft daar ver bij achter. Ze zijn ook op andere digitale kanalen 'actief', maar de aandacht daarvoor lijkt me allemaal nogal geautomatiseerd.

Hoe dan ook... Grappig. En zo te beleven ook nutteloos.

Aanbevolen kijkvoer
- NARA in vogelvlucht met David Ferriero
- Achter de schermen in filmpjes

10 april 2013

Transcriberen met Scripto


Het bestaat alweer een jaar, maar bij mij was het weggezakt, totdat Frans me er wederom attent op maakte: Scripto

Om kort te gaan, kun je met behulp van Scripto de wikifunctionaliteit van MediaWiki toevoegen aan een bestaand content management systeem, zoals Drupal en WordPress. Daarna kun je op een wiki'achtige manier bijvoorbeeld brieven en dagboeken uit je collectie laten transcriberen door de crowd.

In reactie op Frans legt Ben Brumfield het verschil uit tussen Scripto en Open Source Indexing, waarover ik eerder blogde:

Scripto does plain-text transcription of an entire document, storing the transcriptions in a Wiki. This is appropriate for letters, articles, journals, and other prose documents.
Open Source Indexing supports structured data like census forms, militia registers, baptismal records, or tax lists. It stores them (per entry) in a database which can be searched by name, date range, etc. You would not want to use Open Source Indexing for family letters, and you would not want to use Scripto for census records.

Wat dat betreft denk ik dat Scripto zo'n beetje werkt als Transcribe Bentham, waarover ik erg enthousiast ben. Zelf heb ik het transcriberen via Scripto nog niet uitgeprobeerd, maar je kunt nog steeds aan de slag met de Papers of the War Department 1784-1800 als je wilt proefdraaien.

Scripto is beschikbaar als open source software en gaat vergezeld van een uitgebreide gebruikershandleiding, inclusief technische instructies, tips voor publieksbereik en voorbeelden van transcriptierichtlijnen.

Aanbevolen leesvoer
- Transcribeerplugins voor MediaWiki
- De transcribiwiki van Transcribe Bentham
- Iedereen z'n eigen VeleHanden: Open Source Indexing!

Afbeelding: plaatje bij een document over een onderzoek naar enkele moorden, te transcriberen met Scripto

9 april 2013

Hoe kinderen fantaseren over kunst


Kinderboekenschrijfster Lydia Rood bedacht samen met het Kröller-Müller Museum het experiment 10 Topstukken – 1001 Verhalen. Daarin verzamelt het museum zoveel mogelijk verhalen van kinderen van 7 t/m 12 jaar, alleen of in klasverband, geïnspireerd door bekende kunstwerken uit de collectie.

Rode lijn in de tentoonstelling is de raamvertelling De jongen met het doosje. Tot 1 september 2013 zal de tentoonstelling elke twee weken een stukje 'groeien' met nieuwe avonturen, geschreven en getekend door kinderen, waarvoor Lydia Rood talloze aanknopingspunten bedacht bij de kunstwerken en fragmenten daaruit.


Dat de museumzalen steeds voller komen te hangen is ook op de website te volgen, zoals in de zaal waar het prachtige Het transport der kolonialen hangt: ondertussen in het museum

Sommige kinderen hebben een tekening gemaakt, anderen een gedichtje of een verhaal. Ik vind het een hele leuke poging om kinderen op een creatieve manier te laten kijken naar kunst en te bedenken wat voor verhaal er achter een kunstwerk kan steken, en achter de personen en gebeurtenissen die daarop te zien zijn.

Iets voor een archiefproject? Om bij archiefstukken, die in de regel ook maar een fragment van een verhaal vertellen, door kinderen het hele verhaal te laten fantaseren?

Aanbevolen leesvoer
- Mijn digitale foto in het fysieke Carnegie Museum of Art
- Transcriberen voor kinderen

Foto: lees bijvoorbeeld wat de 10-jarige Sammy schreef bij dit fragment uit Het transport

8 april 2013

Waarom taggers taggen en of hun tags altijd bruikbaar zijn


Vandaag las ik het artikel Understanding Why Users Tag: A Survey of Tagging Motivation Literature and Results from an Empirical Study waarin de auteurs op soms wiskundige wijze onderzoeken hoe de motivatie van taggers achter het taggen is te meten, in hoeverre die motivatie verschilt tussen en binnen verschillende tagging systemen en tot slot hoe de motivatie achter het taggen invloed heeft op de bruikbaarheid van de tags. Om tot antwoorden te komen is niet alleen literatuur bestudeerd, maar zijn ook de tags van zo'n 4.000 gebruikers over 7 verschillende tagging platformen geanalyseerd. Denk aan Delicious, Flickr en zo meer.

Categorizers en describers
In het artikel wordt een onderscheid gemaakt tussen categorizers en describers.

Categorizers zijn taggers die een persoonlijke navigatiehulp willen bouwen en onderhouden bij items in een collectie of verzameling. Hun set van gebruikte en te gebruiken tags is beperkt van aantal en de inhoud is bepaald stabiel. Iedere tag die wordt toegekend wordt gezien als een investering in de totale structuur van de tags. Het veranderen of doorbreken van deze structuur wordt gezien als kostbaar. Tags worden toegekend aan items wanneer die bepaalde kenmerken gemeenschappelijk hebben. Omdat de tags van categorizers het mentale model van de individuele tagger benaderen, zijn hun tags vooral geschikt om navigatie- en bladerfuncties te ondersteunen.

Describers zijn taggers die een toepasselijke en relevante beschrijving willen geven van items in een collectie. Hun set van tags is vrij open, ongelimiteerd van aantal en de inhoud is redelijk dynamisch. Toegekende tags worden niet gezien als een investering in structuur en het veranderen daarvan wordt dan ook niet gezien als kostbaar. Het doel van taggen is het toekennen van tags die zo goed mogelijk de inhoud van items beschrijven. Omdat daarom de tags van describers de inhoud van items benaderen, zijn hun tags vooral geschikt om zoek- en vindfunctionaliteit te ondersteunen.

In de praktijk worden taggers vaak gemotiveerd door een combinatie van beide.

Op basis van hun analyses concluderen de auteurs dat de motivatie van taggers niet alle tussen verschillende platformen verschilt, maar ook binnen platformen zelf enorm verschilt. Ook concluderen zij dat de motivatie achter het taggen van invloed is op de uiteindelijke folksonomies. Door het nader analyseren van tags in Delicious tonen ze aan dat de overeenstemming over tags onder categorizers beduidend lager is dan de overeenstemming onder describers. Wat zoveel wil zeggen als dat verschillende describers veel vaker aan dezelfde items dezelfde tags toekennen dan verschillende categorizers doen, ondanks hun nogal vrije manier van taggen. Enerzijds misschien paradoxaal, maar anderzijds ook logisch.

Bruikbaarheid van tags en gebruik van tagging functies
Hoe dan ook heeft dit wel enkele belangrijke consequenties, waar het artikel op wijst. Bijvoorbeeld omdat categorizers minder beschrijvende tags toekennen, en omdat er onder hen minder overeenstemming is over de beschrijvende tags die ze toekennen, zijn hun tags minder bruikbaar voor functies als zoeken en het doen van aanbevelingen. In tegendeel eigenlijk.

Om dus de (potentiële) bruikbaarheid van toegekende of toe te kennen tags te kunnen bepalen is inzicht nodig in de achterliggende motivatie van de taggers die deze tags hebben toegekend of toe gaan kennen.

Omdat de manier van taggen enorm verschilt tussen en binnen platformen, moet je daar bij het bouwen van een social tagging platform of functionaliteit rekening mee houden. Als voorbeeld het tijdens het taggen doen van aanbevelingen voor toe te kennen tags: waar categorizers gediend zijn met aanbevelingen vanuit hun eigen structuur, zijn describers juist gediend met aanbevelingen van tags die de inhoud van items het best beschrijven, dus vooral ook tags van andere describers. Het tonen van een tag cloud op basis van je eigen tags stimuleert indirect de groei van het aantal categorizers, met gevolgen voor de bruikbaarheid van de tags voor beschrijvende doeleinden. Het aanbieden van meer geavanceerde zoekinterfaces zou de groei van het aantal describers kunnen stimuleren.

Tot slot
Interessant artikel, zeker als je van wiskundige formules houdt... wat in mijn geval niet zo is. Daarom vind ik het voor mezelf voor nu van voldoende belang om te weten dat de motivatie waarmee iemand tagt van invloed is op de bruikbaarheid van de resulterende tags. En dat je afhankelijk van de motivatie achter het taggen het toekennen van tags kunt (bij)sturen. Goed om daar wat bewuster bij stil te staan en mee om te gaan.

Er zit soms meer achter tags dan je denkt...

Aanbevolen leesvoer
- Het beste komt van buiten
- Wat motiveert de archivaris?

Foto: stukje over private labeling van kruiden en zo

6 april 2013

Mijn digitale foto in het fysieke Carnegie Museum of Art


Vorige maand schreef ik over Oh Snap! van het Carnegie Museum of Art. Natuurlijk heb ik ook een foto gemaakt en ingestuurd en wel bij het intrigerende werk getiteld Blue Cocoon #1, Hong Kong van fotograaf Peter Steinhauer uit 2008. Hier zie je mijn inzending, enkele banden uit het archief van de Raad van Brabant op de kiek gezet.

Korte tijd later lieten ze me via de mail weten dat m'n inzending was opgenomen in de museumexpo en ze stopten er heel vriendelijk een vrijkaartje bij. Nou is dat museum niet op geringe afstand van waar ik woon, dus via Twitter gevraagd of ze me wat foto's konden toesturen. Natuurlijk, zodat op deze pagina het bewijs geleverd kan worden.

Brengt je op een leuke manier letterlijk en figuurlijk dichter bij kunst, zelfs al is die ver weg. En bovendien verdiep je je dan toch meer in zo'n kunstwerk. In dit geval een (bewerkte) foto.

Hoe dan ook vind ik dit toch wel erg cool! :-)


4 april 2013

Waalwijkse gemeentearchief zet Waspikse huizengeschiedenis online


Een probleem waar je bij archiefonderzoek op stuit is dat oude adressen, vaak aangeduid met wijkletters en huisnummers, niet zo makkelijk zijn te koppelen aan de adressen van vandaag de dag. Daar is, afhankelijk van welke bronnen er voorhanden zijn, enig tot uitgebreid onderzoek voor nodig. Óf je moet de mazzel hebben dat anderen dat werk al voor je hebben gedaan natuurlijk.

Zoals in Waspik, waar al jarenlang een actief groepje leden van heemkundekring Op 't Goede Spoor de geschiedenis van zo'n 650 huizen in beeld heeft gebracht. De resultaten daarvan werden al eens in boekvorm uitgegeven, maar staan nu ook online.

Helaas benadert de gebruiksvriendelijkheid van de website die van WatWasWaar. Om welke reden dan ook is ervoor gekozen om simpelweg een GIS-systeem van de gemeente in te zetten. De schat aan informatie achter de kaart verdient eigenlijk een veel betere interface met zoekmogelijkheden. Maar goed, misschien is dit een soort tijdelijke quick & dirty oplossing.

Hoe dan ook een aanbevolen bron voor iedereen die iets wil weten van de geschiedenis van een huis in Waspik. Je kunt zoeken op straatnaam en huisnummer, vervolgens kun je informatie over de geschiedenis van een huis vinden, van 1832 tot september 1947, toen de huidige adressering werd ingevoerd (van huizen die ná september 1947 zijn gebouwd is dan ook geen informatie beschikbaar). Wie waren de eigenaren, wat is er gebeurd, welke omnummeringen zijn er geweest en wanneer? Dit alles met bronverwijzingen naar de kadastrale leggers.

Lees meer over de achtergrond van dit project op de website van het archief.

Aanbevolen leesvoer
- Een schat van een onderzoek(ster)
- Historisch Arnhem in 3D

3 april 2013

Iedereen z'n eigen VeleHanden? Open Source Indexing!


Gisteren wees Ben Brumfield me op Open Source Indexing. Wat een interessant project!

Historic documents often contain handwriting, old fonts, or other text formats that OCR software can't handle. We need humans--from volunteers to paid staff--to read the document images and transcribe what they see into databases which can be searched, analyzed, crawled, and used by researchers. Until now those efforts have required organizations either to outsource indexing to external partners or to cobble together their own off-line or on-site systems.
Our goal is to build a tool that can be used by libraries, archives, museums, historical sites, genealogy and heritage societies to run their own indexing projects, under their own control.

Iedereen z'n eigen VeleHanden? Zou prachtig zijn als dergelijke software voor iedereen beschikbaar komt (ze gebruiken een Apache-licentie voor vrije software)! Even los van het voordeel dat een gezamenlijk (nou ja, want commercieel geëxploiteerd) platform als VeleHanden biedt.

Scribe
Het project baseert zich op Scribe, de software die bijvoorbeeld door het door mij bewonderde Old Weather wordt gebruikt. Maar kijk anders eens naar dit nieuwe project van de New York Public Library, dat gegevens uit theater-, dans- en concertprogramma's laat transcriberen via Scribe. Vooral de manier van gidsen door het systeem spreekt mij nog altijd enorm aan.

Scribe wordt voor Open Source Indexing uitgebreid met onder andere mogelijkheden om direct door getranscribeerde gegevens te kunnen zoeken, bestaande transcripties te kunnen importeren en diverse rapportages.

Meedoen
Op dit moment wordt er vooral gebouwd voor (want betaald door) FreeUKGEN, een club die zoveel mogelijk genealogische data online toegankelijk wil krijgen. Maar er wordt gezocht naar een bredere toepasbaarheid van de software. Dus mocht je nog iets te indiceren hebben? Je kunt je aanmelden...

Prachtig toch?!

Aanbevolen leesvoer
Maak je eigen Metadata Game! En iets over 'critical play'
Volg die boot! Of wat je door crowdsourcing kunt laten zien
- Kaarten georefereren in New York

Afbeelding: plaatje van Ensemble, het op Scribe gebaseerde transcriptieproject van de NYPL