30 april 2013

Itinera Nova in the world(s) of crowdsourcing and TEI

De komende blogs doen verslag van het colloquium "Tools, People and History" dat op 25 en 26 april plaatsvond in Leuven. Aanleiding was het project Itinera Nova van het Stadsarchief Leuven waarin het archief van de Leuvense schepenbank digitaal toegankelijk gemaakt wordt.

Ben Brumfield
Ben Brumfield heeft van crowdsourcing zijn specialisme gemaakt, volgt op zijn weblog alle initiatieven en relevante software en is betrokken bij de ontwikkeling van diverse platformen. Vanuit Amerika was hij daarom ingevlogen om Itinera Nova in internationaal perspectief te plaatsen.

Milieu als motor
Vanaf de jaren '90 ontstonden verschillende offline initiatieven om in eerste instantie vooral genealogische bronnen op een tabelarische manier te ontsluiten. Pas vanaf 2005 zijn de online tools in opkomst. Te denken valt op genealogisch gebied aan het succesvolle Family Search Indexing. Maar ook documenten zonder vaste structuur komen vanaf dan in de belangstelling, zoals Bens eigen FromThePage, waarin onder meer dagboeken worden ontsloten.

Vooral het milieu en klimaatverandering blijken een motor achter crowdsourcingsinitiatieven te zijn, met als absolute topper Old Weather (waarover ik eerder blogde), maar denk ook aan het meer recente Notes from Nature (waarover ik eveneens eerder blogde). Van vandaag de dag hebben we immers talloze data over het klimaat direct beschikbaar. Maar om een ontwikkeling in tijd te zien (en het klimaat is per definitie iets wat op de langere termijn betrekking heeft) moeten we onze toevlucht nemen tot oude, handgeschreven bronnen, zoals scheepslogboeken. Die dan nog wel moeten worden getranscribeerd dan wel geïndiceerd natuurlijk.

Macht en motivatie
Al vanaf het begin van crowdsourcing speelt de spanning tussen vrijwillige en professionele transcribeerders, en parallel daaraan de spanning tussen enerzijds eenvoudige tools en anderzijds krachtige maar daardoor ook complexe tools. Liever het gemakkelijk in gebruik maken van krachtige tools.

De vrees is namelijk altijd geweest wat er gebeurt als je vrijwilligers ('amateurs') loslaat op het transcriberen volgens professionele mark-up standaards zoals TEI. Als alternatief wordt, om het simpel te houden, dan vaak maar gekozen voor 'slechts' een platte tekst transcriptie.

Volgens Ben echter kan het hebben van macht (in de vorm van krachtige tools) vrijwilligers (en gebruikers in het algemeen) motiveren om mee te werken aan crowdsourcingsprojecten. Juist het niet hebben van die macht zorgt namelijk voor frustratie en afhaken. En mark-up is in de wereld van transcripties macht.

Ben illustreert dit met What's on the menu van de New York Public Library, een project waarbinnen oude menu's worden getranscribeerd. Om het de crowd niet te lastig te maken, werd gebruikers expliciet gezegd: "Don't worry about accents". Dit leidde online echter tot talloze frustraties, want op Duitse menukaarten is bijvoorbeeld 'Ruhreier' toch echt iets anders dan 'Rühreier'. Gebruikers voelden zich niet serieus genomen en misten in hun ogen de noodzakelijke tools ('macht') om hun taak naar behoren uit te kunnen voeren.

Text Encoding Initiative
TEI bestaat sinds 1990 en levert een krachtig datamodel voor digitale teksten, tools voor presentatie en analyse daarvan, en een actieve community voor het ontwikkelen van de standaard. Met TEI kun je teksten uit bijvoorbeeld een dagboek zelfs zo opmaken dat je de ontwikkeling in de tekst ziet. Zodat je bijvoorbeeld visueel kunt maken welke delen van de tekst eerder werden geschreven en welke daarna (relevant, want denk aan latere toevoegingen aan bestaande teksten).

Krachtig en machtig, maar ook ingewikkeld. Mede daarom maakt slechts een handjevol transcriptieprojecten gebruik van TEI. Itinera Nova is misschien wel de onbekendste daarvan. Onterecht, want ze maken er daar op een slimme manier gebruik van, door niet de gebruikers met TEI aan de slag te laten gaan, maar op basis van eenvoudige opmaak door gebruikers automatisch de software zelf de TEI-opmaak te laten toepassen. Volgens Ben zou deze manier van transcriberen wel eens een werkbare toekomst van TEI kunnen inluiden. Een complexe, krachtige tool, gemakkelijk toepasbaar gemaakt.

Dit in tegenstelling tot de andere bestaande manieren om te proberen TEI toegepast te krijgen, via het toekennen van TEI-opmaak door middel van knoppen (zoals in Transcribe Bentham) en menu's. Gebruikers groeien echter vaak over het gebruik van knoppen heen en nemen daarna hun toevlucht tot bijvoorbeeld sneltoetsen. Bovendien kun je maar een beperkt aantal knoppen gebruiken, om er niet in te verdrinken.

Daarom adviseert Ben TEI te gebruiken als datamodel en voor de representatie van teksten. Maar voor het transcriberen zelf (data entry) alternatieven te bekijken, zoals Itinera Nova doet. Zo heb je de voordelen, zonder de nadelen.

Kortom
Presentatie die een goed overzicht gaf van crowdsourcing door de jaren heen, de factor macht die zorgt voor motivatie, en het makkelijk in gebruik maken van krachtige tools; je hoeft een gebruiker niet met TEI lastig te vallen zonder op de achtergrond toch gebruik te kunnen maken van de voordelen van deze standaard. Sowieso interessant om meer te leren over de toepasbaarheid van TEI.

Wil je nog eens het hele verhaal lezen (en de slides bekijken) van Ben zelf, lees dan zijn blogpost.

Gerelateerde verslagen
- André Streicher, The visual Annotation Tool in Itinera Nova
- Prof. Dr. Manfred Thaller, Development of the database, the website and the online transcription platform of Itinera Nova

Geen opmerkingen:

Een reactie plaatsen