29 april 2013

The visual Annotation Tool in Itinera Nova


De komende blogs doen verslag van het colloquium "Tools, People and History" dat op 25 en 26 april plaatsvond in Leuven. Aanleiding was het project Itinera Nova van het Stadsarchief Leuven waarin het archief van de Leuvense schepenbank digitaal toegankelijk gemaakt wordt.

André Streicher
André Streicher van de Universiteit van Keulen werkt aan de nieuwe annotatietool van het Itinera Nova transcriptieplatform. Voordat hij echter aan het demonstreren daarvan toekwam, werden we 'getrakteerd' op een theoretische verhandeling over het fenomeen van annotaties, ook wel tags, korte tekstjes of tekeningetjes, gerelateerd aan specifieke locaties in een document.

Binnen Itinera Nova worden de Middelnederlandse aktes volledig getranscribeerd, maar voor de Latijnse aktes is dat eigenlijk onmogelijk. Voor die aktes wordt daarom gebruik gemaakt van annotaties, die samen een doorzoekbare index vormen op personen, beroepen, plaatsen en nog enkele andere categorieën.

De annotatiefunctie is gebaseerd op de software achter het Virtual German Charter Network en het Monasterium Collaborative Archive, beide Duitse projecten waarin oorkonden digitaal toegankelijk gemaakt worden.

Annotaties binnen Itinera Nova kunnen privé (alleen zichtbaar voor de gebruiker zelf) of publiek (voor iedereen zichtbaar) worden gemaakt. Nadat een stukje van een document is geselecteerd, wordt een categorie voor de tag opgegeven en de inhoud van de annotatie, vaak een transcriptie van bijvoorbeeld een persoonsnaam. De metadata wordt opgeslagen volgens de richtlijnen van TEI.

Dezelfde annotatie kan aan meerdere locaties in een document worden gekoppeld. Iedere gebruiker kan een overzicht weergeven van alle door hem of haar toegevoegde annotaties. Een toegevoegde annotatie wordt eerst 'voorgelegd' aan de moderator, die de annotatie moeten goedkeuren of, met feedback, terug neerleggen bij de gebruiker. Nadat de annotatie is goedgekeurd, wordt hij (in het geval van een publieke annotatie) voor iedereen zichtbaar. Andere gebruikers kunnen nog wel reageren op een annotatie, bijvoorbeeld als ze deze onjuist achten, en een melding daarvan komt wederom bij de moderator terecht.

Door middel van de annotatietool wordt het mogelijk aktes toegankelijk te maken zonder de volledige akte te transcriberen.

Maar net als bij het transcriberen is de moderatiefunctie ook hier wel enorm sterk aanwezig. Op mijn vraag of er misschien ervaring was opgedaan met annoteren door 'anonieme' (niet-geregistreerde) gebruikers (of welke andere meer 'open' vorm dan ook) kwam als antwoord dat dit niet is geprobeerd. Er is eigenlijk bij voorbaat al voor de zwaarst gemodereerde werkvorm gekozen, hoe dan ook. De kwaliteit van de toegang mag blijkbaar op geen enkele manier 'risico' lopen. Ik betwijfel eerlijk gezegd dan ook of een meer open werkwijze sowieso wel is overwogen.

Cantal
Door deze presentatie moest ik direct terugdenken aan de presentatie van archivaris-directeur Edouard Bouyé tijdens het Offene Archive congres in Speyer, Duitsland, die de website van zijn Archives départementales du Cantal in Frankrijk demonstreerde. Op die website mag echt iedereen annoteren en het archief had er ook bewust voor gekozen om die functie zo open mogelijk aan te vangen. Toegevoegde tags zijn meteen zichtbaar en vindbaar maar een moderator krijgt nog wel een seintje dat een nieuwe tag is toegevoegd. Het aantal fouten in of onzin tussen de toegevoegde tags bleek echter uitermate laag en bovendien kunnen gebruikers ook op reeds toegevoegde tags reageren. Inmiddels zijn er al meer dan 600.000 tags toegevoegd.

Het lijkt me dat ze in Leuven toch lering kunnen trekken uit deze Franse ervaring. Het toegankelijk maken van de aktes zal misschien vele malen sneller gaan indien een minder gesloten werkopzet wordt gekozen. Zeker in het geval van Latijnse aktes, waarvoor de benodigde talenkennis toch niet altijd lokaal aanwezig zal zijn. En ach, als het in Leuven niet goed werkt, dan kun je altijd de boel weer op slot gooien...

Kortom
Tot slot, André was op dit moment aan het experimenteren met HTML 5 waarmee het mogelijk is om naast rechthoekige selecties ook annotaties te koppelen aan polygonen. Vooral voor het annoteren van foto's is dit natuurlijk erg bruikbaar.

Al met al vooral een interessant tweede deel van de presentatie, alhoewel ik vraagtekens blijf zetten bij de enorme geslotenheid van de gekozen manier van werken. Ik denk dat ze zichzelf in Leuven tekort doen, al denk ik niet dat ze dit zelf zo ervaren.

Gerelateerd verslag
- Prof. Dr. Manfred Thaller, Development of the database, the website and the online transcription platform of Itinera Nova

Afbeelding: voorbeeld van annotaties

2 opmerkingen:

  1. Christian,

    Is er tijdens de presentaties ook iets gezegd over hoe men omgaat met de via crowdsourcing verkregen extra meta data? Wordt deze ook daadwerkelijk in de archiefbeheersystemen opgeslagen (TEI koppeling?) of blijven het losstaande transcriptieplatformen met doorzoekbare content die je naast je eigen systeem zet?

    Nog een leuk crowssourcing project van het Nationaal Archief van Australië: het Destination Australia project (tagging foto´s). Via een webcast vertellen ze er meer over (je moet even wat info opgeven om voorbij het eerste scherm te komen en de webcast te zien): http://events.knowledgevision.com/staging/NAA_shake_your_family_tree_on_demand.html

    mvg,
    Bob Coret

    BeantwoordenVerwijderen
  2. @Bob: Daar is niet specifiek op ingegaan. De vrijwilligers werken, voor zover ik begrijp, in hetzelfde systeem als de archiefmedewerker(s), wat hetzelfde systeem is als op de website is te zien voor alle andere bezoekers (mits transcripties zijn 'vrijgegeven'). Misschien moet je je ook geen al te grote voorstelling maken van de systemen die ze in Leuven gebruiken. Buiten het archievenoverzicht (pdf-bestand) en de Itinera Nova-database, zijn er bijvoorbeeld geen andere (zichtbare) systemen via de website beschikbaar.

    Dank voor de Australische tip; ga ik eens bekijken.

    BeantwoordenVerwijderen