6 mei 2013

Kiezen of transcriberen? Over de vraag hoeveel ontsluitingstijd je moet nemen


In de afgelopen tien blogposts heb ik verslag gedaan van het colloquium "Tools, People and History" dat op 25 en 26 april plaatsvond in Leuven. Aanleiding was het project Itinera Nova van het Stadsarchief Leuven waarin het archief van de Leuvense schepenbank digitaal toegankelijk gemaakt wordt.

Verslag
Op de eerste dag stonden de tools en people centraal. Vanwege het teveel aan auto's op de Vlaamse snelwegen moest ik de inleidende woorden van projectleider Inge Moris missen, maar daarna werden de tools nog uitgebreid toegelicht. Manfred Thaller gunde ons een blik achter de technische schermen van het transcriptieplatform en aansluitend demonstreerde André Streicher de nieuwe annotatietool. Tot slot plaatste Ben Brumfield het project in een internationale context, waarna het hoog tijd werd voor de people. Daarmee bleken vooral de vrijwilligers te worden bedoeld. Claire Dejaeger vertelde daarom over haar trotse ervaringen als vrijwilliger in Leuven en Jan d'Hondt, archivaris van Brugge, ging in op de vrijwilligersprojecten van het Brugse stadsarchief. Als klapstuk kwam Richard Millington aan het woord, die vooral veel praktische tips gaf voor het motiveren en gemotiveerd houden van vrijwilligers binnen online community's.

Op de tweede dag was dan de history aan de beurt. Marika Ceunen, Geertrui Van Synghel, Jelle Haemers, Julie De Groot en Inneke Baatsen gingen repectievelijk in op de inhoud en onderzoeksmogelijkheden van de schepenbankregisters van Leuven, 's-Hertogenbosch, Gent en twee keer Antwerpen. Goed om te horen hoe rijk deze bronnen zijn en hoe prachtig ze kunnen vertellen over het dagelijks leven in vroeger tijden. Maar ook leerzaam om te zien hoe een goede aansluiting bij het onderwijs door archiefinstellingen kan zorgen voor waardevolle onderzoeksprogramma's.

Klikken op alle namen van hierboven brengt je tot uitgebreide verslagen van de presentaties. Al met al een interessant colloquium, dat ook stemde tot verder nadenken over het toegankelijk maken, beschikbaar stellen en laten benutten van oudere archieven.

Wat ik vind
Zoals ze het in Leuven aanpakken, dat vind ik mooi. Zeker de nabijheid van een universiteit geeft prachtige mogelijkheden om het schepenbankarchief vanuit allerlei kanten te laten belichten en onderzoeken. Bij de ontsluiting is rekening gehouden met manieren waarop de bron zo goed mogelijk toegankelijk kan worden gemaakt, vooral met het oog op de specifieke doelgroep van (wetenschappelijke) onderzoekers. Ook de wijze waarop vrijwilligers worden ingezet verdient respect. Iedereen kan daarvan leren.

Wat ik betwijfel
Toch heb ik ook wel wat twijfels. Zo is er in het hele proces van ontsluiten van de bron wel erg veel moderatie en controle. Ik denk, dat met wat minder controle er meer snelheid in het ontsluiten is te bereiken, zonder de kwaliteit van die ontsluiting zogezegd in gevaar te brengen. Leuven zou zichzelf in mijn ogen tekort doen, als ze niet zou experimenteren daarmee. Ik denk in dit verband ook aan de Franse ervaringen met tagging, zoals eerder beschreven (zie het verslag over de annotatietool).

Die gecontroleerde en gemodereerde manier van werken, maar ook de gekozen vorm waarbinnen de vrijwilligerscommunity werkzaam is, heeft nu ook tot resultaat dat vrijwilligers vooral lokaal worden gevonden. En dat terwijl juist ook op (grote) afstand kennis en kunde aanwezig zal zijn, die helpen bij het toegankelijk krijgen van deze bron. Voor mensen van ver weg zijn dergelijke projecten immers een welkome kans om de band met hun moedergrond te verstevigen. Bovendien, omdat onderzoekers op afstand veelal afhankelijk zijn van digitale dienstverlening, zijn ze vaak extra gemotiveerd om hieraan hun bijdrage te leveren. Ter illustratie hiervan leren de ervaringen van het BHIC dat op zijn forums het meeste werk wordt verzet door juist een aantal mensen in het buitenland.

Wat ik overdenk
Naast deze complimenten en twijfels, zijn er ook punten waarop ik door de presentaties in Leuven, en door de gesprekken met een aantal collega's, aan het denken ben gezet. Het gaat dan vooral over de diepte van het ontsluiten. In Leuven worden volledige transcripties gemaakt die uiteindelijk volgens de regels van TEI (Text Encoding Intitiative) worden opgemaakt. Daarnaast zijn indexen (op bijvoorbeeld personen en plaatsen) en scans van de akten aanwezig. Een enorm rijke ontsluiting, die volledig zal aansluiten bij de specifieke doelgroep van wetenschappelijk onderzoekers.

Iedereen is blij met hoe dit project verloopt (houden zo dus!?) en lijkt zich op geen enkele manier te betreuren om (of te laten ontmoedigen door) het feit dat het nog héél lang duurt voordat het allemaal af is. Het gaat in totaal om 950.000 pagina's; veel daarvan bevatten meerdere akten en een aantal akten zal ook gerust meerdere pagina's beslaan. In totaal zijn er nu, een kleine vier jaar na de start van het project, zo'n 10.400 akten getranscribeerd. Op deze manier zijn er dus letterlijk en figuurlijk nog eeuwen werk te verzetten. En dat is dan nog maar één bron...

Op het BHIC werken we veel met indexen en samenvattingen van akten (waaronder veel schepenakten) en dat gaat een stuk sneller (onze werkwijze is ook veel minder gecontroleerd en gemodereerd). Bovendien is onze ervaring dat veel onderzoekers wel doorklikken naar de scan (die in veel gevallen is gekoppeld aan de samenvatting) maar dat bij het ontbreken daarvan ze ook vaak genoegen lijken te nemen met slechts de samenvatting.

Kiezen
Uiteindelijk gaat het om keuzes en die zijn in Leuven en Den Bosch verschillend gemaakt. Beide zijn prima, gericht op andere doelgroepen, gemaakt binnen een ander beleidskader en een andere planning. Ik vraag me echter af waar in deze keuzes een bepaald omslagpunt ligt, vanaf welk moment een nóg betere ontsluiting vooral extra werk met zich meebrengt, maar relatief weinig extra gemak? Of vanaf welk moment een klein beetje extra moeite voor het ontsluiten een relatief flinke meerwaarde voor de onderzoeker oplevert?

Met Ben Brumfield, die toevallig in hetzelfde hotel logeerde, heb ik daarover ook doorgepraat. Het maken van samenvattingen gaat misschien sneller, maar misschien ook weer minder sneller dan je zou denken; je moet immers toch de hele akte lezen. En bovendien héél goed begrijpen, om daar een goede samenvatting van te kunnen maken. Aan de andere kant, tijdens het transcriberen gaat veel tijd verloren aan het soms eindeloze gepuzzel op een enkele letter.

Bedacht ik me nog, dat ook nieuwe ontwikkelingen als open data en datavisualisatie extra eisen stellen aan je toegankelijkheid. Die ontwikkelingen zijn namelijk vooral gebaat bij rijke informatiebestanden; een datavisiualisatie op een magere index geeft weinig spannends als resultaat. En hoe beperkter je toegang, hoe minder er als open data te linken en te koppelen valt. Aan de andere kant, zowel open data als datavisualisatie worden pas echt interessant bij grote hoeveelheden materiaal... en dan is snelheid in ontsluiten wel een plus.

Kortom
Tja, kies je er dus voor om in rap tempo heel veel bronnen op een beperkte manier toegankelijk te krijgen? Of kies je ervoor om in een veel lager tempo een beperkt aantal bronnen toegankelijk te krijgen, maar dan wel op een uitgebreide manier? En waar ligt daarin de balans? Het betere is immers als zo vaak de vijand van het goede, zeker bij archivarissen.

Een aloude discussie, in een nieuw licht bekeken. Goed om bij stil te blijven staan. En keuzes in te maken. Mijn gevoel en verstand strijden nog wat met elkaar...

Aanbevolen leesvoer
- Waar ik blij van word
- De vraag is alleen: wanneer?
- Archiefontsluiting door nerd-sourcing

Afbeelding: een monsterslak valt een ridder aan (bron: Smithfield Decretals, British Library, Royal 10 E IV, f. 107). Via een blogpost over historici en slakken

4 opmerkingen:

  1. Een hele mooie artikelenreeks Christian! Fijn dat je zo uitgebreid verslag hebt gedaan, ik heb je blogposten over Itinera Nova met veel plezier en belangstelling gelezen. Met name ook die posten over de rol van de vrijwilligers bij transcriptieprojecten, want zonder vrijwilligers zou er lang zoveel niet mogelijk zijn!
    Anneke van Waarden

    BeantwoordenVerwijderen
  2. Dat is nogal wat in deze blogpost. Compactheid is aan jou niet besteed :)
    De vragen die je stelt, of bedenkingen is misschien beter, zijn natuurlijk terecht. Wij hebben in Tilburg ten aanzien van de charters ook voor een andere vorm gekozen. Wel integrale transcripties, maar niet wetenschappelijk verantwoord. Er zullen best fouten of onvolkomenheden in die transcripties zitten. Is dat erg? Of zou er nog een hele kwaliteitsslag overheen moeten? Ik denk persoonlijk van niet. Als er fouten in zitten, dan komen die bij gebruik vanzelf aan het licht en in de meeste gevallen krijgen we dat dan ook terug. Niets leuker dan een fout doorgeven!
    We hebben ook overwogen om er regesten aan toe te voegen en daarmee de leesbaarheid te verbeteren. Van de andere kant kost dat dan weer zoveel tijd, dat de meerwaarde daarvan nog moet blijken. Bovendien zijn dat soort van kwaliteitsslagen ook in een later stadium altijd nog te maken.
    Het feit dat de informatie toegankelijk is, dat weegt nu zwaarder. Een bijzondere bron is goed, soms opnieuw, beschreven, materieel picobello in orde gebracht, digitaal beschikbaar en inhoudelijk toegankelijk. Wat wil je nog meer, zowel als archiefinstelling en als onderzoeker. Het kan altijd beter, dat is waar. Toekomstige generaties kunnen zich er nogmaals in vastbijten.
    Deze manier van werken brengt ons in ieder geval hapklare brokken die we in projectvorm goed kunnen behappen. Bovendien kunnen we de diverse projecten mooi laten aansluiten bij jubilea in de betreffende gemeenten zodat we onszelf als archief ook daar op de kaart kunnen zetten.
    Het is een scherp mes dat aan alle kant goed snijdt.

    In het geval van het Leuvense project spelen ook andere factoren een rol. Wij financieren het charterbankproject uit eigen middelen. Stadsarchief Leuven is afhankelijk van subsidiepotten en dat vraagt vaak een andere benadering. De samenwerking heeft voor hen, en dus ook voor ons als betrokken toeschouwers, veel moois opgeleverd dat ze dan ook met gepaste trots hebben gepresenteerd.

    Allemaal goed!

    BeantwoordenVerwijderen
  3. @Luud: Het kost me vast lezers, maar aangezien mijn blog ook mijn eigen kladblok is, mag ik daarop soms graag uit de bocht vliegen qua berichtlengte. :-)

    Dank voor jouw eveneens uitgebreide reactie!

    Jullie charterbank is inderdaad van een andere orde en de daarin gemaakte keuzes zijn duidelijk. Ik kan me herinneren dat Astrid me eens vertelde dat ze in den beginne alle aangeleverde transcripties nog zelf controleerde, maar dat ze daar op den duur mee is gestopt, omdat het te veel tijd kostte en te weinig opleverde. Dat soort inzichten moet je ook tot nieuwe keuzes durven maken natuurlijk.

    Nadeel van gesubsidieerde projecten is inderdaad dat je vaak aan bepaalde voorwaarden bent gebakken. Soms geeft dat niet - en ik weet niet hoe dit in Leuven zit - maar ik kan me ook voorstellen dat het soms knelt.

    Ook op het BHIC leveren mensen vaak volledige transcripties aan, die we er dan ook gewoon opzetten. En leveren ze samenvattingen aan, dan is dat ook prima. Dat project is weer een stuk 'losser' van opzet dan jullie charterbank en héél wat anders dan het Leuvense project.

    Net wat je zegt, uiteindelijk is het allemaal goed, als het de toegankelijkheid van archieven bevordert. En de archiefonderzoeker blij maakt.

    BeantwoordenVerwijderen