29 april 2013

Development of the database, the website and the online transcription platform of Itinera Nova

De komende blogs doen verslag van het colloquium "Tools, People and History" dat op 25 en 26 april plaatsvond in Leuven. Aanleiding was het project Itinera Nova van het Stadsarchief Leuven waarin het archief van de Leuvense schepenbank digitaal toegankelijk gemaakt wordt.

Manfred Thaller
Prof. Dr. Manfred Thaller van de Universiteit van Keulen sprak over de techniek achter het transcriptieplatform van Itinera Nova, dat in Keulen wordt ontwikkeld. Dat systeem is ontwikkeld omdat bestaande oplossingen blijkbaar niet volledig aan de eisen van het project voldeden. Het transcriptieplatform voorziet natuurlijk in een transcriptiefunctie, maar ook in een (nieuwe) annotatiefunctie (waarover in de volgende blog meer). Transcripties en annotaties zijn gekoppeld aan een index op namen en plaatsen.

Transcripties worden opgemaakt volgens het Text Encoding Initiative (TEI), een internationale standaard voor het digitaal representeren van teksten. TEI bevat richtlijnen voor het coderen van bijvoorbeeld afkortingen en teksten in marges. Zie bijvoorbeeld een project als Transcribe Bentham (waarover ik eerder blogde). Binnen Itinera Nova worden vrijwilligers overigens niet direct blootgesteld aan TEI, maar een ingebouwde syntax checker markeert automatisch delen van de transcriptie volgens de richtlijnen van TEI, zodat ook foutjes in de transcriptie snel zichtbaar worden (heb je bijvoorbeeld alle haakjes wel goed gezet?). Door middel van een aparte archival editor kunnen ook transcripties vanuit een Word-document worden omgezet naar TEI-format.

Het platform is volledig gemodereerd. Ondanks dat het systeem nog wel eens als een wiki wordt omschreven, is dit niet juist. Per transcriptie is er slechts één, niet te wijzigen, auteur. Moderatoren krijgen een e-mail wanneer de status van een transcriptie is gewijzigd. Transcripties worden pas aan het publiek beschikbaar gesteld als alles is gedubbelchecked. De ontsluiting van de bron en het project zijn volledig gericht op (wetenschappelijk) historisch onderzoek. Kwaliteit staat fier voorop.

Inmiddels kent het platform zo'n 50 geregistreerde gebruikers. Per dag wordt het door zo'n 40 bezoekers bezocht, die samen zorgen voor een slordige 50 nieuwe database entries (ingangen; denk aan het toevoegen van een transcriptie of een naam aan de index). Dat lijkt niet veel, maar laat zien dat er een kleine, actieve community achter het project schuilgaat.

Kortom, een presentatie die niet bepaald swingend werd gebracht, maar die wel een aardige blik achter de schermen gaf.

Geen opmerkingen:

Een reactie posten

Opmerking: Alleen leden van deze blog kunnen een reactie posten.