11 september 2013

Archiefje dicht, archiefje open


Waar de een digitale archieven achter slot en grendel plaatst en tegen betaling tijdelijk sleutels uitleent, zijn er ook die hun archieven juist zoveel mogelijk open willen gooien. Erfgoed Leiden en Omstreken (voorheen gewoon Regionaal Archief Leiden) is er zo eentje en stelt genealogische data op een technische manier genaamd OAI-PMH beschikbaar. Dat houdt zoveel in, dat iedereen de database van Leiden kan bevragen en de gegevens daaruit kan presenteren zónder gebruik te hoeven maken van de zoekmachine die Leiden zelf heeft ontwikkeld, maar door zelf iets te knutselen ('iedereen' is dus 'iedereen die kan programmeren'). Je kunt dus bij het zoet zonder het zuur.

Open Archieven
De meeste archieven stellen hun data op deze manier alleen binnen specifieke samenwerkingsverbanden beschikbaar, zoals voor deelname aan WieWasWie. Maar Leiden gaat dus een stap verder en zet de deur voor allen open. Bob Coret heeft daar dankbaar gebruik van gemaakt, door een alternatieve zoekmachine voor stamboomonderzoek te bouwen: Open Archieven

Meer informatie over de achtergrond van Open Archieven vind je in Bobs blogpost met zijn wensenlijst voor een genealogische zoekmachine van een archief. Een krachtig zoekveld, slimme manieren om op twee personen te zoeken, handige verwijzingen naar andere gegevensbronnen, keurige bronvermeldingen en zo nog heel wat. Prachtig! En bovendien inspirerend.

Open Data
Op deze zoekmachine is natuurlijk net zo veel aan te merken als op de zoekmachines van archieven zelf. Maar dat geeft niet en daar gaat het ook niet om. Het is namelijk gewoon goed, dat er steeds meer praktische voorbeelden komen van waar open data toe kan leiden. Want alleen met het voorhouden van allerlei lekkers, daar houden ze je eetlust niet mee vast. Je wilt af en toe ook echt wat opgediend krijgen, anders smeer je toch zelf maar weer een boterham.

Open Archieven doet een paar dingen radicaal anders dan de gebruikelijke zoekmachines die archiefdiensten aanbieden. Bijvoorbeeld het eenvoudige zoekveld, dat door het gebruik van operatoren toch krachtige mogelijkheden biedt. Ik ben benieuwd of uit gebruikerstests en vragenrondes valt af te leiden hoe gebruikers dit zoekveld, en alle andere mogelijkheden, gebruiken. En of ze via Open Archieven betere zoekresultaten afdwingen dan met 'onze' zoekmachines.

Doorbraak?
Want open data heeft echt nog een lange weg te gaan in archievenland, ondanks de vele aandacht en de verschillende initiatieven. Voor de doorbraak van open data zou het daarom goed zijn als de zoekmachine van Bob, Open Archieven, beduidend beter blijkt te scoren dan al hetgeen archiefdiensten zelf hebben weten te bouwen. Anders blijft het moeilijk de meerwaarde van open data te herkennen.

Archievenland is natuurlijk ook maar een kikkerlandje. Bij open data en genealogie lijkt het dan al snel alsof je alleen voor de Bob Coret bv aan het werk bent... Dus Open Archieven, zet hem op!

Gerelateerd leesvoer
- Het BHIC en Open(er) Data
- Leiden legt de lat hoog

11 opmerkingen:

  1. Christian,

    > zijn er ook die hun archieven juist zoveel mogelijk open willen gooien

    Ik zie hier liever staan: die hun materiaal graag zo veel mogelijk gebruikt zien worden!

    > Archievenland is natuurlijk ook maar een kikkerlandje. Bij open data en genealogie lijkt het dan al snel alsof je alleen voor de Bob Coret bv aan het werk bent...

    Ik herhaal de definitie van Open Data nog even:

    Open data is data die vrij gebruikt kan worden, hergebruikt kan worden en opnieuw verspreid kan worden door iedereen - onderworpen enkel, in het uiterste geval, aan de eis tot het toeschrijven en gelijk delen.

    Enerzijds om aan te geven dat open data zich niet beperkt tot genealogische data. Zoals ik ook in de presentatie Geef mij uw data - alstublieft (presentatie KVAN 2012) kun je als archief denken aan:
    - Informatie over het archief (adres, openingstijden, URL, ...)
    - Informatie over archieftermen
    - Archief inventaris
    - Nieuws of nieuwe zoekresultaten
    - Indexgegevens
    - Scans/foto's
    - Synoniemen achternamen of voornamen
    - Plaatsnamen, synoniemen, geo-informatie (dus ook vooral niet meer bestaande plaatsen)
    - Statistieken website/zoekmachine gebruik
    - Handleidingen

    Anderzijds wil ik wijzen op het 'iedereen' gedeelte uit de definitie. Ja, ik ben vrij actief in dit veld, maar zeker niet de enige. En het mooie van open data is dat je bedrijvigheid stimuleert, het kan mensen op ideeën brengen, er kunnen combinaties of functies bedacht worden die van grote waarde kunnen blijken.

    Open Archieven is ook gericht op samenwerking, vandaar dat er ook al direct een Open Archieven API wordt geboden waar andere ontwikkelaars gebruik van kunnen maken. Tevens maakt Open Archieven ook gebruik van services van anderen (wat archieven zelf ook kunnen doen!).

    BeantwoordenVerwijderen
  2. (vervolg)

    Nederland is inderdaad maar een kikkerlandje (vandaar dat Open Archieven ook gelijk meertalig is), maar vergis je niet hoeveel actievelingen in dit veld actief zijn. Hieronder even snel uit het hoofd een lijstje namen in alleen al het genealogische veld:
    - Albert Netjes (van genNetjes)
    - Bas Wilschut (van GensDataPro)
    - Boudewijn Sjouke (van Genmod)
    - Gábor Hummel (van Mijn Genea)
    - Gerrit Veldman (van Stamboomzoeker / Familytreesearcher)
    - Harry van Binsbergen (van Geneaal)
    - Huub Mons (van HuMo-gen)
    - Jan Diebrink (van Hazadata)
    - Johan Mulderij en Dinant Scholte in 't Hoff (van ProGen)
    - Kees Klootwijk (Online Familieberichten)
    - Lukas de Vries, Robert-Jan Zandvoort en Ype Poortinga (van de Rouwbode, voorheen Kassiewijle)
    - Margaret Massop (van Uw Stamboom Online)
    - Steffan Woltjer (van Graftombe)
    - Tom de Neef (van Genealogica Grafica)

    Bovenstaande personen zijn nog niet bezig met (genealogische) archiefdata, maar dat kan natuurlijk ook iets te maken hebben met het ontbrekende aanbod van API's en data...

    En naast deze individuën heb je natuurlijk ook verenigingen als NGV en HCC!genealogie die hun zoekmachine kunnen uitbreiden door ook gegevens van het archief te laten zien of de gegevens als een controle kunnen gebruiken bij hun indexeringsproject. Ik noem maar wat.

    En waarom stoppen bij de Nederlandse grens, een partij als Ancestry.com kan op basis van de genealogische data van Erfgoed Leiden en omstreken ook weer hun service verbeteren. In de praktijk betekent dit dat hun gebruikers hints/matches krijgen, oftewel suggesties voor aktes bij het archief, dus extra verkeer!

    Graag wijs ik archieven op het Stappenplan Open Data op de ArchiefWiki en moedig ik archieven aan om er mee aan de slag te gaan. Als zelfstandig adviseur kan ik hier archiefinstellingen ook bij helpen.

    Specifiek voor Open Archieven: archieven die al een OAI-PMH (A2A) koppeling hebben, publiceer de end-point en maak hergebruik mogelijk! Ik hoop dat er innovatie en concurrentie op basis van service en dienstverlening ontstaat en geen beperkende data monopolies!

    mvg,
    Bob Coret

    BeantwoordenVerwijderen
  3. @Bob: Bedankt voor je uitgebreide reactie. En je hoeft mij niet meer te winnen voor open data hoor, ik ben al wel om. ;-)

    Ik zou willen, dat al die door jou genoemde personen allemaal om 'onze' data kwamen vragen en uitleggen wat voor fantastische dingen ze daarmee misschien wel zouden willen doen. Dat zou bij archieven ook een concrete vraag creëren, die er op dit moment nauwelijks is. Behalve dan vanuit de - wat ik even noem - de Bob Coret bv (die aansluitend ook nog even zijn zelfstandig adviseurschap in de week legt ;-) ).

    Je kunt als archief de vraag ook 'opzoeken' natuurlijk - da's een beetje wat jij voorstelt - maar archieven hebben nu juist geleerd dat ze vraaggericht te werk moeten gaan... Er is ook al best veel aanbod (bijvoorbeeld via Open Cultuur Data) maar behoudens de mooie resultaten van diverse hackathons, zie ik nog weinig apps gelanceerd worden die van deze datasets gebruikmaken.

    Voor wat betreft het BHIC had ik me trouwens al voorgenomen om eens te bekijken of we kunnen aansluiten bij Open Archieven, maar dit hoor je dan nog. Mocht je dat niet uit mijn blogpost hebben begrepen: ik vind Open Archieven een prachtig voorbeeld van hoe de vraag naar open data concreet kracht bijgezet kan worden met ideeën en toepassingen, die de meerwaarde ervan laten zien.

    Tot die tijd hoop ik dus vooral op méér vraag naar open data, van méér mensen, vanuit méér hoeken. Volgens mij zal dit veel archivarissen nut en 'noodzaak' van open data beter doen inzien. En het ook daadwerkelijk op de agenda plaatsen.

    Tot slot, omarming van open data door archieven is een traag proces - heus niet (alleen) door onwil - maar het vordert wel.

    BeantwoordenVerwijderen
  4. @Christian: Ik ben het met je eens dat het de open data helpt als er voorbeelden zijn èn vraag. Ik heb de door mij genoemde personen net de link naar dit artikel gemaild en gevraagd hier te reageren als ze behoefte hebben aan archief data. En ik hou mijn ogen open voor andere mogelijkheden om de vraag naar open data duidelijk te maken en te stimuleren.

    BeantwoordenVerwijderen
  5. Ik lees "En waarom stoppen bij de Nederlandse grens, een partij als Ancestry.com kan op basis van de genealogische data van Erfgoed Leiden en omstreken ook weer hun service verbeteren." En de vraag stellen is haar meteen beantwoorden. Ancestry.com is een commerciële partij en de aanwezigheid daarvan dient volgens mij te vuur en te zwaard worden bestreden.

    BeantwoordenVerwijderen
  6. Natuurlijk helemaal met Bob eens. Wij zijn met www.online-begraafplaatsen.nl en www.online-familieberichten.nl al vele jaren bezig met het beschikbaar stellen van Open Data.
    Regel 1 van ons project: Gratis en voor iedereen die het wil horen!

    Ik zal zeker gaan kijken naar de API's om aan te sluiten.

    We hebben inmiddels binnen het project al via API's en RSS aansluiting met een vijftal partijen, o.a. groenegraf.

    BeantwoordenVerwijderen
  7. @Kees: Bedankt voor je reactie. En goed om te horen. Dan kan Bob de gegevens uit jullie beide websites alvast opnemen in Open Archieven.

    BeantwoordenVerwijderen
  8. @ Richard: je stelt: Ancestry.com is een commerciële partij en de aanwezigheid daarvan dient volgens mij te vuur en te zwaard worden bestreden.
    Kan je mij uitleggen waarom.
    Volgens mij passen "open data" en "uitsluiten" namelijk niet bij elkaar

    BeantwoordenVerwijderen
  9. @Walther Hasselo: Uitsluiten van een commerciële partij is heel eenvoudig te verklaren, hoor. Zo'n partij heeft helemaal niets aan kale gegevens, maar wel aan een koppeling tussen een index en de bijbehorende scans. En wie heeft die koppeling gemaakt? Juist ja, een groep vrijwilligers. Zij werken zich dus in het zweet terwijl een andere partij daar mooi weer mee kan spelen. Ik zou me bedonderd voelen in zo'n geval. Sterker nog: ik voel me bedonderd en ik zal minder vaak meedoen aan VeleHanden. Het project Missing Links bij VeleHanden heb ik voor mezelf al helemaal afgeschreven.
    Maar ach, het is slechts mijn mening, dus je hoeft er niet van wakker te liggen...

    BeantwoordenVerwijderen
  10. Een link tussen de informatie van Erfgoed Leiden en Online-Begraafplaatsen.nl is inmiddels gelegd. Zie dit voorbeeld

    BeantwoordenVerwijderen
  11. Heb de resultaten van Open Archief van Bob Coret bekeken. Ik vind het een prachtig geheel. Zeer gemakkelijk te gebruiken. Open Archief initiatieven verdienen onze steun. Ben benieuwd welke archieven in de loop van de tijd mee gaan doen. Leiden verdient alle lof als voortrekker!

    BeantwoordenVerwijderen