19 maart 2012

Het BHIC en Open(er) Data

Treemap van de inhoud van de genealogische database van het BHIC

Het is goed om trends te volgen en waar en hoe mogelijk daarop in te haken. Wat 'open data' betreft lopen we als BHIC beslist niet voorop, maar we willen ook niet achterop raken. Zaak dus om op z'n minst bij de tijd te blijven.

In deze blogpost twee beschrijvingen van projecten waarmee het BHIC op dit moment probeert ervaring op te doen met open data.

Miljoenen Brabanders
Miljoenen Brabanders zijn in de loop der eeuwen geboren en vaak ook gedoopt. Ze vonden werk, werden in de echt verbonden, kochten soms een huis, verhuisden een keer en kregen kinderen - vaak heel veel. Ze betaalden belasting en een stuk of wat bewandelden het verkeerde pad, maar hoe dan ook legden ze op enig moment weer het loodje en werden ze tot slot begraven. In archieven lieten die Brabanders hun sporen na, die door geduldig ontcijfer- en tikwerk van vele vrijwilligers en archivarissen uiteindelijk terecht zijn gekomen in de genealogische database van het BHIC. Bij die database hoort een zoekmachine en van die zoekmachine maken duizenden genealogen gretig gebruik.

Mooi. Maar niet mooi genoeg. Met diezelfde data zouden namelijk veel méér mensen blij kunnen worden gemaakt. Daarvoor moet die data dan wel eerst in een andere vorm worden gegoten.

Zo zou je met die miljoenen genealogische records als basis toch hele aardige datavisualisaties moeten kunnen maken? Daarom heeft het BHIC aan Bob Coret de mogelijkheid gegeven om onze genealogische data te downloaden en de gebruiksmogelijkheden daarvan te onderzoeken. Voor hem en voor ons een manier om via samenwerking ervaring op te doen met open (genealogische) data. En ook om te kijken of je met die data en daarop gebaseerde datavisualisaties geschikte toepassingen voor andere doelgroepen dan genealogen zou kunnen maken.

Een treemap en spelen met dopen en geboorten
Als eerste experimentjes heeft Bob een treemap gemaakt van de inhoud van de database en is aan de slag gegaan met de data van de dopen en geboorten. Met die laatste zijn hele leuke lijstjes te genereren, hele inzichtelijke kaartjes te maken, hele mooie grafiekjes te tonen en hele grappige animaties te bouwen. Welke voornamen komen in jouw plaats het meeste voor? Hoe zit het met de geografische spreiding van familienamen in onze provincie? Vanaf wanneer gingen mensen pas goed los bij het kiezen van meerdere voornamen voor hun kroost? En hoe zit het met het aantal dopen en geboorten tijdens de afgelopen eeuwen?

> Bekijk de treemap
Bekijk de datavisualisaties

Geografische spreiding van de familienaam "Van de Ven"

Gemiddeld aantal voornamen door de jaren heen

Door deze datavisualisaties krijg je (een soms verrassend) inzicht in data, zie je trends, vallen je mede daardoor bepaalde dingen op en kun je nadere (onderzoeks)vragen stellen (met als kanttekening dat de database natuurlijk nog lang niet alle data bevat die op papier beschikbaar is). Allemaal dingen die niet met onze eigen zoekmachine kunnen, maar die wel interessant en soms zelfs noodzakelijk zijn. En vaak ook gewoon leuk. En dat laatste zeker niet alleen voor de gebruikelijke afnemers van deze data, de genealogen, maar ook voor veel andere mensen.

Ook Bob heeft vandaag geblogd over zijn experimenten met de data van het BHIC. Lees verder op zijn blog

Animatie van het aantal geboorten/dopen door de jaren heen

Tagcloud van beroepen

Een app met kaarten
Naast genealogische data hebben we natuurlijk ook nog heel veel ander leuk spul. Een van de betere initiatieven op dit moment is Open Cultuur Data, dat vraag naar en aanbod van open data in de erfgoedwereld stimuleert (proficiat nog!). Het BHIC wil met een selectie van kaarten aansluiten bij dit initiatief, om te zien met wat voor inspirerende manieren om historische kaarten beschikbaar te stellen anderen op de proppen komen. Het Nationaal Archief ging ons daarin voor en dat leverde een fraaie app op. Lees verder op Archief 2.0

Voordelen en aandachtspunten
De voordelen zijn genoegzaam bekend: anderen zullen onze data gebruiken op een manier die wij nooit zouden hebben bedacht, ze zullen ons inspireren, op ideeën brengen, ons werk uit handen nemen en in zekere zin ook onze klanten bedienen. Ze kunnen bijvoorbeeld helpen bij het genereren van datavisualisaties op basis van onze data, om die data geschikt te maken voor andere (en mogelijk nieuwe) doelgroepen. Onderzoekers kunnen eigen query’s loslaten op de data, waarmee zij specialistisch onderzoek kunnen uitvoeren, zoals demografisch onderzoek. We krijgen af en toe concrete vragen daartoe. Onze data zal door dit alles nóg breder worden (her)gebruikt, bijvoorbeeld in mobiele apps.

Natuurlijk moet er ook worden nagedacht over een paar zaken: hoe stel je de data beschikbaar? Voor welke data geldt dat (alleen gegevens of ook bijvoorbeeld scans)? Onder welke licentie? Hoe zit het met dataverkeer? Enzovoort.

Vooralsnog dus kleine zaadjes gezaaid in de proeftuin. En hopelijk leidt dat in de toekomst tot mooie bloemen. Want wat tuinieren betreft, ben ik op dit punt al aardig bijgedraaid ten opzichte van een paar jaar geleden...

Gerelateerd
Nederlandse overheid vóór open data, maar tégen open cultuur data
Een API voor de NA en hoe programmeurs ons kunnen helpen
- Archief 2.0: groep Open Data

4 opmerkingen:

  1. Geweldig pleidooi voor slim gebruik en toepassing Open Data.
    We staan slechts aan het begin van een revolutie.
    Kom leren en ervaren op het Nationaal Congres Open Data 20 april in Eindhoven!

    BeantwoordenVerwijderen
  2. @renepare: Dank voor je reactie! En voor attendering op het congres.

    BeantwoordenVerwijderen
  3. Mooi initiatief en nuttig voor ons/mij. In Gouda proberen we de organisatie ook meer die kant in te bewegen, maar het is moeilijk om mensen duidelijk te maken wat het nut van open data is, of kan zijn. Voorbeelden werken goed. Helaas hebben we in Nederland nog niet zo heel veel voorbeelden uit de archiefwereld. Laten we vooral meer gaan zaaien.

    BeantwoordenVerwijderen
  4. @Tom: Fijn om te lezen dat je iets aan m'n blogpost hebt, Tom! Een paar archiefdiensten zijn goed bezig, vind ik: Nationaal Archief, Gemeentearchief Rotterdam, Regionaal Archief Leiden gaat beginnen, begreep ik. En vast nog een paar waar ik nu even niet opkom.

    Via de Open Data groep op Archief 2.0 is het belangrijk om hierover kennis uit te blijven wisselen en ervaringen te delen. Al is die plek maar een verzamelplaats voor inspirerende voorbeelden, dan zijn we alweer een eind op scheut.

    Ben benieuwd naar jullie initiatieven!

    BeantwoordenVerwijderen