Posts tonen met het label Plattegronden. Alle posts tonen
Posts tonen met het label Plattegronden. Alle posts tonen

22 oktober 2013

Lach de computer uit en ga verder: corrigeren via crowdsourcing


Het verwerken van historische plattegronden tot iets wat een computer kan begrijpen en een mens kan doorzoeken is een berg werk. Dit begint met het scannen van de kaarten en het daarna vectoriseren van de percelen. Veelal handwerk, dat vooral bestaat uit het digitaal overtekenen (overtrekken) van de originele perceeltjes op de kaart, zodat daar vervolgens allerlei specifieke informatie aan gehangen kan worden (eigenaren, gebeurtenissen, foto's enzovoort). Denk duizenden kadastrale kaarten en je bent al snel een paar miljoen percelen verder. Da's veel tekenwerk.

Bij de New York Public Library doen ze dat voortaan anders. Zij hebben Building Inspector:

The app uses digitized city atlases georeferenced by librarians and public volunteers on NYPL's Map Warper [waarover ik eerder al eens blogde], an online tool suite for creating interactive historical maps. These rectified maps are then passed through a new computer vision process devised by NYPL Labs called the Map Vectorizer, which recognizes building footprints and converts them into machine-readable shape files (think of it like OCR, but for maps).
This is a big leap forward in the work of digitizing old maps. Until now, feature extraction has been done manually by staff and volunteers, tracing each individual building footprint painstakingly by hand. This is a difficult task, usually requiring on-site training, and so it can take months or years to complete a single atlas. The Vectorizer, however, can crunch through an entire borough map in a matter of hours. The data's not perfect, but it's good enough to start figuring out easier, crowd-friendly tasks for validating and correcting it (like the yes/no/fix process at the center of this app). And all of that public input can then be used to refine and improve the Vectorizer process. Human-computer collaboration!

De app maakt duidelijk, dat hele complexe taken vaak bestaan uit een heleboel hele simpele taken. En eentje daarvan, daar kun je ze in New York bij helpen. Onder het motto "kill time, make history" (prachtig toch!) krijg je een kaart voor je neus met daarop een door de computer overgetekend perceel op de stadsplattegrond van New York. En drie knoppen: yes (als het perceel goed is herkend), no (als het niet om een perceel gaat) en fix (als iemand handmatig het werk van de computer moet corrigeren). Geen login of niks. Gewoon simpel. Gewoon even proberen dus. Of check eerst de tutorial.

Maar niet te precies hoor, "don't let perfect be the enemy of good." Laat dus niet iedere scheve pixel tot een fix leiden. En als de computer er een keer een echte mess van heeft gemaakt, dan "laugh at the poor computer and move on." Kijk trouwens vooral niet naar de voortgangskaart - een plattegrond van New York waarop je de door jou verwerkte percelen kunt zien - want dat is niet goed voor de motivatie...

Tot slot
Jaarlijks moet ik nog wel een paar keer mensen uitleggen waarom we op de website van het BHIC tutoyeren. Dat probleem hebben ze in het Engels al niet. En persoonlijk heb ik verder een groot een zwak voor de vaak lekker informele tone of voice die in veel Engelstalige crowdsourcingsprojecten en op websites wordt gehanteerd. Iets voor ons. Alsof het gewoon leuk is!

But enough yapping. Let's inspect some buildings!

Gerelateerd leesvoer
- Kaarten georefereren in New York
- Goed genoeg is ruim voldoende
- Kaarten maken, vergelijken delen met kaart.cc