Posts tonen met het label Datavisualisaties. Alle posts tonen
Posts tonen met het label Datavisualisaties. Alle posts tonen

11 februari 2013

Facebook als museum van jezelf


Tijdje terug blogde ik over de nieuwe tool van WolframAlpha waarmee je eenvoudig zelf je Facebook kan analyseren. Eind januari werd die tool uitgebreid zodat je nu meer vragen kunt beantwoorden over jezelf en je vrienden.

In diezelfde week stond ook vooral dat laatste hevig ter discussie rond de lancering van Facebook Graph Search (of Facebook-sociogram in het Nederlands), een geavanceerde zoekmachine voor Facebook, waarmee je losse brokjes informatie aan elkaar kunt koppelen om zo nóg meer vragen te beantwoorden. Vragen die de privacy van andere gebruikers nogal eens met voeten treden.

Je bent natuurlijk al niet eens volledig baas over wat er van en over je online wordt gezet en gezegd, maar je bent nog veel minder baas over hoe die informatie van en over je vervolgens door anderen aan elkaar wordt gelinkt en gebruikt.


Vanmorgen moest ik aan een wat oudere toepassing terugdenken die een positieve draai geeft aan de gegevens die je zelf online hebt gezet: The Museum of Me

Een (filmpje van een) virtueel museum gebaseerd op je Facebook. Er gebeurt een stuk minder dan bij WolframAlpha en talloze stukken minder dan bij Facebook Graph Search. Maar het beeld van een museum visualiseert wel sterk de vraag hoe je later zou kunnen worden herinnerd op basis van je online sporen, in dit geval even toegespitst op Facebook. Je foto's, je likes, je vrienden en je boodschappen.

Ook een manier om daarna toch weer wat bewuster om te gaan met wat je online al dan niet lekt. Een manier die bij mij altijd wel grond vindt.

Aanbevolen leesvoer
- Bekend tot in Rusland
- Analyseer je leven via Facebook

9 oktober 2012

Analyseer je leven via Facebook


Al een dikke maand online, maar ik zag het gisteren pas: WolframAlpha Personal Analytics for Facebook

De antwoordmachine WolframAlpha werd opgericht door Stephen Wolfram. Die man is zelf al z'n leven lang gek op het (laten) verzamelen en (laten) analyseren van grote hoeveelheden data, om op basis daarvan slimme dingen te (laten) zeggen. Zo heeft hij al z'n e-mailtjes vanaf 1989 (!) bewaard, toetsaanslagen, kalendergegevens en zo meer. Al die data samen geven een bijzonder inkijkje in zijn leven.

Facebook
Nou zullen de meeste mensen al die dingen niet al die tijd hebben bewaard. Maar geen nood, want vandaag de dag is er Facebook.

Los van appelmoes maken is mijn persoonlijke activiteit op Facebook erg beperkt. Voor miljoenen anderen is het echter dé website waar ze een goed deel van de dag alles en iedereen op de hoogte houden van hun dagelijks leven, via status updates, likes, apps en foto's. Met WolframAlpha kun je nu met letterlijk een druk op de knop een heel gedetailleerd overzicht laten maken van jouw bestaan op Facebook (en zodoende ook een beetje van je daadwerkelijke bestaan) en wat een computer op basis daarvan aan slimme dingen kan zeggen over je. Wanneer ben je het actiefst online? In welke hoek zoek je vrienden? Over welke onderwerpen schrijf je het meest?

Uit mijn persoonlijke analyse blijkt vooral dat ik erg weinig actief ben, maar ook dat ik het aantal mannelijke en vrouwelijke vrienden aardig in balans heb, dat ze vrijwel allemaal een relatie hebben en dat er zich zowaar een zelfverklaarde atheïst onder mijn vrienden en familie bevindt. Hoe actiever je bent, hoe interessanter en preciezer de analyse.

Bewustwording
Je Facebook-gegevens kun je zelf downloaden, je Twitter-gegevens kun je opvragen en er zijn allerlei analysetools voor dat soort data voorhanden. Maar het is mooi dat WolframAlpha zo'n tool nu zo ontzettend makkelijk toegankelijk heeft gemaakt (zie het filmpje hieronder) zodat ook 'normale' mensen leuk kunnen datavisualiseren op basis van hun persoonlijke gegevens. En misschien soms ook bewuster worden van hun online lekgedrag als je ziet hoe al die zogenaamd losse flarden van online informatie, als ze met elkaar in verband worden gebracht, informatie over je onthullen.

Een datavisualisatie zegt soms meer dan 1.000 status updates.


Op de blog van WolframAlpha geeft Stephen Wolfram uitleg bij dit nieuwe stuk gereedschap.

Gerelateerd leesvoer
- Wat Meebo bewaarde van mijn gesprekjes
- Bekend tot in Rusland

26 september 2012

Laat een ander het werk maar doen


Over Old Weather gesproken, daar zijn ze inmiddels helemaal klaar met het transcriberen van scheepslogboeken van de Britse Royal Navy uit de Eerste Wereldoorlog. Op het plaatje hierboven zie je hoe hard iedereen zoal heeft gewerkt daaraan. Ieder vlakje stelt een persoon voor; hoe groter het vlakje, hoe meer getranscribeerd.

In totaal zijn er precies 16.400 mensen geweest (dus vlakjes ingekleurd) die minsten één pagina hebben getranscribeerd. De top 100 daarvan heeft, als je met je vingers telt, liefst de helft van die meer dan een miljoen pagina's verwerkt. Da's dus net iets meer dan 0,5% van alle deelnemers die 50% van al het werk heeft gedaan. Mooi hoor. Voor meer detail kun je het plaatje vergroten of meer cijfers bekijken.

Maar ik vind het vooral een knap staaltje communitymanagement hoe niet alleen de grote blokjes, maar ook de kleine blokjes in het zonnetje worden gezet:

It’s worth emphasising that the number of pages transcribed is only one measure of contribution to the project – some pages are much harder to read than others, and people also edit the ship histories, provide support and advice on the forum, and act as ambassadors for the project with other communities. I hope everyone is proud of their contribution – the message I take from this figure is that it’s taken all of us to do the job and that we should be pleased with the success with which we’ve supported and encouraged one another to build our joint achievement.

Zonder afbreuk te doen aan de waarde van het plaatje en van de toptranscribeerders, wordt het plaatje wel gerelativeerd. Iedereen een waarde. Ergens ver weg in de rechter benedenhoek, daar moet zich trouwens mijn blokje bevinden... maar dan moet je flink inzoomen hoor!

Goed voorbeeld ook weer van nerdsourcing. Maar ja, je moet vaak eerst een crowd vinden om daarin de nerds te kunnen spotten.

Gerelateerd leesvoer
- Volg die boot! Of wat je door crowdsourcing kunt laten zien
- Meer met minder: benader mensen die je kunnen helpen

19 maart 2012

Het BHIC en Open(er) Data

Treemap van de inhoud van de genealogische database van het BHIC

Het is goed om trends te volgen en waar en hoe mogelijk daarop in te haken. Wat 'open data' betreft lopen we als BHIC beslist niet voorop, maar we willen ook niet achterop raken. Zaak dus om op z'n minst bij de tijd te blijven.

In deze blogpost twee beschrijvingen van projecten waarmee het BHIC op dit moment probeert ervaring op te doen met open data.

Miljoenen Brabanders
Miljoenen Brabanders zijn in de loop der eeuwen geboren en vaak ook gedoopt. Ze vonden werk, werden in de echt verbonden, kochten soms een huis, verhuisden een keer en kregen kinderen - vaak heel veel. Ze betaalden belasting en een stuk of wat bewandelden het verkeerde pad, maar hoe dan ook legden ze op enig moment weer het loodje en werden ze tot slot begraven. In archieven lieten die Brabanders hun sporen na, die door geduldig ontcijfer- en tikwerk van vele vrijwilligers en archivarissen uiteindelijk terecht zijn gekomen in de genealogische database van het BHIC. Bij die database hoort een zoekmachine en van die zoekmachine maken duizenden genealogen gretig gebruik.

Mooi. Maar niet mooi genoeg. Met diezelfde data zouden namelijk veel méér mensen blij kunnen worden gemaakt. Daarvoor moet die data dan wel eerst in een andere vorm worden gegoten.

Zo zou je met die miljoenen genealogische records als basis toch hele aardige datavisualisaties moeten kunnen maken? Daarom heeft het BHIC aan Bob Coret de mogelijkheid gegeven om onze genealogische data te downloaden en de gebruiksmogelijkheden daarvan te onderzoeken. Voor hem en voor ons een manier om via samenwerking ervaring op te doen met open (genealogische) data. En ook om te kijken of je met die data en daarop gebaseerde datavisualisaties geschikte toepassingen voor andere doelgroepen dan genealogen zou kunnen maken.

Een treemap en spelen met dopen en geboorten
Als eerste experimentjes heeft Bob een treemap gemaakt van de inhoud van de database en is aan de slag gegaan met de data van de dopen en geboorten. Met die laatste zijn hele leuke lijstjes te genereren, hele inzichtelijke kaartjes te maken, hele mooie grafiekjes te tonen en hele grappige animaties te bouwen. Welke voornamen komen in jouw plaats het meeste voor? Hoe zit het met de geografische spreiding van familienamen in onze provincie? Vanaf wanneer gingen mensen pas goed los bij het kiezen van meerdere voornamen voor hun kroost? En hoe zit het met het aantal dopen en geboorten tijdens de afgelopen eeuwen?

> Bekijk de treemap
Bekijk de datavisualisaties

Geografische spreiding van de familienaam "Van de Ven"

Gemiddeld aantal voornamen door de jaren heen

Door deze datavisualisaties krijg je (een soms verrassend) inzicht in data, zie je trends, vallen je mede daardoor bepaalde dingen op en kun je nadere (onderzoeks)vragen stellen (met als kanttekening dat de database natuurlijk nog lang niet alle data bevat die op papier beschikbaar is). Allemaal dingen die niet met onze eigen zoekmachine kunnen, maar die wel interessant en soms zelfs noodzakelijk zijn. En vaak ook gewoon leuk. En dat laatste zeker niet alleen voor de gebruikelijke afnemers van deze data, de genealogen, maar ook voor veel andere mensen.

Ook Bob heeft vandaag geblogd over zijn experimenten met de data van het BHIC. Lees verder op zijn blog

Animatie van het aantal geboorten/dopen door de jaren heen

Tagcloud van beroepen

Een app met kaarten
Naast genealogische data hebben we natuurlijk ook nog heel veel ander leuk spul. Een van de betere initiatieven op dit moment is Open Cultuur Data, dat vraag naar en aanbod van open data in de erfgoedwereld stimuleert (proficiat nog!). Het BHIC wil met een selectie van kaarten aansluiten bij dit initiatief, om te zien met wat voor inspirerende manieren om historische kaarten beschikbaar te stellen anderen op de proppen komen. Het Nationaal Archief ging ons daarin voor en dat leverde een fraaie app op. Lees verder op Archief 2.0

Voordelen en aandachtspunten
De voordelen zijn genoegzaam bekend: anderen zullen onze data gebruiken op een manier die wij nooit zouden hebben bedacht, ze zullen ons inspireren, op ideeën brengen, ons werk uit handen nemen en in zekere zin ook onze klanten bedienen. Ze kunnen bijvoorbeeld helpen bij het genereren van datavisualisaties op basis van onze data, om die data geschikt te maken voor andere (en mogelijk nieuwe) doelgroepen. Onderzoekers kunnen eigen query’s loslaten op de data, waarmee zij specialistisch onderzoek kunnen uitvoeren, zoals demografisch onderzoek. We krijgen af en toe concrete vragen daartoe. Onze data zal door dit alles nóg breder worden (her)gebruikt, bijvoorbeeld in mobiele apps.

Natuurlijk moet er ook worden nagedacht over een paar zaken: hoe stel je de data beschikbaar? Voor welke data geldt dat (alleen gegevens of ook bijvoorbeeld scans)? Onder welke licentie? Hoe zit het met dataverkeer? Enzovoort.

Vooralsnog dus kleine zaadjes gezaaid in de proeftuin. En hopelijk leidt dat in de toekomst tot mooie bloemen. Want wat tuinieren betreft, ben ik op dit punt al aardig bijgedraaid ten opzichte van een paar jaar geleden...

Gerelateerd
Nederlandse overheid vóór open data, maar tégen open cultuur data
Een API voor de NA en hoe programmeurs ons kunnen helpen
- Archief 2.0: groep Open Data