Goochelen met Big Data

/ Auteur: Gert Jan Wijma
Yordi Dam (24) is een witte raaf in de journalistiek. Hij doet wat veel journalisten niet kunnen of waar ze te weinig tijd voor hebben: uit grote hoeveelheden data nieuws halen. Dam is datajournalist bij NRC-Q. Ook is hij eigenaar en mede oprichter van LocalFocus, een datajournalistieke persdienst. Die maakt nieuws op basis van grote hoeveelheden data, waaronder van CBS. ‘Ik houd ervan iets mooi te verpakken, maar dan wel met een journalistieke laag. Als je droge cijfers een goede vormgeving geeft, ontstaat er ineens een mooi verhaal en gaan de cijfers leven.’

Dam slaat zijn MacBook open om te laten zien wat zijn bedrijf voor media kan betekenen. Zijn notebook is alles wat hij nodig heeft. De rest staat op een server of in ‘the cloud’. LocalFocus is gevestigd in de ‘Bouncespace’, een plek voor starters aan de Amsterdamse Overtoom. Niet alleen jonge ondernemers met start ups, journalisten en freelancers zijn er te vinden. In het pand zit ook een fietsenmaker, kapper en koffiecorner. Elke dag publiceert LocalFocus één of meerdere verhalen op basis van grote dataverzamelingen. De data worden vaak betrokken van bekende instanties zoals CBS. Naast de gegevens die het bureau uit StatLine of uit de persberichten van CBS haalt, krijgen ze automatisch cijfers uit de Consumenten Prijs Index (CPI) van CBS toegestuurd.

Datapersbureau

LocalFocus biedt niet alleen nieuws, maar is ook een handig platform. Dat geeft aangesloten media de mogelijkheid cijfers razendsnel om te zetten in een grafiek, cirkeldiagram of een interactief kaartje. Met een paar drukken op de knop en opgemaakt in de eigen huisstijl. Het datapersbureau heeft op dit moment zo’n 15 klanten, waaronder belangrijk media maar ook uitgeverijen en onderzoeksbureaus. Dam opereert als datajournalist naar eigen zegge in een ‘niche’. Hij heeft zijn werkterrein zelf moeten ontdekken. ‘Zoiets leer je niet op de school van journalistiek. Ik had geen idee wat ik met cijfers aan moest. Ik had daar geen gevoel bij. Totdat ik ontdekte dat je er heel veel mee kan als je maar de juiste vragen stelt en de juiste verbanden legt.’

Puzzel

Dam begint zijn verhaal niet door zich eerst in te lezen en deskundigen te bellen (zoals veel journalisten doen). Hij kijkt eerst wat de data te zeggen hebben. Naast de cijfers die hij krijgt van instellingen als CBS zoekt hij in open data systemen en ‘scrapt’ webdata en cijferreeksen van pdf-files. Dat vergt wel enige technische vaardigheden die niet elke journalist in zijn vingers heeft. ‘Je moet meestal een statistische bewerking maken, cijfers corrigeren of omrekenen. Soms moeten gegevens gekoppeld worden en moet je verbanden leggen om de interessante bewegingen te zien. Ik vind dat leuk en zie het als een puzzel om gegevens uit een spreadsheet te analyseren.’

Wet Openbaar Bestuur

Soms zijn gegevens niet direct voor handen. Dan komt het oude journalistieke handwerk toch weer om de hoek kijken. ‘Ik benader organisaties met de vraag of ze data beschikbaar willen stellen. Ik wil graag weten welke data ten grondslag liggen aan de feiten die ze presenteren.’ Als organisaties niet mee willen werken, zet Dam als het moet een WOB-procedure in. Op basis van de Wet Openbaar Bestuur probeert hij overheidsinstellingen toch zover te krijgen dat ze data vrijgeven. LocalFocus heeft een WOB-redacteur in dienst om de verzoeken te begeleiden. 

Grote behoefte aan regionaal nieuws

Het meeste nieuws wordt door LocalFocus regionaal ingestoken. Dam: ‘Het nadeel van Nederland is dat we ontzettend veel administratieve indelingen hebben, het voordeel is dat er op regionaal niveau heel veel data beschikbaar zijn.’ Dat komt volgens Dam mooi uit, want er is een enorme behoefte aan regionaal nieuws. ‘Mensen willen weten wat er in hun regio gebeurt. Wij komen bijvoorbeeld met regionale groeiprognoses of werkloosheidscijfers. De cijfers over Limburg leveren een ander verhaal dan die over Noord-Holland.’ In de toekomst hoopt Dam zelfs ‘automatische-locatie-gebaseerde nieuwsberichten’ te gaan leveren. ‘Daarbij worden de tekst en grafieken van nieuwsberichten op basis van telefoongegevens automatisch aangepast aan de plek waar de lezer zich bevindt.’   

Europese cijfers

Op dit moment is Dam nog één van de weinige journalisten die grote databestanden gebruiken als bron voor nieuws. Dam: ‘Ik merk dat mijn collega’s nog moeite hebben met grote hoeveelheden cijfers. Zo weten ze vaak niet hoe StatLine van CBS werkt en hoeveel verborgen schatten er op staan. Maar naar mate er meer beschikbaar is, zullen die data steeds vaker op de radar van die journalist komen. Data, tabellen en grafieken zullen steeds vaker deel uit gaan maken van de ‘toolkit’ van journalisten.’ Dam wil verder met LocalFocus. De Belgische markt op. Gebruik maken van Europese cijfers. Zijn bedrijf wil uitgroeien tot het ANP van data. ‘Ik hoop dat iedereen die snel betrouwbare data uit meerdere bronnen mooi gevisualiseerd wil hebben, direct aan ons denkt. Dat we een onderdeel van de landelijke media zijn.’