Wat kan Open Data voor jouw bedrijf doen?

Door gegevens te combineren in Power BI kun je nieuwe inzichten opdoen. Dat vereist één ding: data om mee te werken. Vanzelfsprekend heb je je eigen bedrijfsdata beschikbaar, maar waar haal je andere betrouwbare gegevens vandaan? De Nederlandse overheid biedt uitkomst dankzij de Data Agenda Overheid.

 

Data Agenda Overheid

De Data Agenda Overheid stimuleert samenwerking door het delen, combineren en analyseren van data te bevorderen. Binnen dit project biedt de overheid mogelijkheden om data te benaderen en zorgen ze dat het juridisch afgedekt is. De focus ligt op gegevens die door de overheid en wetenschappelijke instellingen verzameld worden én op data van met publiek geld gefinancierde organisaties.

 

De Data Agenda Overheid omvat gegevens van de overheid, wetenschappelijke instellingen en met publiek geld gefinancierde organisaties.

 

KvK Open Data

Een voorbeeld van zo’n project is KvK Open Data. Daarin stellen de Kamers van Koophandel een set geanonimiseerde bedrijfsdata ter beschikking. Wie daarmee wil experimenteren kan de set inlezen in een applicatie zoals Power BI. Wekelijks actualiseert de KvK deze gegevens. Wie ze in een dashboard gebruikt, kan zo met behoorlijk recente data werken.

 

Open Data van het RIVM en het CBS

Ook het RIVM en het CBS bieden datasets als Open Data aan. Om een voorbeeld te geven van wat hiermee mogelijk is bouwden wij een Power BI dashboard om Coronabesmettingen binnen Nederland in beeld te brengen. Hier kun je het resultaat bekijken en zelf met het dashboard experimenteren.

 

 

Power BI Dashboard bouwen met twee datasets

Om dit Power BI dashboard te bouwen hebben we twee datasets gecombineerd. Allereerst die van het RIVM. Deze dataset biedt een overzicht van het aantal besmettingen per gemeente en provincie. De gegevens op zichzelf zijn niet zo maar te vergelijken. Tien besmettingen in Sint-Oedenrode staat uiteindelijk niet in verhouding tot tien besmettingen in Amsterdam.

 

Vergelijken per 100.000 inwoners

Om de gegevens vergelijkbaar te maken voegen we daarom data van CBS Open Data toe. Hier kunnen we inwonersaantallen per gemeente ophalen. Op basis daarvan kunnen we het aantal besmettingen per 100.000 inwoners per gemeente bepalen. Dan hebben we waarden die we onderling kunnen vergelijken.

 

Op het Dataregister van de Nederlandse Overheid zijn 20.399 databronnen beschikbaar.

 

20.399 databronnen beschikbaar

De overheid neemt Open Data heel serieus. Op het Dataregister van de Nederlandse Overheid zijn 20.399 databronnen beschikbaar. Die gegevens bestrijken alle denkbare aandachtsvelden zoals landbouw, huisvesting, sociale zekerheid, recht, onderwijs en wetenschap (om er maar een paar te noemen).

 

Vijf stappen naar data-analyse

Als organisatie staat het je vrij om deze gegevens in te zetten, onderling te combineren en te vergelijken met je eigen gegevens. Om die data te kunnen gebruiken moet het wel voorbewerkt worden. Binnen de data-analyse vraagt dat om vijf stappen:

  1. Extraheren;
  2. Transformeren;
  3. Inladen;
  4. Modeleren;
  5. Relateren en visualiseren.

Data extraheren en transformeren

Het extraheren van data heeft dankzij Open Data niet veel meer om het lijf dan een bron selecteren. De eerste lastige stap zit in het transformeren. Daarin bewerk je ruwe data tot een bruikbare vorm. Zo komen binnen de Coronacijfers van RIVM sommige gemeenten meermalen voor. Dat komt omdat verschillende datums in dezelfde tabel zijn opgenomen. De transformatie bestaat hier uit de meest recente datum kiezen om in te lezen.

 

Data modelleren

Als de gegevens getransformeerd zijn, kunnen ze in Power BI geladen worden. Daar kun je vervolgens gegevens modelleren. Bijvoorbeeld door besmettingen per gemeente in verband te brengen met aantal inwoners per gemeente en daar een gemiddelde per 100.000 uit te laten rekenen.

 

Als een dashboard eenmaal gebouwd is, dan kun je met een paar klikken de data verversen.

 

Data relateren en visualiseren

De gemodelleerde gegevens kun je vervolgens met elkaar vergelijken door ze te relateren. In deze stap koppel je bijvoorbeeld besmettingen per 100.000 inwoners aan tijd. Dan kun je het verloop van besmettingen over maanden in beeld brengen. Bij deze stap kun je ook visualiseren. Bijvoorbeeld door het aantal besmettingen te projecteren op een landkaart of ze weer te geven in een diagram.

 

Aan de slag met Power BI?

Het klinkt als een hoop werk, maar als een dashboard eenmaal gebouwd is, dan kun je met een paar klikken de data verversen en binnen de details zoeken. Zie je op tegen het voorwerk dat nodig is om een visualisatie te maken? Niet doen. Neem gewoon contact met ons op, en wij helpen je op weg. Veel makkelijker dan dat is datavisualisatie met Power BI niet te maken.