Bouw een Data Science Business Case met Geodata

Ivo de Liefde

Esri Certified Professional

Data science is populair. Steeds meer organisaties ontdekken de voordelen en hebben teams opgezet om in deze trend mee te gaan. Dit doen zij om de potentie van de grote hoeveelheid beschikbare data en rekenkracht te kunnen benutten. Zo worden oplossingen gebouwd om zelfs de meest complexe taken te automatiseren en om inzichten te verzamelen die voorheen door allerlei beperkingen ondenkbaar waren. Dat is de kracht van data science. Maar wist je dat data science vele malen krachtiger wordt als het geografische data bevat?

Maar veel organisaties lukt het niet of onvoldoende om data science goed op de rit te krijgen. In dit artikel leg ik uit wat het belang is van geo data in het proces van data science en hoe alles begint met het bouwen van een goede business case.Het vakgebied van data science is breed, wat de term data science een containerbegrip maakt. Hierbij worden data analytics, machine learning, Artificial Intelligence (AI) en robotica frequent door elkaar gehaald worden wat de nodige spraakverwarring veroorzaakt. Wij hanteren de definitie dat data science de overkoepelende term is voor het vakgebied dat zich richt op het halen van waarde uit data door middel van algoritmen en wetenschappelijke methoden. Hierbij gaat het vaak om het herkennen van complexe patronen in grote hoeveelheden data.

Omdat een groot deel van de data waar we mee werken een locatiecomponent bevat is het van belang geografische patronen hier ook in mee te nemen. Alleen met toevoeging van het locatiecomponent van data zie je het volledige verhaal. Hoever is jouw organisatie met geo data? Om hier achter te komen schreven we eerder het artikel 'Data Science en Geo data, hoever is jouw organisatie?'. 

We gaan nu verder in op het stappenplan voor de business case. We behandelen deze stappen ook in ons webinar 'Creëer een Data Science Business Case met Geodata'. 

C2A-Webinar-Creëer-een-data-science-business-case-met-geodata-wit

De stappen voor een goede data science business case

Het waarmaken van de potentie van data science is niet eenvoudig. Dit komt doordat data vaak verspreid is door de organisatie in individuele silo’s. Deze data is daardoor moeizaam bij elkaar te brengen. Ook zien we vaak dat nog niet iedereen binnen de organisatie bereid is om inzichten uit data te adopteren en processen aan te passen.

Het aantonen van een solide business case is daarom van essentieel belang om een succesvol product te kunnen neerzetten. In dit artikel nemen we je aan de hand van een bestaande data science case van een utility organisatie mee door de stappen die nodig zijn om een goede business case neer te zetten.

Data Science stappen

1. Spot & benoem
Het bouwen van een data science business case begint bij het vinden/formuleren van een geschikte probleemstelling. en het omzetten van dit probleem naar een concrete uitdaging.

In ons voorbeeld nemen we het maatschappelijke probleem van waterschaarste. Waterschaarste is in Nederland al vele jaren een veel besproken probleem. Dit varieert van wetenschappelijke betogen over de schade van waterschaarste tot aan oproepen om zo min mogelijk drinkwater te gebruiken om de leidingdruk op peil te kunnen houden.

Waterbedrijven kunnen verspilling van water tegengaan door ervoor te zorgen dat zoveel mogelijk gezuiverd water daadwerkelijk uit de kraan van de consument komt. Water dat verloren gaat in het proces van drinkwaterdistributie wordt ook wel ‘Niet In Rekening Gebracht water’ (NIRG) genoemd. In Nederland is afhankelijk van de regio sprake van een percentage NIRG van 5% tot wel 10%. Zou dit percentage omlaag gebracht kunnen worden met behulp van data science?

2. Onderzoek
Om de vraag rondom de uitdaging te kunnen beantwoorden is verder onderzoek vereist. Wat is NIRG precies? Het is het verschil tussen de hoeveelheid gezuiverd en gefactureerd water. Het wordt onder andere gebruikt als een performance indicator voor water utilities. NIRG wordt vaak uitgedrukt in het percentage verschil ten opzichte van het totale volume aan geproduceerd drinkwater. Het heeft een sterk ruimtelijk component, aangezien het water ergens in de duizenden kilometers aan distributieleidingnet verloren gaat. De uitdaging is om op te sporen waar het verlies plaatsvindt en waarom. Wat opvalt is dat de vraag nu al een locatiecomponent bevat.

Nog een stap verder gaat de vraag welke factoren allemaal bijdragen aan het verlies van water. Dit kan uiteen worden gezet in de categorieën fysieke verliezen en schijnverliezen. Fysieke verliezen zijn bijvoorbeeld lekkages aan het distributienet, die soms direct opgemerkt worden maar soms ook lang onzichtbaar blijven. Ook vallen in deze categorie de werkzaamheden die tot waterverliezen leiden zoals spuien.

Schijnverliezen zijn situaties waarbij door administratieve fouten een verlies zichtbaar is, zonder dat er daadwerkelijk water verloren is gegaan. Hierbij kan worden gedacht aan watermeters die onnauwkeurige standen doorgeven of fouten die in het facturatieproces plaatsvinden, waardoor een deel van het water niet correct in rekening wordt gebracht. Daar bovenop kan het ook het nog geval zijn dat een consument water afneemt voordat het door de meter wordt geregistreerd. Indien dit bewust gebeurt is er sprake van diefstal van drinkwater.

3. Verken & test
Om tot een mogelijke oplossing te komen die het percentage NIRG naar beneden kan brengen is er vanuit de data science tribe een korte brainstorm sessie georganiseerd om potentiële oplossingen te verkennen. De data science tribe is een van de kennisgroepen binnen Tensing die iedere maand samenkomt om bij te praten over de laatste innovaties binnen het vakgebied en om hier direct mee te experimenteren.

In de sessie over NIRG zijn veel verschillende ideeën naar boven gekomen die zouden kunnen worden uitgevoerd om het probleem aan te pakken. Van het bouwen van een predictive maintenance model om de kans op leiding lekkage te voorspellen tot het kwalitatief analyseren van een specifiek DMA (hydraulisch geïsoleerde zone in het leidingnet) om een beter beeld te krijgen van de mate waarin de verschillende factoren die in het onderzoek naar voren zijn gekomen een rol spelen. Dit kan helpen bij het bepalen van welke vervolgprojecten het belangrijkst zijn om op door te pakken. Door met domeinexperts de veelbelovende ideeën te toetsen en deze met beschikbare data te testen kan de keuze voor een specifieke oplossing worden gemaakt.

4. Kwantificeer
Om het verhaal rond te maken is het nodig om te kwantificeren wat door het uitvoeren van dit project bereikt kan worden. Stel dat een gemiddeld waterbedrijf zo'n 3,4 miljard liter per week levert. Dat betekent 3,4 miljoen kuub per week, wat 176,8 miljoen kuub per jaar is. Indien er nu sprake is van 5% verlies op jaarbasis, gaat er 8,8 miljoen kuub verloren, wat grofweg een waarde vertegenwoordigt van een omzet van 12,3 miljoen Euro. Indien we m.b.v. de onderzochte oplossing een besparing van 0.2% kunnen realiseren levert dit €500.000 extra omzet op.

In dit artikel hebben we aan de hand van een voorbeeld laten zien hoe een business case kan worden opgebouwd voor een data science project. We liepen hiervoor 4 stappen door: spot & benoem een uitdaging, onderzoek de probleemstelling, verken & test potentiële oplossingen en kwantificeer tot slot de waarde die kan worden gerealiseerd door (een van) de oplossingen neer te zetten.

In ons gelijknamige webinar gaan we verder in op dit stappenplan en de mogelijkheden van Geo AI. Download de recording voor meer informatie. 

C2A-Webinar-Creëer-een-data-science-business-case-met-geodata

Over Tensing

Tensing maakt Data Integratie technologie en Geografische Informatie Systemen (GIS) toegankelijk en toepasbaar. Onze consultants realiseren state-of-the-art oplossingen op basis van Esri ArcGIS en Safe Software FME.

Met Esri maken wij kaarten, stimuleren we samenwerking en analyseren we data. Met FME verbinden wij applicaties, transformeren we data en automatiseren we workflows.

Volg ons op LinkedIn

Ontvang alle updates per mail

© 2021 Tensing | Privacy Policy | Cookie Policy