Construire un business case avec des données géographiques

Tensing

La science des données est en vogue. De plus en plus d'organisations en découvrent les avantages et ont mis en place des équipes pour suivre cette tendance. Elles le font afin d'exploiter le potentiel de la grande quantité de données et de la puissance de calcul disponibles. Ainsi, des solutions sont élaborées pour automatiser les tâches les plus complexes et pour recueillir des informations qui étaient auparavant impensables en raison de toutes sortes de limitations. C'est le pouvoir de la science des données. Mais saviez-vous que la science des données devient beaucoup plus puissante lorsqu'elle inclut des données géographiques ?

Cependant, de nombreuses organisations ne parviennent pas à mettre en œuvre la science des données, ou ne parviennent pas à la mettre en œuvre correctement. Dans cet article, j'explique l'importance des données géographiques dans le processus de la science des données et comment tout commence par l'élaboration d'une bonne analyse de rentabilité.

Le domaine de la science des données est vaste, ce qui fait de ce terme un fourre-tout. L'analyse des données, l'apprentissage automatique, l'intelligence artificielle (IA) et la robotique sont souvent confondus, ce qui crée beaucoup de confusion. Nous utilisons la définition suivante : la science des données est le terme générique pour le domaine qui se concentre sur l'extraction de la valeur des données au moyen d'algorithmes et de méthodes scientifiques. Il s'agit souvent de reconnaître des schémas complexes dans de grandes quantités de données.

Étant donné qu'une grande partie des données avec lesquelles nous travaillons contient une composante de localisation, il est important d'inclure des modèles géographiques. Ce n'est qu'avec l'ajout de la composante géographique des données que l'on obtient une vue d'ensemble. Où en est votre organisation avec les données géographiques ? Pour le savoir, nous avons précédemment écrit l'article "Data science et données géographiques, où en est votre organisation?".

LES ÉTAPES D'UNE BONNE ANALYSE DE RENTABILITÉ DE LA SCIENCE DES DONNÉES

Il n'est pas facile de réaliser le potentiel de la science des données. En effet, les données sont souvent dispersées dans l'ensemble de l'organisation dans des silos individuels. Il est donc difficile de rassembler les données. Nous constatons aussi souvent que tout le monde au sein de l'organisation n'est pas prêt à adopter les connaissances sur les données et à adapter les processus.

Il est donc essentiel de présenter une analyse de rentabilité solide pour assurer la réussite d'un produit. Dans cet article, nous vous présentons les étapes nécessaires à l'élaboration d'un bon dossier commercial, sur la base d'un dossier de science des données existant au sein d'une entreprise de services publics.

1. Repérer et nommer
L'élaboration d'une analyse de rentabilisation de la science des données commence par la recherche et la formulation d'un énoncé de problème approprié et par la conversion de ce problème en un défi concret.

Dans notre exemple, nous prenons le problème social de la pénurie d'eau. La pénurie d'eau est un problème largement débattu aux Pays-Bas depuis de nombreuses années. Cela va des arguments scientifiques sur les dommages causés par le manque d'eau aux appels à utiliser le moins d'eau potable possible afin de maintenir la pression dans les canalisations.

Les compagnies des eaux peuvent réduire le gaspillage d'eau en veillant à ce qu'un maximum d'eau traitée sorte effectivement des robinets des consommateurs. L'eau perdue dans le processus de distribution de l'eau potable est également appelée "eau non facturée" (NIRG). Aux Pays-Bas, selon les régions, le pourcentage d'eau non facturée varie de 5 à 10 %. Ce pourcentage pourrait-il être réduit avec l'aide de la science des données ?

2. La recherche
Des recherches supplémentaires sont nécessaires pour répondre au défi. Qu'est-ce que le NIRG exactement ? C'est la différence entre la quantité d'eau traitée et la quantité d'eau facturée. Il est utilisé, entre autres, comme indicateur de performance pour les services d'eau. Le CNRG est souvent exprimé en pourcentage de différence par rapport au volume total d'eau potable produite. Il a une forte composante spatiale, car l'eau est perdue quelque part sur les milliers de kilomètres du réseau de canalisations de distribution. Le défi consiste à déterminer où la perte se produit et pourquoi. Ce qui est frappant, c'est que la question a déjà une composante géographique.

En allant plus loin, la question demande quels sont les facteurs qui contribuent à la perte d'eau. Ces facteurs peuvent être divisés en deux catégories : les pertes physiques et les pertes fictives. Les pertes physiques sont, par exemple, les fuites sur le réseau de distribution, qui sont parfois remarquées immédiatement, mais qui restent parfois invisibles pendant longtemps. Entrent également dans cette catégorie les opérations qui entraînent des pertes d'eau, comme le spudding.

Les pertes apparentes sont des situations où une perte est visible en raison d'erreurs administratives, sans qu'il y ait réellement de perte d'eau. Il s'agit par exemple de compteurs d'eau qui transmettent des relevés inexacts ou d'erreurs dans le processus de facturation, à la suite desquelles une partie de l'eau n'est pas correctement facturée. En outre, il peut arriver qu'un consommateur consomme de l'eau avant qu'elle ne soit enregistrée par le compteur. Si cela se produit intentionnellement, il s'agit d'un vol d'eau potable.

3. Explorer et tester
Afin de trouver une solution possible pour réduire le pourcentage de CNRG, la tribu de la science des données a organisé une courte session de brainstorming pour explorer des solutions potentielles. La tribu de la science des données est l'un des groupes de connaissances de Tensing qui se réunit chaque mois pour se tenir au courant des dernières innovations dans le domaine et pour les expérimenter directement.

Lors de la session sur le NIRG, de nombreuses idées différentes ont émergé et pourraient être mises en œuvre pour résoudre le problème. Qu'il s'agisse de construire un modèle de maintenance prédictive pour prévoir la probabilité de fuites dans les canalisations ou d'analyser qualitativement une DMA spécifique (zone hydrauliquement isolée dans le réseau de canalisations) pour avoir une meilleure idée de la mesure dans laquelle les différents facteurs qui sont apparus dans l'étude jouent un rôle. Cela peut aider à déterminer quels sont les projets de suivi les plus importants à poursuivre. En travaillant avec des experts du domaine pour tester les idées prometteuses et les confronter aux données disponibles, le choix d'une solution spécifique peut être fait.

4. Quantifier
Pour compléter l'histoire, il est nécessaire de quantifier ce qui peut être réalisé en menant à bien ce projet. Supposons qu'une société de distribution d'eau moyenne fournisse environ 3,4 milliards de gallons par semaine. Cela signifie 3,4 millions de mètres cubes par semaine, soit 176,8 millions de mètres cubes par an. S'il y a une perte de 5 % sur une base annuelle, 8,8 millions de mètres cubes sont perdus, ce qui représente approximativement un chiffre d'affaires de 12,3 millions d'euros. Si nous parvenons à réaliser une économie de 0,2 % avec la solution étudiée, cela se traduira par un chiffre d'affaires supplémentaire de 500 000 euros.

Dans cet article, nous avons utilisé un exemple pour montrer comment un business case peut être construit pour un projet de science des données. Pour ce faire, nous avons suivi 4 étapes : identifier et nommer un défi, rechercher l'énoncé du problème, explorer et tester des solutions potentielles et enfin quantifier la valeur qui peut être réalisée en mettant en place (l'une des) solutions.

Construire un business case avec des données géographiques

Tensing

LES ÉTAPES D'UNE BONNE ANALYSE DE RENTABILITÉ DE LA SCIENCE DES DONNÉES

TAGS: Spatial Data Science, data science

Vous voulez en savoir plus sur ce sujet ?

Dans ce cas, prenez immédiatement un rendez-vous sans engagement avec notre spécialiste !