Reconnaissance d'objets avec Deep Learning pour plus d'efficacité

Tensing

Plan a call on this topic with Dominique GoesDe nombreuses organisations s'emploient à optimiser leurs processus (de travail). Les raisons qui les poussent à le faire diffèrent d'une entreprise à l'autre. Certaines doivent continuer à fournir des biens et des services dans le cadre d'un marché du travail tendu ; d'autres doivent se concentrer sur la réduction des émissions de CO2 pour atteindre leurs objectifs en matière de climat. Les dernières technologies qui les aident à optimiser leurs opérations représentent une boîte à outils importante - contenant, entre autres, l'internet des objets et le cloud, mais aussi l'apprentissage automatique et l'intelligence artificielle.

Dans ce billet de blog, nous expliquons comment reconnaître des voitures sur des photos aériennes avec TensorFlow et Keras, en alimentant un modèle statistique avec des exemples. Pour la détection de voitures dans des photos aériennes ortho avec Keras, nous avons réalisé une preuve de concept (POC) en collaboration avec Stedin pour démontrer les possibilités.

RECONNAISSANCE D'OBJETS DANS LES PHOTOS AÉRIENNES

L'intelligence artificielle (IA) devient de plus en plus importante dans le domaine de la géographie et des SIG. En raison de la grande quantité de données disponibles, l'analyse de données de haute qualité devient de plus en plus importante. En outre, nous constatons que presque toutes les informations ont une composante de localisation. La technologie nous permet d'utiliser l'apprentissage automatique (ML) et l'IA pour identifier des objets sur des photographies aériennes sur la base de modèles statistiques.

ENJEU

Les infrastructures en surface sont placées de telle sorte que les risques de collision sont minimes. Cela signifie que cette infrastructure est protégée contre les collisions par l'installation de poteaux ou d'une glissière de sécurité. Dans de nombreux cas, l'infrastructure peut également être placée hors de portée du trafic, derrière des buissons ou dans un espace vert. Cependant, la situation au moment de la construction n'est pas toujours la même - par exemple, les buissons peuvent être enlevés et remplacés par un parking. Cela augmente les risques de collision, mais ces situations ne sont pas toujours annoncées. La recherche automatique de ces changements est donc préférable

ENSEMBLE DE DONNÉES ET TRAITEMENT DES DONNÉES

L'ensemble de données est constitué de photos aériennes provenant du Web Map Service PDOK à l'échelle nationale. Le point de départ de l'apprentissage automatique est la disponibilité d'un ensemble de données d'entraînement avec des exemples. ArcGIS Pro facilite la mise à disposition des données des photos aériennes avec un minimum d'actions manuelles, à l'aide de l'outil  "Exporter les données d’entraînement pour le Deep Learning". Les photos étiquetées qui en résultent (d'une taille de 28 * 28 * 3 - hauteur * longueur * RVB) sont reconnues par l'ordinateur, qui sait si une voiture peut être vue ou non. Nous pouvons ainsi commencer à utiliser l'apprentissage profond.

Des images de Deep Learning qui reconnaissent ce qui est une voiture et ce qui ne l'est pas

CLASSIFICATION DES PHOTOS AVEC KERAS CNN

Avec un simple réseau neuronal convolutif (CNN), il est possible de reconnaître des objets sur les photos aériennes. Keras, une bibliothèque d'apprentissage profond en Python (basée sur Tensorflow), est le cadre avec lequel nous avons développé ce CNN.

blog-ivo-deep-learning-classificatie

CNN typique : Aphex34, CC BY-SA 4.0, https://commons.wikimedia.org/w/index.php?curid=45679374

RÉsultats

Le résultat du modèle est qu'il reconnaît les voitures avec une précision d'environ 96 % sur l'ensemble des données de test. Le graphique suivant montre les tuiles des données de test, où notre modèle a reconnu la voiture :

blog-ivo-deep-learning-result

Avec une grande précision, il y a toujours des situations où les prédictions sont incorrectes. Dans les deux images ci-dessous de l'ensemble de test, les voitures sont étiquetées, mais le modèle ne les reconnaît pas. En améliorant encore le modèle, ce type d'erreur (faux positifs et faux négatifs) peut être évité plus souvent :

blog-ivo-deep-learning-optimization

PROCHAINES ÉTAPES

Les bons résultats de ce POC montrent la puissance de ces types de modèles. La boîte de délimitation actuellement utilisée dépend des photos segmentées. Elle ne détecte pas encore exactement quels pixels représentent une voiture, mais seulement si une voiture est visible sur la photo. L'algorithme YOLO permet d'obtenir un résultat plus ciblé. En outre, il existe de nombreuses autres applications pratiques pour cette technologie, telles que la détection de panneaux solaires ou d'autres types d'objets.

La connaissance du domaine géospatial est de plus en plus demandée dans les équipes de science des données. La puissance de la géographie combinée aux derniers développements en matière de ML et d'IA crée de nombreuses opportunités pour obtenir encore plus d'informations à partir des données.


Voulez-vous en savoir plus sur la façon dont ce modèle est construit ? Avez-vous besoin d'aide avec les données géospatiales dans votre équipe de data scientists ? Contactez-nous et dites-nous comment nous pouvons aider votre entreprise à prospérer dans ce nouvel environnement.

TAGS: Innovation, blog

Vous voulez en savoir plus sur ce sujet ?

Dans ce cas, prenez immédiatement un rendez-vous sans engagement avec notre spécialiste !