Dans un monde de plus en plus connecté et automatisé, la computer vision joue un rôle crucial en permettant aux machines de comprendre et d'interagir avec leur environnement visuel.
La computer vision, ou vision par ordinateur en français, est un domaine de l'intelligence artificielle qui se concentre sur la création de systèmes capables de percevoir, interpréter et comprendre des informations visuelles à partir du monde réel. En combinant des techniques de traitement d'images et de reconnaissance des formes, la computer vision permet aux machines d'analyser et de traiter des images ou des vidéos de manière similaire à la perception humaine. Les applications de cette technologie sont vastes et incluent la reconnaissance faciale, la conduite autonome, l'inspection industrielle, et l'analyse de contenu visuel pour les réseaux sociaux. En intégrant des algorithmes avancés et des réseaux de neurones convolutifs, la computer vision transforme la manière dont les ordinateurs interagissent avec leur environnement visuel, ouvrant la voie à des innovations majeures dans divers secteurs industriels.
Dans moins d’une semaine, plus précisément le 13 mai 2024, commencera la nouvelle promotion d’Alyra pour les formations de développement et de consulting dédiées à l’intelligence artificielle.
À l’issue de chacune de nos formations, tous les apprenants d’une promotion (toutes formations confondues) doivent se mettre en groupe dans le but de créer un projet final, qui sera évalué par des professionnels de l'écosystème et qui décidera de la validation de leur formation.
Parmi tous les projets qui ont été présentés pour valider les parcours IA d’Alyra, nous vous proposons pour le sujet de cette semaine de regarder de plus près les projets de nos apprenants :
Killy, l'entraîneur sportif
Aujourd’hui, il existe un grand marché pour le sport, et aussi pour l’accompagnement personnalisé du sport.
Lorsqu’on cherche à suivre un entraînement sportif, il y a deux solutions :
- Regarder des vidéos en ligne. C’est accessible à n’importe qui, mais on ne peut pas avoir la certitude de s’entraîner correctement.
- Avoir recours à un coach sportif qui nous propose un programme et qui nous aide, mais ce n’est pas accessible à tous les budgets.
L’idée avec Killy est d’offrir un entraînement personnalisé en utilisant la vision par ordinateur pour analyser les mouvements de l'utilisateur et donner des conseils sur mesure.
Ce qui a été réalisé
Dans le cadre du projet, la réalisation s'est concentrée sur la reconnaissance de skieurs dans des environnements de ski.
Au lieu de développer un modèle de vision par ordinateur entièrement nouveau (ce qui prendrait beaucoup trop de temps). Un modèle de reconnaissance de personnes existant a été utilisé comme base.
Un modèle de vision par ordinateur existant a été affiné (fine-tuné) avec des données de personnes faisant du ski pour améliorer la précision de la détection.
L'objectif était de pouvoir détecter avec précision un skieur dans une photo ou une vidéo, en tant que première étape vers un coach virtuel pour le ski.
Green Guardian
Green Guardian est un système de gestion de déchets pour les villes. L'idée ici est de permettre à des villes de réduire les déchets sauvages, éduquer les citoyens et optimiser les processus de collecte et non pas uniquement de traitement.
Pour y parvenir, il y a une utilisation de la vision par ordinateur pour détecter les déchets (canettes, bouteilles, etc.) dans des images/vidéos de caméras de surveillance, et il est nécessaire de faire la distinction entre un déchet et un objet simplement posé.
Ce qui a été réalisé
Plus que de construire l’architecture du modèle, l’essentiel du travail consiste à capturer, collecter et traiter les données.
Par conséquent, il y a une utilisation de banques de données existantes comme Kaggle, qui permet de gagner beaucoup de temps plutôt que de collecter et créer ses propres données représentatives du contexte cible.
Ensuite, il faut combiner des sources variées pour avoir un panel de données représentatif, et éviter d’intégrer des données de mauvaise qualité.
En effet, on entend souvent “Garbage in, garbage out” signifiant que si on intègre de mauvaises données, on aura de mauvaises réponses. Une centaine d'images de bonne qualité et bien traitées par type de détritus est suffisante.
En termes de résultats, l’équipe du projet a conçu un modèle ayant plus de 86% de précision pour la détection de canettes et bouteilles en plastique. En sachant qu’à partir d’un taux de 90-95% de précision, un modèle est considéré viable pour un usage professionnel.
Le projet final n'est qu'un début
Les projets présentés ci-dessus ne sont que deux exemples parmi la multitude de projets que nous avons évalués pour les soutenances des formations IA.
Nos apprenants doivent accomplir ce type de projet afin de valider leur formation. Il faut garder à l’esprit que tous ces projets ont été réalisés en un temps limité. La majeure partie des formations d’Alyra est dédiée à l’apprentissage, par conséquent les groupes n’ont eu que quelques semaines pour concevoir leur projet et leur présentation, et nous pouvons d’autant mieux les féliciter pour cela.
Cela n’empêche pas les projets finaux d’évoluer. En effet, les exemples montrés dans le cadre de cette édition peuvent être poursuivis par les apprenants qui les ont réalisés.
Pour reprendre l’exemple de Green Guardian, l’équipe peut peaufiner le projet afin d’avoir un taux de précision satisfaisant pour un usage professionnel ou d’entreprise.
Si tel n'était pas le cas, les apprenants ayant réalisé leur projet final peuvent mettre leurs travaux en avant pour trouver des opportunités professionnelles dans le domaine de l’IA.
Pour finir, la plupart des apprenants avaient très peu de connaissances techniques dans le domaine de l’IA avant de débuter notre formation, et sont parvenus à concevoir ce type de projet final pour valider leur formation.
Webinar gratuit
Nos experts répondent à vos questions sur l'intelligence artificielle !
S'inscrire au Webinaire