Lemonade est l’une des introductions en bourse les plus populaires de cette année et une raison clé en est les lourds investissements de l’entreprise dans l’IA (Intelligence artificielle). La société a utilisé cette technologie pour développer des robots pour gérer l’achat de polices et la gestion des réclamations.
Alors, comment une entreprise comme celle-ci crée-t-elle des modèles d’IA? Quel est le processus? Eh bien, comme cela ne devrait pas être surprenant, il est complexe et susceptible d’échec.
Mais là encore, il y a quelques principes clés à garder à l’esprit. Jetons donc un coup d’œil:
Sélection: Il y a des centaines d’algorithmes parmi lesquels choisir. Dans certains cas, la meilleure approche consiste à en utiliser plusieurs (c’est ce qu’on appelle la modélisation d’ensemble).
» Choisir le bon modèle commence par acquérir une compréhension approfondie de ce que l’organisation souhaite réaliser ”, a déclaré Shadi Sifain, responsable senior de la science des données et de l’analyse prédictive chez Paychex. » La sélection du bon modèle implique souvent d’équilibrer un certain nombre d’exigences, notamment les performances du modèle, la précision, l’interprétabilité et la puissance de calcul, entre autres facteurs. ”
Il est important de réaliser que vous avez besoin du bon type de données pour certains modèles. C’est l’un des plus grands défis du processus de développement de l’IA. ”En moyenne, le processus de préparation des données prend 2 fois ou dans certains cas 3 fois plus de temps que la conception de l’algorithme d’apprentissage automatique », a déclaré Valeria Sadovykh, responsable de la livraison mondiale des technologies émergentes chez PwC Labs.
Donc, dans les premières phases d’un projet, vous devez avoir une bonne idée des données. ” Effectuez une analyse exploratoire « , a déclaré Dan Simion, vice-président de l’analytique AI& chez Capgemini North America. « Visualisez les données en 2 dimensions et 3 dimensions, puis exécutez des statistiques simples et descriptives pour mieux comprendre les données. Ensuite, vérifiez les anomalies et les données manquantes. Nettoyez ensuite les données pour obtenir une meilleure image de la taille de l’échantillon. »
Mais il n’y a pas de modèle parfait, car il y aura toujours des compromis.
« Il existe un ancien théorème dans la communauté de l’apprentissage automatique et de la reconnaissance de formes appelé Théorème du déjeuner libre, qui stipule qu’il n’existe pas de modèle unique qui soit le meilleur pour toutes les tâches”, a déclaré le Dr Jason Corso, professeur de Génie électrique et d’informatique à l’Université du Michigan et co-fondateur et PDG de Voxel51. » Il est donc essentiel de comprendre les relations entre les hypothèses émises par un modèle et les hypothèses émises par une tâche. »
Formation: Une fois que vous avez un algorithme – ou un ensemble de ceux–ci -, vous souhaitez effectuer des tests par rapport à l’ensemble de données. La meilleure pratique consiste à diviser l’ensemble de données en au moins deux parties. Environ 70% à 80% sont destinés aux tests et au réglage du modèle. Le reste sera ensuite utilisé pour la validation. Grâce à ce processus, il y aura un regard sur les taux de précision.
La bonne nouvelle est qu’il existe de nombreuses plates-formes d’IA qui peuvent aider à rationaliser le processus. Il existe des offres open source, telles que TensorFlow, PyTorch, KNIME, Anaconda et Keras, ainsi que des applications propriétaires telles qu’Alteryx, Databricks, DataRobot, MathWorks et SAS. Et bien sûr, il existe de riches systèmes d’IA d’Amazon, Microsoft et Google.
« La clé est de rechercher des outils open source qui permettent une expérimentation facile et rapide”, a déclaré Monica Livingston, directrice des ventes d’IA chez Intel. » Si vous préférez acheter des solutions tierces, de nombreux ISV proposent des solutions basées sur l’IA pour des tâches telles que la reconnaissance d’images, les robots de discussion, la détection de défauts, etc. »
Ingénierie des fonctionnalités : C’est le processus de recherche des variables qui sont les meilleurs prédicteurs pour un modèle. C’est là que l’expertise d’un data scientist est essentielle. Mais il est également souvent nécessaire de faire appel à des experts du domaine.
« Pour réaliser l’ingénierie des fonctionnalités, le praticien qui construit le modèle doit avoir une bonne compréhension du problème en question, par exemple avoir une idée préconçue des prédicteurs efficaces possibles avant même de les découvrir à travers les données”, a déclaré Jason Cottrell, PDG de Myplanet. « Par exemple, dans le cas de la prévision des défauts de paiement pour les demandeurs de prêt, un prédicteur efficace pourrait être le flux de revenu mensuel du demandeur. »
Mais trouver les bonnes fonctionnalités peut être presque impossible dans certaines situations. Cela pourrait être le cas avec la vision par ordinateur, par exemple lorsqu’elle est utilisée avec des véhicules autonomes. Pourtant, l’utilisation d’un apprentissage profond sophistiqué peut être une solution.
« De nos jours, les réseaux de neurones sont utilisés pour apprendre des fonctionnalités, car ils comprennent mieux les statistiques que les humains”, a déclaré Eric Yeh, informaticien au Centre d’intelligence artificielle de SRI International. « Cependant, ils ne sont pas nécessairement une panacée et pourraient développer des caractéristiques qui n’étaient pas prévues aussi bien. L’exemple célèbre est le classificateur d’images qui a été développé pour détecter les chars et les jeeps. Au lieu de cela, il a appris à détecter nuit et jour puisque toutes les photos de jeep ont été prises dans la journée et toutes les photos de chars ont été prises au musée la nuit. »
Tom (@ttaulli) est conseiller auprès de startups et auteur de Artificial Intelligence Basics: A Non-Technical Introduction et du Robotic Process Automation Handbook: A Guide to Implementing RPA Systems. Il a également développé divers cours en ligne, comme pour le langage de programmation Python.
Suivez-moi sur Twitter ou LinkedIn. Consultez mon site Web ou certains de mes autres travaux ici.