Un avant-goût du futur
L’intelligence artificielle est déjà au cœur de nombreuses applications, mais les chercheurs continuent de l’améliorer en développant des modèles de fondation, modèle entraîné sur une grande quantité de données.
L’intelligence artificielle (IA) est-elle une technologie d’avenir pour un futur lointain ? Oui et non. Non, parce que l’IA est déjà entrée dans nos vies depuis longtemps. Elle est notamment présente dans les applications de reconnaissance faciale qui déverrouillent nos smartphones, dans les services de traduction qui transposent en quelques secondes divers textes et documents dans une multitude de langues avec une qualité sans précédent, et dans les chatbots comme ChatGPT ou Copilot qui offrent aux élèves et aux étudiants de nouvelles possibilités pour faire leurs devoirs.
Ces trois applications ne sont pas programmées selon une structure conditionnelle classique. Elles s’appuient sur d’importants volumes de données d’entraînement, de vastes processus d’apprentissage et des algorithmes reposant sur des réseaux neuronaux très complexes. Un algorithme d’IA ne donne jamais un résultat binaire du type « 0 » ou « 1 ». Il calcule la probabilité qu’une prévision mathématique soit correcte. Et cette probabilité n’atteint jamais 100 %. L’intelligence artificielle fait des erreurs, aussi infimes soient-elles. C’est pourquoi les résultats qu’elle fournit exigent un examen critique, sans pour autant nier l’énorme potentiel de cette nouvelle technologie. L’IA permet de calculer des solutions pratiques adaptées, même dans des conditions extrêmement complexes. Elle s’apparente donc plutôt à un collègue intelligent, qui possède de nombreuses connaissances, mais qui peut aussi se tromper.
L’IA a également fait son entrée dans le secteur de la logistique. Le DACHSER Enterprise Lab de l’institut Fraunhofer IML développe depuis déjà plus de six ans des algorithmes capables de prévoir 25 semaines à l’avance le volume d’envois traités par le réseau de groupage de DACHSER. Les chercheurs ont par ailleurs créé un système de reconnaissance d’images permettant d’identifier, de localiser et de mesurer en temps réel les colis dans les entrepôts. Chez DACHSER, les logisticiens et les experts en processus collaborent étroitement avec des mathématiciens et des développeurs de logiciels pour mettre en œuvre la stratégie de l’entreprise en matière d’IA. Une approche très prometteuse.
De nouvelles possibilités inédites
L’intelligence artificielle n’en demeure pas moins une technologie d’avenir. Des modèles innovants offrent régulièrement de nouvelles possibilités inédites, comme les modèles de fondation. Ces grands modèles d’intelligence artificielle entraînés sur un grand volume de données issues d’Internet sont capables de comprendre et de générer des textes et des images. Ainsi, les grands modèles de langage (LLM) comme ChatGPT laissent à penser qu’ils disposent d’une certaine « intelligence », mais en réalité ils reposent sur une fonction mathématique qui prédit des phrases porteuses de sens.
Dans le domaine de l’intelligence artificielle (IA), un modèle de fondation est un grand modèle pré-entraîné sur d’importants ensembles de données, capable de réaliser de multiples tâches. Il existe différents types de modèles de fondation, tels que les grands modèles de langage (LLM) et les modèles de traitement des images. « GPT-4 » d’OpenAI, « Gemini (anciennement Bard) » et « Bert » de Google ainsi que « Llama3 » de Meta sont des LLM spécialisés dans la compréhension et la génération du langage naturel. Les modèles visuels tels que Sora et DALL-E d’OpenAI sont conçus pour générer des vidéos et des images à partir d’instructions textuelles libres (prompts). Les modèles de fondation sont souvent adaptés à des tâches ou à des ensembles de données spécifiques, destinés à des applications spécialisées.
Ces modèles fournissent cependant des résultats impressionnants et offrent d’infinies possibilités encore inexplorées. Dans le domaine de la robotique, diverses expériences visent à développer des modèles de fondation permettant de communiquer avec des véhicules autonomes et de les contrôler. Les robots seraient ainsi en mesure d’effectuer plus efficacement certaines tâches complexes comme le traitement de la voix, la reconnaissance d’images et d’objets ou la navigation autonome. Ces modèles leur permettent d’apprendre à partir de grandes quantités de données pour s’adapter à de nouveaux environnements et à de nouvelles tâches, augmentant ainsi leur flexibilité et leur polyvalence. Peut-être permettront-ils bientôt de piloter les véhicules autonomes de manière plus intuitive et plus efficace dans les entrepôts. De nombreux projets de recherche y travaillent activement dans le monde entier.
Des résultats plus précis
La génération augmentée de récupération ou RAG (Retrieval-Augmented Generation) est au cœur de nombreux projets de recherche visant à améliorer les résultats des modèles de fondation. Cette dernière met à disposition des LLM des sources de données et de connaissances de meilleure qualité en fonction de leur application. Cette approche évite aux LLM d’inventer un résultat lorsqu’ils ne peuvent pas calculer une solution ayant une forte probabilité d’être correcte. Ce comportement appelé « hallucination » peut nuire à la confiance des utilisateurs dans l’IA.
Les nouvelles recherches promettent d’étendre encore les possibilités d’utilisation de l’intelligence artificielle. Cependant, elles devront tenir compte du coût de certains modèles exigeant une forte puissance de calcul, ainsi que du nouveau règlement de l’UE sur l’intelligence artificielle (AI Act). Le déploiement de l’IA dans l’économie et la société ne fait que commencer, mais il présente déjà de nombreux enjeux.
Autor: Andre Kranke, Head of Corporate Research & Development chez DACHSER