Les tâches relevant de l’IA sont parfois très simples pour les humains, comme par exemple reconnaître et localiser les objets dans une image, planifier les mouvements d’un robot pour attraper un objet, ou conduire une voiture. Elles requièrent parfois de la planification complexe, comme par exemple pour jouer aux échecs ou au Go. Les tâches les plus compliquées requièrent beaucoup de connaissances et de sens commun, par exemple pour traduire un texte ou conduire un dialogue.
Depuis quelques années, on associe presque toujours l’intelligence aux capacités d’apprentissage. C’est grâce à l’apprentissage qu’un système intelligent capable d’exécuter une tâche peut améliorer ses performances avec l’expérience. C’est grâce à l’apprentissage qu’il pourra apprendre à exécuter de nouvelles tâches et acquérir de nouvelles compétences.
Le domaine de l’IA n’a pas toujours considéré l’apprentissage comme essentiel à l’intelligence. Par le passé, construire un système intelligent consistait à écrire un programme « à la main » pour jouer aux échecs (par recherche arborescente), reconnaître des caractères imprimés (par comparaison avec des images prototypes), ou faire un diagnostic médical à partir des symptômes (par déduction logique à partir de règles écrites par des experts). Mais cette approche « manuelle » a ses limites. » A travers ce dossier, nous verrons les enjeux et quelques actualités sectorielles de l’Intelligence Artificielle.
Selon Yann LeCun, « les opportunités sont telles que l’IA, particulièrement l’apprentissage profond, est vue comme une technologie d’importance stratégique pour l’avenir. Les progrès en vision par ordinateur ouvrent la voie aux voitures sans chauffeur, et à des systèmes automatisés d’analyse d’imagerie médicale. D’ores et déjà, certaines voitures haut de gamme utilisent le système de vision de la compagnie israélienne MobilEye qui utilise un réseau convolutif pour l’assistance à la conduite. Des systèmes d’analyse d’images médicales détectent des mélanomes et autres tumeurs de manière plus fiable que des radiologues expérimentés. Chez Facebook, Google et Microsoft, des systèmes de reconnaissance d’image permettent la recherche et l’organisation des photos et le filtrage d’images violentes ou pornographiques. Depuis plusieurs années déjà, tous les moteurs de reconnaissance vocale sur smartphone utilisent l’apprentissage profond. Des efforts considérables de R&D sont consacrés au traitement du langage naturel : la compréhension de texte, les systèmes de question-réponse, les systèmes de dialogue pour les agents virtuels, et la traduction automatique. Dans ce domaine, la révolution de l’apprentissage profond a été annoncée, mais n’est pas encore achevée. Néanmoins, on assiste à des progrès rapides. Dans la dernière compétition internationale de traduction automatique, le gagnant utilisait un réseau récurrent ».
Toujours selon le chercheur, « malgré tous ces progrès, nous sommes encore bien loin de produire des machines aussi intelligentes que l’humain, ni même aussi intelligentes qu’un rat.
Bien sûr, nous avons des systèmes qui peuvent conduire une voiture, jouer aux échecs et au Go, et accomplir d’autres tâches difficiles de manière plus fiable et rapide que la plupart des humains (sans parler des rats). Mais ces systèmes sont très spécialisés. Un gadget à 30 euros nous bat à plate couture aux échecs, mais il ne peut faire rien d’autre.
Ce qui manque aussi aux machines, c’est la capacité à apprendre des tâches qui impliquent non seulement d’apprendre à représenter le monde, mais aussi à se remémorer, à raisonner, à prédire, et à planifier. Beaucoup de travaux actuels à Facebook AI Research et à DeepMind sont focalisés sur cette question. Une nouvelle classe de réseaux neuronaux, les Memory-Augmented Recurrent Neural Nets (réseaux récurrents à mémoire) est utilisée de manière expérimentale pour la traduction, la production de légendes pour les images, et les systèmes de dialogues.
Mais ce qui manque principalement aux machines, c’est le sens commun, et la capacité à l’intelligence générale qui permet d’acquérir de nouvelles compétences, quel qu’en soit le domaine.
Mon opinion, qui n’est partagée que par certains de mes collègues, est que l’acquisition du sens commun passe par l’apprentissage non supervisé. Qu’il soit naturel ou artificiel, il y a trois formes principales d’apprentissage. Nous avons déjà parlé de l’apprentissage supervisé. Les deux autres formes sont l’apprentissage par renforcement, et l’apprentissage non supervisé. L’apprentissage par renforcement désigne la situation où la machine ne reçoit qu’un simple signal, une sorte de récompense, indiquant si la réponse produite était correcte ou pas. Le scénario est similaire à l’entraînement d’un animal de cirque à qui l’on donne une friandise lorsqu’il exécute l’action désirée. Cette forme d’apprentissage nécessite de très nombreux essais, et est utilisée principalement pour entraîner les machines à jouer à des jeux (par exemple les jeux vidéo ou le jeu de Go), ou à opérer dans des environnements simulés. On a assisté à un succès éclatant de l’apprentissage par renforcement combiné à l’apprentissage profond lors de la victoire récente du programme de Go AlphaGo de Deep-Mind face au champion européen. L’apprentissage non supervisé, quant à lui, est le mode principal d’apprentissage des animaux et des humains. C’est l’apprentissage que nous faisons par nous-mêmes en observant le monde et en agissant. C’est en observant le monde que nous apprenons qu’il a trois dimensions, que des objets peuvent en cacher d’autres, que certains objets peuvent être déplacés, qu’un objet sans support tombe, qu’un objet ne peut pas être à deux endroits en même temps, etc.
C’est grâce à l’apprentissage non supervisé que nous pouvons interpréter une phrase simple comme « Jean prend son portable et sort de la pièce ». On peut inférer que Jean et son portable ne sont plus dans la pièce, que le portable en question est un téléphone, que Jean s’est levé, qu’il a étendu sa main pour attraper son portable, qu’il a marché vers la porte. Il n’a pas volé, il n’est pas passé à travers le mur. Nous pouvons faire cette inférence, car nous savons comment le monde fonctionne. C’est le sens commun. Comment acquérir ce sens commun ? Une hypothèse possible est l’apprentissage prédictif.
Si l’on entraîne une machine à prédire le futur, elle ne peut y arriver qu’en élaborant une bonne représentation du monde et de ses contraintes physiques. Dans un scénario d’apprentissage prédictif, on montre à la machine un segment de vidéo, et on lui demande de prédire quelques images suivantes. Malheureusement, le futur est impossible à prédire exactement et la machine s’en tient à produire une image floue, une mixture de tous les futurs possibles.
Si l’intelligence est un gâteau au chocolat, le gâteau lui-même est l’apprentissage non supervisé, le glaçage est l’apprentissage supervisé, et la cerise sur le gâteau est l’apprentissage par renforcement. Les chercheurs en IA sont dans la même situation embarrassante que les physiciens : 95 % de la masse de l’univers est de nature complètement inconnue : matière noire et énergie noire. La matière noire de l’IA est la génoise au chocolat de l’apprentissage non supervisé.
Tant que le problème de l’apprentissage non supervisé ne sera pas résolu, nous n’aurons pas de machine vraiment intelligente. C’est une question fondamentale scientifique et mathématique, pas une question de technologie. Résoudre ce problème pourra prendre de nombreuses années ou plusieurs décennies. En vérité, nous n’en savons rien ».
Pour Yann LeCun, « si nous arrivons à concevoir des techniques d’apprentissage machine aussi générales et performantes que celle de la nature, à quoi ressem-bleront les machines intelligentes de demain ? »
A cette question, il répond qu’il est « très difficile d’imaginer une entité intelligente qui n’ait pas toutes les qualités et les défauts des humains, car l’humain est notre seul exemple d’entité intelligente. Comme tous les animaux, les humains ont des pulsions et des instincts gravés dans le cerveau reptilien par l’évolution pour la survie de l’espèce.
Nous avons l’instinct de préser-vation, nous pouvons devenir violents lorsque nous sommes menacés, nous désirons l’accès aux ressources pour ne pas mourir de faim, ce qui peut nous rendre jaloux, etc. Nos instincts d’animaux sociaux nous conduisent aussi à rechercher la compagnie d’autres humains. Mais les machines intelligentes n’auront aucune raison de posséder ces pulsions et instincts. Pour qu’elles les aient, il faudrait que leurs concepteurs les construisent explicitement.
Les machines intelligentes du futur auront des sentiments, des plaisirs, des peurs, et des valeurs morales. Ces valeurs seront une combinai-son de comportements, d’instincts et de pulsions programmés avec des comportements appris.
Téléchargez la suite du dossier et la présentation de Brian Analytics Technologies
En vous inscrivant à la newsletter vous acceptez de recevoir des mails de Digital Mag sur son actualité et ses offres en cours. Vous pouvez à tout moment vous désinscrire dans la partie basse des Newsletters envoyées.