Patrick M. Pilarski, Ph.D. Chaire Canada-CIFAR en IA (Amii)

Par

Le Dr Patrick M. Pilarski est titulaire de la Chaire Canada-CIFAR en intelligence artificielle, ancien titulaire de la Chaire de recherche du Canada sur l'intelligence artificielle pour la réadaptation et professeur agrégé à la Division de médecine physique et de réadaptation, Département de médecine, Université de l'Alberta.

En 2017, le Dr Pilarski a cofondé le premier bureau de recherche international de DeepMind, situé à Edmonton, en Alberta, où il a été codirecteur du bureau et chercheur scientifique principal jusqu'en 2023. Il est membre du conseil d'administration de l'Alberta Machine Intelligence Institute (Amii), co-dirige le laboratoire Bionic Limbs for Improved Natural Control (BLINC) et chercheur principal du Reinforcement Learning and Artificial Intelligence Laboratory (RLAI) et du Sensory Motor Adaptive Réseau de technologie de réadaptation (SMART) de l'Université de l'Alberta.

Le Dr Pilarski est l'auteur ou le co-auteur primé de plus de 120 articles évalués par des pairs, un membre senior de l'IEEE et a été soutenu par des subventions de recherche provinciales, nationales et internationales.

Nous nous sommes assis pour une entrevue lors de la conférence annuelle 2023 Upper Bound sur l'IA qui se tient à Edmonton, en Alberta et est organisée par Amii (Alberta Machine Intelligence Institute).

Comment vous êtes-vous retrouvé dans l'IA ? Qu'est-ce qui vous a attiré dans l'industrie?

Ce sont deux questions distinctes. En ce qui concerne ce qui m'attire dans l'IA, il y a quelque chose de beau dans la façon dont la complexité peut émerger et comment la structure peut émerger de la complexité. L'intelligence n'est qu'un de ces exemples étonnants de cela, donc qu'elle vienne de la biologie ou qu'elle vienne de la façon dont nous voyons émerger des comportements élaborés dans les machines, je pense qu'il y a quelque chose de beau à ce sujet. Cela m'a toujours fasciné pendant très longtemps, et ma très longue trajectoire sinueuse pour travailler dans le domaine de l'IA dans lequel je travaille maintenant, c'est-à-dire des machines qui apprennent par essais et erreurs, des systèmes de renforcement qui interagissent avec les humains pendant qu'ils sont tous les deux immergés dedans, le flux d'expérience, le flux de temps, est passé par toutes sortes de plateaux différents. J'ai étudié comment les machines et les humains pouvaient interagir en termes de dispositifs biomécatroniques et de biotechnologie, des choses comme les membres artificiels et les prothèses.

J'ai examiné comment l'IA peut être utilisée pour soutenir les diagnostics médicaux, comment nous pouvons utiliser l'intelligence artificielle pour commencer à comprendre les schémas qui conduisent à la maladie ou comment différentes maladies peuvent se présenter en termes d'enregistrements sur une machine. Mais tout cela fait partie de ce long élan pour vraiment commencer à apprécier comment vous pourriez être en mesure d'obtenir des comportements très complexes à partir de bases très simples. Et c'est ce que j'aime vraiment, en particulier à propos de l'apprentissage par renforcement, c'est l'idée que la machine peut s'intégrer dans le flux du temps et apprendre de sa propre expérience pour montrer des comportements très complexes et capturer à la fois les phénomènes complexes, vraiment, dans le monde qui l'entoure. Cela a été une force motrice.

La mécanique, j'ai fait beaucoup de formation en médecine sportive et des choses comme ça au lycée. J'ai étudié la médecine du sport et maintenant je travaille ici dans un environnement où j'observe comment l'intelligence artificielle et les technologies de réadaptation s'associent pour soutenir les gens dans leur vie quotidienne. C'est un voyage très intéressant, comme le côté fascination pour les systèmes complexes et la complexité, puis une pragmatique très pratique de la façon dont nous commençons à réfléchir à la façon dont les humains peuvent être mieux soutenus, vivre la vie qu'ils veulent vivre.

Comment le sport vous a-t-il initialement conduit aux prothèses ?

Ce qui est vraiment intéressant dans des domaines comme la médecine du sport, c'est d'examiner le corps humain et la façon dont les besoins uniques d'une personne, qu'ils soient sportifs ou autres, peuvent en fait être pris en charge par d'autres personnes, par des procédures et des processus. Les membres bioniques et les technologies prothétiques concernent la construction d'appareils, de systèmes de construction, de technologies de construction qui aident les gens à vivre la vie qu'ils veulent vivre. Ces deux choses sont vraiment étroitement liées. C'est en fait vraiment excitant de pouvoir boucler la boucle et de voir certains de ces intérêts bien plus anciens se concrétiser, encore une fois, en co-dirigant un laboratoire où nous examinons… Et en particulier les systèmes d'apprentissage automatique qui fonctionnent de manière étroitement couplée, la personne qu'ils sont conçus pour soutenir.

Vous avez déjà expliqué comment une prothèse s'adapte à la personne au lieu que la personne s'adapte à la prothèse. Pourriez-vous parler de l'apprentissage automatique derrière tout cela ?

Absolument. En tant que fondement de l'histoire de l'utilisation des outils, les humains se sont adaptés à nos outils, puis nous avons adapté nos outils aux besoins que nous avons. Et donc il y a ce processus itératif d'adaptation à nos outils. Nous sommes, en ce moment, à un point d'inflexion où, pour la première fois, vous m'avez peut-être entendu dire cela auparavant dans des pourparlers si vous avez regardé certains des discours que j'ai donnés. Mais vraiment, nous sommes à ce moment important de l'histoire où nous pouvons maintenant imaginer la construction d'outils qui apportent certaines de ces caractéristiques de l'intelligence humaine. Des outils qui s'adapteront et s'amélioreront réellement pendant qu'ils sont utilisés par une personne. Les technologies sous-jacentes soutiennent l'apprentissage continu. Des systèmes qui peuvent continuellement apprendre d'une expérience de diffusion continue. Dans ce cas, l'apprentissage par renforcement et les mécanismes qui le sous-tendent, des choses comme l'apprentissage par différence temporelle, sont vraiment essentiels pour construire des systèmes qui peuvent continuellement s'adapter pendant qu'ils interagissent avec une personne et pendant qu'ils sont utilisés par une personne qui les soutient dans leur vie quotidienne.

Pourriez-vous définir l'apprentissage par différence temporelle ?

Absolument, ce que j'aime vraiment à ce sujet, c'est que nous pouvons penser aux technologies de base, à l'apprentissage par différence temporelle et aux algorithmes fondamentaux d'apprentissage par prédiction qui sous-tendent une grande partie de ce que nous travaillons en laboratoire. Vous avez un système qui, tout comme nous, fait une prédiction sur ce à quoi l'avenir va ressembler en ce qui concerne un signal, en ce qui concerne quelque chose comme la récompense future est ce que nous voyons habituellement. Mais tout autre signal que vous pourriez imaginer comme, quelle force est-ce que j'exerce en ce moment ? À quel point va-t-il faire chaud ? Combien de beignets vais-je manger demain ? Ce sont les choses possibles que vous pourriez imaginer prédire. Et donc l'algorithme de base regarde vraiment la différence entre ma supposition sur ce qui va se passer maintenant et ma supposition sur ce qui va se passer dans le futur avec tout type de signal que je reçois actuellement.

Quelle force est-ce que j'exerce lorsqu'un bras de robot soulève une tasse de café ou une tasse d'eau ? Il peut s'agir de la différence entre la prédiction de la quantité de force qu'elle exercera en ce moment ou la quantité qu'elle exercera sur une certaine période du futur. Et puis en comparant cela à ses attentes concernant l'avenir et la force qu'il exerce réellement. Mettez-les tous ensemble et vous obtenez cette erreur, l'erreur de différence temporelle. C'est cette belle accumulation des prévisions temporellement étendues dans le futur et des différences entre elles, que vous pouvez ensuite utiliser pour mettre à jour la structure de la machine d'apprentissage elle-même.

Et donc, encore une fois, pour l'apprentissage par renforcement conventionnel basé sur la récompense, cela pourrait consister à mettre à jour la façon dont la machine agit en fonction de la future récompense attendue que vous pourriez percevoir. Pour une grande partie de ce que nous faisons, nous examinons d'autres types de signaux, en utilisant des fonctions de valeur généralisées, c'est-à-dire l'adaptation du processus d'apprentissage par renforcement, l'apprentissage par différence temporelle des signaux de récompense à tout type de signal d'intérêt qui pourrait être applicable au fonctionnement de la machine.

Vous parlez souvent d'une prothèse appelée Cairo Toe dans vos présentations. Qu'a-t-il à nous apprendre ?

Université Cairo Toe de Bâle, LHTT. Image: Matjaž Kačičnik

J'aime prendre l'exemple du Cairo Toe, une prothèse vieille de 3000 ans. Je travaille dans le domaine des neuroprothèses, on voit maintenant des systèmes robotiques très avancés qui peuvent dans certains cas avoir le même niveau de contrôle ou les mêmes degrés de contrôle que des parties biologiques du corps. Et pourtant, je reviens à un bout de bois très stylisé d'il y a 3000 ans. Je pense que ce qui est bien, c'est que c'est un exemple d'humains qui s'étendent avec la technologie. C'est ce que nous voyons en ce moment en termes de neuroprothèses et l'interaction homme-machine n'est pas quelque chose de bizarre, de nouveau ou de farfelu. Nous avons toujours été des utilisateurs d'outils, les animaux, les animaux non humains utilisent également des outils. Il existe de nombreux livres intéressants à ce sujet, en particulier de Frans de Waal, "Sommes-nous assez intelligents pour savoir à quel point les animaux sont intelligents ?".

Cette extension de nous-mêmes, l'augmentation et l'amélioration de nous-mêmes par l'utilisation d'outils n'est pas quelque chose de nouveau, c'est quelque chose d'ancien. C'est quelque chose qui se passe depuis des temps immémoriaux dans le pays même où nous nous trouvons en ce moment par les gens qui vivaient ici. L'autre chose intéressante à propos du Cairo Toe est que les preuves, du moins à partir des rapports scientifiques à son sujet, montrent qu'il a été adapté plusieurs fois au cours de ses interactions avec ses utilisateurs. En fait, ils sont entrés et l'ont personnalisé et l'ont changé, modifié pendant son utilisation.

Ma compréhension, ce n'était pas seulement un outil fixe qui était attaché à une personne au cours de sa vie, c'était un outil fixe qui était attaché mais aussi modifié. C'est un exemple de la façon dont, encore une fois, l'idée que les outils sont adaptés au cours de leur durée d'utilisation et une durée d'utilisation soutenue est en fait quelque chose qui est également assez ancienne. Ce n'est pas quelque chose de nouveau, et il y a beaucoup de leçons que nous pouvons tirer de la co-adaptation des personnes et des outils au fil de très nombreuses années.

Vous avez déjà mentionné la voie de rétroaction entre les prothèses et l'humain, pourriez-vous élaborer sur la voie de rétroaction ?

Nous sommes aussi dans une période particulière quant à la façon dont nous envisageons la relation entre une personne et la machine qui vise à l'accompagner dans son quotidien. Quand quelqu'un utilise un membre artificiel, disons quelqu'un avec une différence de membre, quelqu'un avec une amputation utilise un membre artificiel. Traditionnellement, ils l'utiliseront comme un outil, comme une extension de leur corps, mais nous les verrons s'appuyer largement sur ce que nous considérons comme la voie de contrôle. Qu'une certaine idée de leur roue ou de leur intention soit transmise à cet appareil, qui est ensuite chargé de déterminer ce que c'est, puis de l'exécuter, qu'il s'agisse d'ouvrir et de fermer une main ou de plier un coude ou de créer une prise de pincement pour saisir une clé. Souvent, nous ne voyons pas les gens étudier ou envisager la voie de la rétroaction.

Ainsi, un grand nombre de membres artificiels que vous pourriez voir déployés commercialement, la voie de l'information circulant de l'appareil vers la personne pourrait être le couplage mécanique, la façon dont ils ressentent réellement les forces du membre et agissent en conséquence. Il se peut qu'ils entendent l'inquiétude des moteurs ou qu'ils regardent prendre un brassard et le déplacer sur un bureau ou qu'ils le saisissent d'une autre partie de leur espace de travail. Et donc, ces voies sont la façon traditionnelle de le faire. Il se passe des choses incroyables à travers le monde pour voir comment les informations pourraient être mieux renvoyées d'un membre artificiel à la personne qui l'utilise. Surtout même ici à Edmonton, il y a beaucoup de travail vraiment cool qui utilise le recâblage du système nerveux, la rénovation nerveuse ciblée et d'autres choses pour soutenir cette voie. Mais c'est encore un domaine d'étude émergent très chaud pour réfléchir à la façon dont l'apprentissage automatique prend en charge les interactions par rapport à cette voie de rétroaction.

Comment l'apprentissage automatique peut prendre en charge un système qui pourrait percevoir et prédire beaucoup de choses sur son monde, en transmettant ces informations clairement et efficacement à la personne qui les utilise. Comment l'apprentissage automatique peut-il soutenir cela ? Je pense que c'est un excellent sujet, car si vous avez à la fois cette voie de rétroaction et cette voie de contrôle, les deux voies s'adaptent et l'appareil utilisé par la personne et la personne elle-même construisent des modèles l'un de l'autre. Vous pouvez faire quelque chose de presque miraculeux. Vous pouvez presque transmettre des informations gratuitement. Si vous avez ces deux systèmes qui sont en fait bien accordés l'un à l'autre, ils ont construit un modèle très puissant l'un de l'autre et ils ont une adaptation pour contrôler les voies de rétroaction, vous pouvez former des partenariats très étroits entre les humains et les machines qui peuvent transmettre une quantité massive d'informations avec très peu d'effort et très peu de bande passante.

Et cela ouvre de nouveaux domaines de coordination homme machine machine, en particulier dans le domaine des neuroprothèses. Je pense vraiment que c'est un moment assez miraculeux pour nous de commencer à étudier ce domaine.

Pensez-vous que ceux-ci seront imprimés en 3D à l'avenir ou comment pensez-vous que la fabrication se déroulera ?

Je n'ai pas l'impression d'être le meilleur endroit pour spéculer sur la façon dont cela pourrait arriver. Je peux dire cependant que nous constatons une forte augmentation du nombre de fournisseurs commerciaux de dispositifs neuroprothétiques utilisant la fabrication additive, l'impression 3D et d'autres formes de fabrication additive sur place pour créer leurs dispositifs. C'est aussi très agréable à voir, qu'il ne s'agit pas seulement d'un prototype utilisant la fabrication additive ou l'impression 3D, c'est l'impression 3D qui devient une partie intégrante de la façon dont nous fournissons des appareils aux particuliers et dont nous optimisons ces appareils pour les personnes exactes qui les utilisent.

Fabrication additive ou fabrication sur-mesure, la pose de prothèse sur-mesure se fait tout le temps dans les hôpitaux. Il s'agit d'une partie naturelle de la prestation de soins aux personnes ayant une différence de membre qui ont besoin de technologies assistées ou d'autres types de technologies de réadaptation. Je pense que nous commençons à voir qu'une grande partie de cette personnalisation commence à se fondre dans les fabricants d'appareils, et pas seulement laissée aux prestataires de soins. Et c'est aussi très excitant. Je pense qu'il y a une grande opportunité pour des appareils qui ne ressemblent pas seulement à des mains ou qui sont des mains usagées, mais des appareils qui répondent très précisément aux besoins de la personne qui les utilise, qui leur permettent de s'exprimer de la manière dont ils veulent s'exprimer, et leur permettent de vivre la vie qu'ils veulent vivre comme ils veulent la vivre, pas seulement comme nous pensons qu'une main devrait être utilisée dans la vie quotidienne.

Vous avez écrit plus de 120 articles. Y en a-t-il un qui se démarque pour vous et que nous devrions connaître?

Il y a un article récemment publié sur les applications d'informatique neuronale, mais il représente la pointe d'un iceberg de la réflexion que nous proposons depuis plus d'une décennie maintenant, sur les cadres d'interaction entre les humains et les machines, en particulier la façon dont les humains et les prothèses interagissent. C'est l'idée du capital communicatif. Et c'est donc l'article que nous avons récemment publié.

Et cet article expose notre point de vue sur la façon dont les prédictions qui sont apprises et maintenues en temps réel par, disons, une prothèse interagissant avec la personne, la personne elle-même peuvent constituer essentiellement un capital, peuvent constituer une ressource sur laquelle ces deux parties peuvent compter. Rappelez-vous, j'ai dit précédemment que nous pouvons faire quelque chose de vraiment spectaculaire quand nous avons un humain et une machine qui construisent tous les deux des modèles l'un de l'autre, adaptant le temps réel en fonction de l'expérience et commençant à transmettre des informations dans un canal bidirectionnel. En marge, parce qu'on vit dans un monde magique où il y a des enregistrements et on peut en couper des choses.

C'est essentiellement comme de la magie.

Exactement. Cela ressemble à de la magie. Si nous revenons à des penseurs comme Ashby, W. Ross Ashby, dans les années 1960 et son livre "Introduction of Cybernetics" parlait de la façon dont nous pourrions amplifier l'intellect humain. Et il a vraiment dit que cela revient à amplifier la capacité d'une personne à choisir entre l'une des nombreuses options. Et cela est rendu possible par des systèmes où une personne interagit avec, disons, une machine, où il y a un canal de communication ouvert entre eux. Donc, si nous avons cette communication canalisée ouverte, si elle est bidirectionnelle, et si les deux systèmes construisent du capital sous forme de prédictions et d'autres choses, alors vous pouvez commencer à les voir vraiment s'aligner et devenir plus que la somme de leurs parties. Vous pouvez obtenir plus qu'ils n'investissent.

Et je pense que c'est pourquoi je considère que c'est l'un de nos articles les plus passionnants, car il représente un changement de pensée. Cela représente un changement de mentalité vers la conception des dispositifs neuroprothétiques comme des systèmes avec agentivité, des systèmes auxquels nous pourrions non seulement décrire l'agentivité, mais sur lesquels nous comptons pour pouvoir co-adapter avec nous pour développer ces ressources. Le capital communicatif qui nous permet de démultiplier notre capacité à interagir avec le monde, nous permet d'en sortir plus que nous n'y mettons et permet aux gens, je vais dire, depuis une lentille prothétique, d'arrêter de penser à la prothèse dans leur quotidien et de commencer à penser à vivre leur quotidien. Pas l'appareil qui les aide à vivre leur vie quotidienne.

Quelles sont certaines des applications que vous verriez pour les interfaces cerveau-machine avec ce dont vous venez de parler ?

L'une de mes préférées est quelque chose que nous avons mis de l'avant, encore une fois, au cours des 10 dernières années, c'est une technologie appelée commutation adaptative. La commutation adaptative est basée sur la connaissance que de nombreux systèmes avec lesquels nous interagissons quotidiennement dépendent de notre commutation entre de nombreux modes ou fonctions. Que je passe d'une application à l'autre sur mon téléphone ou que j'essaie de trouver le bon réglage sur ma perceuse ou que j'adapte d'autres outils dans ma vie, nous basculons constamment entre de nombreux modes ou fonctions, en repensant à Ashby, notre capacité à choisir entre de nombreuses options. Ainsi, dans la commutation adaptative, nous utilisons l'apprentissage par différence temporelle pour permettre à un membre artificiel d'apprendre quelle fonction motrice une personne pourrait vouloir utiliser et quand elle veut l'utiliser. Donc, une prémisse vraiment assez simple est que, juste le fait que je tende la main vers une tasse et que je ferme la main.

Eh bien, un système devrait être capable de construire des prédictions par l'expérience que dans cette situation, je vais probablement utiliser la fonction d'ouverture et de fermeture manuelle. Je vais ouvrir et fermer ma main. Et puis à l'avenir, dans des situations similaires, pour pouvoir prédire cela. Et lorsque je navigue dans le nuage tourbillonnant de modes et de fonctions, donnez-moi plus ou moins ceux que je veux sans avoir à trier toutes ces nombreuses options. Et ceci est un exemple très simple de constitution de ce capital communicatif. Vous avez un système qui construit en fait des prédictions par l'interaction, ce sont des prédictions sur cette personne, cette machine, leur relation dans cette situation à ce moment-là. Et cette ressource partagée permet alors au système de reconfigurer son interface de contrôle à la volée, de sorte que la personne obtienne ce qu'elle veut et quand elle le veut. Et vraiment, dans une situation où le système est très, très sûr de la fonction motrice qu'une personne pourrait vouloir, il peut en fait simplement sélectionner cela pour elle au moment où elle entre.

Et ce qui est cool, c'est que la personne a toujours la capacité de dire "Ah, c'est ce que je voulais vraiment", et de passer à une autre fonction motrice. Dans un bras robotique, il peut s'agir de différents types de prises de main, qu'il s'agisse de façonner la prise pour saisir une poignée de porte ou ramasser une clé ou pour serrer la main de quelqu'un. Ce sont différents modes de fonctions, différents modèles de saisie. Il est très intéressant que le système puisse commencer à construire une appréciation de ce qui est approprié dans quelle situation. Des unités de capital sur lesquelles ces deux parties peuvent compter pour se déplacer plus rapidement dans le monde, et avec moins de charge cognitive, en particulier dans la partie de l'unité.

Merci pour cette incroyable interview, les lecteurs qui souhaitent en savoir plus devraient visiter les ressources suivantes :

Laura Petrich, étudiante au doctorat en robotique et apprentissage automatique – Série d'entrevues

Prasad Kawthekar, co-fondateur et PDG de Dashworks – Série d'interviews

Partenaire fondateur d'unite.AI et membre du Forbes Technology Council, Antoine est un futuriste passionné par l'avenir de l'IA et de la robotique. Il est également le fondateur de Securities.io, un site Web d'investissement, la plate-forme d'IA générative images.ai, et travaille actuellement au lancement de la plate-forme Genius.ai qui offrira aux utilisateurs la possibilité de configurer et de déployer des agents autonomes en divisant les invites en sous-tâches.

Mara Cairo, Product Owner of Advanced Technology chez Amii – Série d'interviews

Laura Petrich, étudiante au doctorat en robotique et apprentissage automatique – Série d'entrevues

Prasad Kawthekar, co-fondateur et PDG de Dashworks – Série d'interviews

Arjun Narayan, responsable de la confiance et de la sécurité mondiales pour SmartNews - Série d'interviews

Razi Raziuddin, co-fondateur et PDG de FeatureByte - Série d'interviews

Jordan Noone, co-fondateur de Embedded ventures – Série d'interviews

Comment vous êtes-vous retrouvé dans l'IA ? Qu'est-ce qui vous a attiré dans l'industrie? Comment le sport vous a-t-il initialement conduit aux prothèses ? Vous avez déjà expliqué comment une prothèse s'adapte à la personne au lieu que la personne s'adapte à la prothèse. Pourriez-vous parler de l'apprentissage automatique derrière tout cela ? Pourriez-vous définir l'apprentissage par différence temporelle ? Vous parlez souvent d'une prothèse appelée Cairo Toe dans vos présentations. Qu'a-t-il à nous apprendre ? Vous avez déjà mentionné la voie de rétroaction entre les prothèses et l'humain, pourriez-vous élaborer sur la voie de rétroaction ? Pensez-vous que ceux-ci seront imprimés en 3D à l'avenir ou comment pensez-vous que la fabrication se déroulera ? Vous avez écrit plus de 120 articles. Y en a-t-il un qui se démarque pour vous et que nous devrions connaître? C'est essentiellement comme de la magie. Quelles sont certaines des applications que vous verriez pour les interfaces cerveau-machine avec ce dont vous venez de parler ?

Nouvelles

Patrick M. Pilarski, Ph.D. Chaire Canada-CIFAR en IA (Amii)