« The Office » enseigne le comportement humain à l’IA. Est-ce vraiment une bonne chose ?
Les chercheurs forment un algorithme d’IA pour aider les robots collaboratifs à comprendre les interactions en regardant des vidéos d’émissions de télévision, de films et d’événements sportifs populaires.
Les humains savent comment interagir les uns avec les autres en utilisant le langage corporel et la communication, mais les robots développés pour travailler aux côtés des gens n’ont pas cette sensibilité innée.
L’intelligence artificielle (IA) aide les robots collaboratifs à prédire comment une personne se comportera probablement afin qu’elle puisse réagir en conséquence. C’est l’une des raisons pour lesquelles les chercheurs ont utilisé des films, des émissions de télévision populaires et des sports pour « former » le système sur le comportement humain.
Chercheurs de Columbia Engineering a développé une technique de vision par ordinateur pour donner aux machines un sens plus intuitif des modèles de comportement humain en utilisant des associations de niveau supérieur entre les personnes, les animaux et les objets. Ils ont également tiré parti d’une ancienne forme de géométrie dans leur cadre mathématique pour le fonctionnement de l’IA.
L’algorithme, la méthode la plus précise à ce jour pour prédire les événements d’action vidéo jusqu’à plusieurs minutes dans le futur, a analysé des milliers d’heures de films, d’événements sportifs et d’émissions de télévision comme « The Office ». De cette façon, il a appris à prédire des centaines d’interactions et d’activités humaines, telles que des poignées de main ou des coups de poing.
Lorsque le système ne peut pas prédire l’action spécifique, il trouve un concept de niveau supérieur lié à l’action, comme, dans le cas de poignées de main ou de coups de poing, le mot « salutation », ont déclaré les chercheurs.
« Notre algorithme est un pas vers des machines capables de faire de meilleures prédictions sur le comportement humain, et ainsi de mieux coordonner leurs actions avec les nôtres », a déclaré Carl Vondrick, professeur adjoint d’informatique à Columbia, qui a dirigé l’étude. « Nos résultats ouvrent plusieurs possibilités pour la collaboration homme-robot, les véhicules autonomes et les technologies d’assistance. »
Évolution de la technologie
L’équipe n’est pas étrangère à l’apprentissage automatique prédictif. Cependant, dans le passé, ses efforts, comme ceux d’autres scientifiques, consistaient à prédire une seule action à la fois. Dans ce scénario, les algorithmes doivent décider comment classer un acte, comme un câlin, un high five ou même l’absence de réponse de quelqu’un, qui serait classé comme « ignorer ».
Cependant, lorsque les algorithmes ne pouvaient pas identifier une action avec une grande certitude, la plupart ne pouvaient pas trouver de fil conducteur entre les options d’action potentielles suivantes, ont déclaré les chercheurs.
Pour trouver une nouvelle façon de développer des modèles de prédiction à long terme, Columbia Engineering Ph.D. Les étudiants Didac Suris et Ruoshi Liu ont adopté une approche différente basée sur l’idée que « tout à l’avenir n’est pas prévisible », a déclaré Suris dans un communiqué de presse.
« Quand une personne ne peut pas prévoir exactement ce qui va se passer, elle joue la sécurité et prédit à un niveau d’abstraction plus élevé », a-t-il déclaré dans le communiqué. « Notre algorithme est le premier à apprendre cette capacité à raisonner de manière abstraite sur des événements futurs. »
En d’autres termes, le nouveau modèle d’IA peut reconnaître quand il ne peut pas prédire avec certitude une action future et, comme les gens le font tout le temps, peut deviner ce que ce sera en le reliant à un concept.
Pour développer le modèle basé sur cette idée, Suris et Liu ont utilisé des géométries inhabituelles qui ne sont pas couramment enseignées dans les mathématiques au lycée ; au lieu de cela, ils remontent à l’époque des anciens Grecs. Ces géométries ont des propriétés contre-intuitives dans lesquelles les lignes droites de la géométrie typique peuvent se plier, et les triangles n’ont pas trois côtés égaux mais sont plutôt bombés, ont déclaré les chercheurs.
En utilisant les principes de ce type de géométrie inhabituel, les chercheurs ont construit des modèles d’IA qui pourraient organiser des concepts de haut niveau pour prédire le comportement humain futur en fonction de la prévisibilité des événements à l’avenir, ont-ils déclaré.
Par exemple, les humains savent que la natation et la course sont deux types d’exercice. Le système peut catégoriser ces activités connexes tout en étant conscient de l’incertitude. Ce dernier cas fournit des actions plus spécifiques lorsqu’il existe une certitude et des prédictions plus génériques lorsqu’il n’y en a pas, ont déclaré les chercheurs.
« Le comportement humain est souvent surprenant », a déclaré Vondrick dans un communiqué de presse. « Nos algorithmes permettent aux machines de mieux anticiper ce qu’elles vont faire ensuite. »
Améliorer les relations homme-robot
Les chercheurs ont rédigé un article sur leur travail et présenté l’étude à la Conférence internationale sur la vision par ordinateur et la reconnaissance de formes le 24 juin.
Alors que les ordinateurs agissent actuellement sur la base de la préprogrammation, le modèle développé par l’équipe peut aider à donner aux robots collaboratifs plus de spontanéité, tout comme les humains le font dans leurs interactions, a déclaré Liu. Cela peut aider les humains qui, à l’avenir, travailleront en étroite collaboration avec des robots à former un type de relation, a-t-il déclaré.
« La confiance vient du sentiment que le robot comprend les gens », a expliqué Liu dans un communiqué de presse. « Si les machines peuvent comprendre et anticiper nos comportements, les ordinateurs seront en mesure d’assister les gens de manière transparente dans leurs activités quotidiennes. »
Les chercheurs prévoient de poursuivre leurs travaux en vérifiant comment l’algorithme fonctionne en dehors du laboratoire dans divers contextes plutôt que de simplement le tester sur des tâches de référence, ont-ils déclaré. S’il réussit, le modèle peut développer et éventuellement utiliser des robots qui peuvent travailler aux côtés des humains pour améliorer notre sécurité, notre santé et notre sécurité, ont déclaré les chercheurs.
L’équipe prévoit également de continuer à améliorer les performances de l’algorithme avec des ensembles de données et des ordinateurs plus importants, ainsi que d’autres formes de géométrie.