L'IA est-elle prête à comprendre les émotions humaines ?

analyse des émotions

Cette personne exprime-t-elle forcément de la colère parce qu'elle fronce les sourcils ? Pour la plupart des algorithmes actuels de détection des émotions, la réponse est oui. Mais ce n'est pas aussi simple...

Depuis quelques années, l'informatique affective fait parler d'elle et est de plus en plus présente dans de nombreux domaines : sécurité, marketing, spectacle, tourisme, et même dans le secteur de la santé.

les défis de l'analyse des émotions

Ces dernières années, du fait de son large potentiel économique et social, l'informatique affective est devenue un champ de recherche multidisciplinaire et florissant, dont les applications sont très larges :

  • analyse émotionnelle de masse (humeur générale d'une population, niveau de bien-être généré par une installation ludique ou touristique, etc.);
  • sécurité (risques d'agression dans un stade ou les transports en commun, détection des conducteurs somnolents, etc.);
  • marketing et spectacle (réactions émotionnelles à un produit ou un film par exemple);
  • assistants et compagnons personnels;
  • santé (détection de la douleur, accompagnement des personnes atteintes de troubles de la communication, jusqu'à l'aide au diagnostic médical et psychopathologique).

Ces 10 dernières années, l'intelligence artificielle a fait des progrès spectaculaires dans le domaine de l'analyse des expressions faciales, notamment grâce à l'augmentation de la puissance de calcul des ordinateurs et de l'arrivée des techniques de Deep Learning, ou Apprentissage Profond.

Le Deep Learning permet l'analyse des émotions

L'apprentissage profond a permis de nombreuses avancées techniques, notamment parce que les algorithmes, contrairement à ceux de l'apprentissage machine traditionnel et à condition qu'on leur fournisse suffisamment d'exemples d'apprentissage (qui peuvent se compter en millions), ne nécessitent que très peu ou pas d'intervention humaine.

Cependant, si les algorithmes actuels excellent à reconnaître les 6 émotions dites basiques (joie, peur, colère, tristesse, surprise et dégoût) sur des bases de données constituées d'expressions faciales souvent exagérées et « jouées » en laboratoire (jusqu'à des taux de précision atteignant plus de 99%), les performances chutent dramatiquement quand l'IA est confrontée à des situations plus naturelles.

Qu'est-ce qui pourrait expliquer ces difficultés et comment améliorer la pertinence des algorithmes ? Un petit tour du côté de la psychologie des émotions pourrait nous aider à identifier les mécanismes qui résistent encore aux systèmes actuels.

La subtile et complexe alchimie des émotions

Au-delà des 6 émotions de base

système de reconnaissance d'émotions

Les systèmes automatisés actuels, malgré leurs performances croissantes, utilisent et requièrent une conception universelle des émotions et des expressions faciales.

l'étude des émotions complexes

La théorie classique des émotions de base (représentée par Darwin et Paul Ekman pour ne citer que les plus connus), par sa description simple et catégorisée, permet de donner une intelligibilité à ce phénomène très hétérogène, mais elle est aujourd'hui dépassée.

Des recherches récentes ont montré qu'il existe beaucoup plus de catégories d'émotions, et qu'elles sont séparées par des frontières plus floues que ce que les théories classiques laissent entendre. Il semble donc nécessaire, afin de se rapprocher le plus possible de la réalité, de développer de nouveaux modèles théoriques et d'entraîner nos systèmes à reconnaître un plus large éventail d'expressions, relatives à des émotions complexes ou composées, ainsi qu'à des états cognitifs ou même des expressions faciales non émotionnelles, qui semblent bien plus fréquentes que les expressions émotionnelles dans les interactions entre les individus.

Une grande variabilité selon le contexte

le context influe sur l'analyse des émotions

Directement liée au problème des catégories d'émotions, la question de la variabilité des expressions est essentielle pour rendre compte de la richesse de la vie émotionnelle humaine. Dans le modèle des émotions de base, la variabilité des expressions faciales est souvent attribuée à des erreurs méthodologiques ou à des facteurs secondaires, tels que les display rules (règles sociales d'affichage émotionnel), qui poussent les individus à inhiber leurs réactions émotionnelles.

Cette vision classique est aujourd'hui remplacée par des théories qui cherchent à prendre en compte la complexité des émotions qui se manifestent dans l'interaction entre l'individu et son environnement. En effet, toutes les observations dans les environnements écologiques montrent que les expressions faciales sont très variables et dépendent de multiples facteurs.

plusieurs émotions pour une expression faciale

Tout d'abord, il peut y avoir plusieurs types d'expressions faciales pour une même émotion. En effet, en fonction de nombreux facteurs tels que leur personnalité, leur expérience antérieure, leur culture, les différents rôles sociaux qu'ils sont amenés à jouer mais aussi en fonction de la situation, les individus ne vivent pas ou n'expriment pas leurs émotions de la même manière ou avec la même intensité.

De même, une même expression faciale peut avoir plusieurs significations. Par exemple, selon la situation, un froncement de sourcils peut signifier la colère, le dégoût, la tristesse, mais aussi des états mentaux plus complexes tels que la confusion ou une réflexion intense. La notion de contexte joue donc un rôle très important afin d'interpréter correctement les expressions faciales.

Des émotions qui s'expriment dans toutes les modalités

l'analyse des expressions combinées à la voix pour comprendre les émotions

Dans ses interactions quotidiennes avec l'environnement physique et social, l'homme utilise de nombreuses modalités pour exprimer et décoder les états émotionnels : expressions faciales, mais aussi tonalité de la voix, direction du regard, gestes, postures, etc. Par exemple, il est connu que l'intensité d'une émotion est plus facilement perçue par des modalités non visuelles, telles que la tonalité de la voix ou les réactions physiologiques.

Il semble donc naturel et nécessaire que les systèmes automatisés puissent utiliser plusieurs modalités, telles que le couplage de signaux audio et visuels pour différencier les expressions émotionnelles des déformations du visage provoquées par la parole, l'analyse des caractéristiques vocales ou du discours émotionnel, ou même la fusion de plus de deux modalités afin d'augmenter leur précision.

L'IA émotionnelle est-elle pour demain ?

l'intelligence artificielle pour comprendre les émotions

L'informatique affective est un domaine en constante évolution, et les chercheurs ont développé ces dernières années des systèmes de plus en plus élaborés et puissants. Cependant, une grande majorité de ces systèmes ont été testés dans des conditions éloignées du contexte naturel, et on peut avancer que l'IA est encore loin des capacités de l'être humain en matière de décodage des états émotionnels.

L'émotion est, selon les théories les plus récentes, un phénomène très subtil et changeant, qui varie en fonction de nombreux facteurs que la théorie n'a pas encore pu formaliser dans leur intégralité. Sa définition théorique, qui reflète sa complexité, reste encore un work in progress.

Toutefois, cette absence de consensus et la diversité des modèles théoriques ne doivent pas décourager les chercheurs. Il est nécessaire de poursuivre les recherches selon les quatre axes prometteurs mis en évidence dans cette revue (élargir la gamme des émotions, tenir compte de la variabilité et du contexte, tendre vers la multimodalité et générer des données à partir des conditions naturelles), afin que l'intelligence artificielle puisse comprendre la manière subtile et complexe dont l'homme ressent, exprime et échange ses émotions au quotidien.

(pour une revue complète de la littérature, voir : Masson, A. et al. (2020). The Current Challenges of Automatic Recognition of Facial Expressions: A Systematic Review. AI Communications, vol. Pre-press, no. Pre-press, pp. 1-26, 2020. DOI : 10.3233/AIC-200631).

ARTICLES SIMILAIRES

LA SÉCURITÉ MOBILE DES ÉVÉNEMENTS

Quelle stratégie adopter pour sécuriser les grands événements ? Cette question peut devenir un véritable casse-tête pour les organisateurs, tant le défi est...

En savoir plus...

L’ANALYSE VIDÉO DÉPLOIE SES DRONES

Depuis peu, les outils de régulation du trafic routier s’exportent vers les airs. Estimés pour la mobilité dont ils font preuve, les drones se répandent de...

En savoir plus...
> <
Read less Read more

FR

EN