Oscar Wilde a dit un jour que le sarcasme était la forme la plus basse de l’esprit, mais la forme la plus élevée de l’intelligence. Si les humains peinent parfois à saisir cette forme subtile de communication, celle-ci est un défi pour les machines. Une équipe de chercheurs de l’Université de Groningen a relevé ce défi avec une approche novatrice combinant analyse textuelle et acoustique pour créer un détecteur de sarcasme plus précis.
Transmettre le sarcasme par le texte est notoirement difficile, les changements subtils de ton qui véhiculent le sarcasme confondent souvent les algorithmes informatiques, limitant les assistants virtuels et les outils d’analyse de contenu.
Xiyuan Gao, Shekhar Nayak et Matt Coler du Laboratoire de technologie de la parole de l’Université de Groningen, Campus Fryslân, aux Pays-Bas, ont développé un algorithme multimodal qui améliore la détection du sarcasme. Leurs travaux ont été présentés lors de la dernière réunion conjointe de la Société Acoustique d’Amérique et de l’Association Canadienne d’Acoustique à Ottawa.
Une approche multimodale
Les algorithmes traditionnels de détection du sarcasme s’appuient généralement sur un seul paramètre, comme le texte seul, pour produire leurs résultats. Cette approche limitée est la principale raison pour laquelle ils échouent souvent. Le sarcasme, par nature, repose non seulement sur les mots, mais aussi sur la manière dont ils sont dits et le contexte.
Plutôt que de se limiter à une seule dimension, les chercheurs ont adopté une approche multimodale, utilisant deux techniques complémentaires : l’analyse des sentiments via le texte et la reconnaissance des émotions via l’audio.
Xiyuan Gao explique :
“Nous avons extrait des paramètres acoustiques tels que la hauteur, le débit de parole et l’énergie de la parole, puis utilisé la reconnaissance automatique de la parole pour transcrire la parole en texte pour l’analyse des sentiments”.
Ensuite, chaque segment de discours a été enrichi d’émoticônes reflétant son contenu émotionnel pour une analyse complète et précise du sarcasme.
Bien que l’équipe soit optimiste quant aux performances de son algorithme, elle cherche déjà des moyens de l’améliorer. “Il existe une gamme d’expressions et de gestes que les gens utilisent pour mettre en évidence les éléments sarcastiques dans le discours”, note Xiyuan Gao. “Ceux-ci doivent être mieux intégrés dans notre projet. De plus, nous aimerions inclure plus de langues et adopter des techniques de reconnaissance du sarcasme.”
Applications éventuelles
Les implications de cette technologie vont bien au-delà de la simple identification du sarcasme qui peut bénéficier à d’autres domaines de recherche utilisant l’analyse des sentiments et la reconnaissance des émotions.
Xiyuan Gao ajoute :
“Traditionnellement, l’analyse des sentiments se concentre principalement sur le texte et est développée pour des applications telles que la détection des discours de haine en ligne et l’exploration des opinions des clients. La reconnaissance des émotions basée sur la parole peut être appliquée aux soins de santé assistés par l’IA. La technologie de reconnaissance du sarcasme qui applique une approche multimodale est perspicace pour ces domaines de recherche”.
Références de l’article :
Société Acoustique d’Amérique. « Construire un meilleur détecteur de sarcasme. » ScienceDaily