ACADYS a annoncé ce 3 mars que, via sa Business unit baptisée Beyond Data Sciences dédiée à l’intelligence de la donnée, il délivrera chaque semaine, jusqu’au second tour de l’élection présidentielle, une analyse des discours, déclarations et écrits des principaux candidats déclarés. Ce cabinet va ainsi disséquer les discours et programmes politiques des principaux candidats à l’élection présidentielle française afin d’identifier les thématiques communes mais aussi leurs spécificités grâce à l’Intelligence Artificielle.
Créé en 1996, le cabinet ACADYS s’est donné pour mission d’aider les organisations à créer de la valeur par l’optimisation et l’innovation d’entreprise. Le Système d’Information, facteur incontournable de succès de la compétitivité est devenu très vite le domaine d’intervention le plus connu d’ACADYS. Présent en France, en Suisse et en Afrique, ACADYS compte aujourd’hui plus de 25 collaborateurs et plus de 300 entreprises clientes depuis sa création. Le cabinet vient de lancer sa Business Unit autour de la Data Intelligence, Beyond Data Sciences. A travers celle-ci, ACADYS met en place des stratégies de diagnostics et de conseils en Data Intelligence mais également des travaux d’études et de formations.
Mieux comprendre les propositions et les valeurs des principaux candidats à l’aide de l’IA
Cette semaine, les déclarations de 6 candidats ont été analysées par ACADYS : Anne Hidalgo, Eric Jadot, Marine Le Pen, Jean-Luc Mélenchon, Valérie Pécresse et Eric Zemmour, Emmanuel Macron et Fabien Roussel, seront inclus dans la prochaine analyse. Par ailleurs, l’analyse évoluera au fil des semaines se focalisant ou intégrant d’autres prismes, par exemple l’évolution du discours entre aujourd’hui et le discours d’entre-deux-tours.
Sources servant de données pour l’analyse
ACADYS n’a étudié que les sources provenant directement des candidats : programmes officiels, sites web officiels, publications sur les réseaux sociaux par le candidat lui-même, discours politiques lors de meetings officiels de campagne. Les interviews pouvant être biaisées par les types de questions posées par les journalistes ou les informations reprises par les médias n’ont pas été considérées dans cette analyse.
Méthode
ACADYS a tout d’abord identifié l’ensemble des sources officielles des candidats déclarés qu’elles soient orales ou écrites pour les injecter dans un data lake en utilisant les techniques du big data. Ensuite, les discours ont été « scriptés » au travers de méthodes de type NLP (Natural Langage Processing) afin de pouvoir être comparés aux textes écrits. Cela inclut en particulier des techniques de reconnaissance vocale pour transcrire les discours enregistrés en texte exploitable. Des algorithmes d’analyse de textes de type Machine learning ont été entrainés afin d’extraire les termes et thématiques les plus fréquents (simples 1-gram et composés 2-gram) sur une base de 10000 mots. Un traitement préliminaire a été effectué pour « nettoyer » les corpus (pre-processing). Une analyse vectorielle utilisant la distance euclidienne permet de mieux comprendre le niveau de « proximité » entre les différents candidats.
Les premiers résultats de l’enquête
Termes les plus employés : France et Europe.
Analyses individuelles
- Les termes France et Europe sont les termes de loin les plus cités et figurent
systématiquement dans le Top 5 de chacun des candidats hormis pour Marine Le Pen où l’Europe n’arrive qu’en 9ème position. - Le terme français apparaît dans le top 10 de chaque candidat sauf pour Y. Jadot où il apparaît au-delà du 20ème rang.
- Les termes état, pays et politique sont cités par tous les candidats parmi leurs 30 mots les plus utilisés.
- Le terme pouvoir d’achat est cité fréquemment par Valérie Pécresse, mais aussi par Eric Zemmour et Marine Le Pen…
Analyse en fréquences cumulées :
En fréquence cumulée, les mots Europe, France et français sont de loin les plus employés. Les autres termes les plus cités sont : pays, écologie, droit, état, politique, public puis viennent ensuite les termes social, loi, nation, travail, le président E. Macron, droits, santé, république, justice, entreprises, économie, climatique.
Niveau de proximité entre les candidats
Une analyse de similitude a été réalisée pour identifier le niveau de proximité entre les candidats. En utilisant la distance euclidienne, et en se basant sur la dernière sortie de l’algorithme, on note que :
- Le candidat le plus proche de Jean-Luc Mélenchon est Anne Hidalgo
- Le candidat le plus proche de Marine Le Pen est Eric Zemmour, mais lui-même est, à travers ses déclarations, plus proche de la candidate Valérie Pécresse
- Yannick Jadot est, quant à lui, le plus loin des autres candidats.
Les trois termes sur 10 000 les plus cités par les candidats.
VALERIE PECRESSE : France, Français, Pays.
ERIC ZEMMOUR : France, Français, Pays.
YANNICK JADOT : Europe, Ecologie, Droit.
ANNE HIDALGO : Europe, France, Public.
J-LUC MELENCHON : France, Europe, Mesure.
MARINE LE PEN : France, Français, Loi.