Docteur en informatique à l’UPMC (Sorbonne Université) et habilitée à diriger les recherches, le parcours professionnel de Marie-Aude Aufaure est jalonné d’expériences multiples en entreprise, dans le secteur académique et en entrepreneuriat. Elle commence sa carrière dans le secteur des télécommunications, puis rejoint l’enseignement supérieur et la recherche dans différents établissements, dont CentraleSupelec, où elle est titulaire d’une chaire sur la Business Intelligence, et l’INRIA.
Passionnée de technologies, elle se lance dans l’entrepreneuriat et fonde Datarvest en 2016, jeune entreprise innovante spécialisée dans l’exploitation et la valorisation des données – big data et intelligence artificielle. Ses domaines d’intervention couvrent le développement d’algorithmes innovants, le conseil aux entreprises et la formation. Elle a conçu et piloté la formation certifiante « Big data pour l’entreprise numérique » pour CentraleSupe-lec Exed.
Poursuivant sa volonté d’entreprendre, elle cofonde en 2019 SyncData Partners, cabinet de conseil en stratégie et innovation data. Elle est membre actif du Hub France IA et du think tank « la villa numéris ».
Dans le cadre des jeux olympiques 2024, nous vous offrons chaque jour un article issu du magazine ActuIA n°4, dont le dossier principal est “Le sport à l’ère de l’IA”. Afin de découvrir le magazine ActuIA, nous vous invitons à vous rendre sur notre boutique. Tout nouvel abonnement d’un an vous donne droit à l’ensemble des archives au format numérique.
Vous êtes spécialisée dans les graphes, quel est l’éventail de leurs usages possibles, et identifiez-vous des usages émergents ?
Durant la dernière décennie passée dans des laboratoires de recherche, je me suis intéressée à la construction automatique d’ontologies et à la modélisation et l’analyse de graphes complexes, convaincue du potentiel de ces technologies pour les entreprises. Datarvest (Data Harvesting) a été créée dans l’idée de croiser et d’analyser des masses de données hétérogènes et de proposer une solution d’analyse de données complexes intégrant un algorithme de clustering agnostique des données. Celui-ci permettrait d’extraire des classes en une seule passe à partir de tout type de données, numériques, catégorielles, sous forme de graphes ou de séries temporelles, définies par des intervalles de valeurs, etc.
Les graphes permettent de représenter les liens entre différentes entités, et les applications potentielles sont nombreuses. Citons les usages suivants, qui ne sont pas exhaustifs :
- la détection de comportements anormaux appliqués à la détection de fraudes, la lutte anti-blanchiment, la cybersécurité ou encore le renseignement ;
- l’analyse de graphes pour les ressources humaines pour identifier des talents, constituer des équipes cohésives ou encore prédire des évolutions de parcours de carrière et recommander des formations ;
- la santé et la sécurité, en étudiant par exemple les interactions sociales dans le contexte de la crise sanitaire ;
- la mobilité pour de l’aide à la décision ;
- la supply chain pour propager des informations et alertes à l’ensemble de la chaîne de production.
Parmi les usages émergents, outre ceux présentés ci-dessus, les graphes peuvent être utiles pour gérer la gouvernance des données, une problématique majeure actuellement dans les entreprises : le data lineage peut être modélisé à l’aide d’un graphe permettant de tracer les données et de propager des modifications, les graphes de connaissances peuvent être utilisés pour représenter le modèle de données de l’entreprise et il est possible de prédire des liens. L’analyse de l’usage et des interactions clients se prête également très bien à ce type de représentation.
Vous venez de renforcer votre pôle R&D. Quels sont vos objectifs ?
La vocation de Datarvest est de développer des technologies de pointe intégrant les résultats récents issus du monde de la recherche, en concevant et mettant en œuvre des méthodes et algorithmes innovants en collaboration avec le monde académique.
Les travaux de R&D initiés depuis la création de l’entreprise ont donné des résultats prometteurs, applicables à de nombreux usages, et il était naturel de renforcer notre R&D. Un jeune docteur spécialisé dans les graphes, Mehdi Djellabi, a été recruté en mars dernier. Ses travaux ont porté sur des mesures d’interactions locales dans des graphes complexes, et une extension de ces travaux, prenant en compte des éléments de contenu comme des pondérations de relations, peut compléter la solution de Datarvest.
Par ailleurs, notre solution peut harmonieusement être combinée avec des algorithmes de machine learning ou de deep learning existants, pour faire de la prédiction de liens ou de nœuds, ou de manière plus classique en intégrant les résultats analytiques comme données d’apprentissage. Le renforcement du pôle R&D permet d’ouvrir un champ des usages potentiels conséquent et de rester à l’état de l’art.
Cet article est extrait du magazine ActuIA. Afin de ne rien manquer de l’actualité de l’intelligence artificielle, procurez vous ActuIA n°16, actuellement en kiosque et sur abonnement :