Intelligence artificielle et gestion de foule : zoom sur CrowdDNA

En novembre 2020, le projet de recherche européen CrowdDNA a été officiellement lancé. Il s’intéresse à la prédiction des mouvements de foule, à la détection des facteurs de risque et étudie de nouveaux modèles de simulation. Un sujet qui pourrait permettre d’éviter des drames liés à une brusque concentration de personnes et à des mouvements de foule, dans des stades, lors de concerts ou autres.

D’une durée de 42 mois, ce projet a été financé à hauteur de trois millions d’euros par le volet Open du programme Future Emerging Technology (FET) de Horizon 2020. CrownDNA rassemble l’Inria, l’université de Leeds, l’université Rey Juan Carlos de Madrid, l’université d’Ulm, le centre de recherche Jülich, ainsi que les entreprises Crowd Dynamics International et Onhys.

Julien Pettré, directeur de recherches à l’Inria, au centre de Rennes-Bretagne Atlantique, en est le coordinateur et nous a expliqué en quoi consistait ce projet de mesure de la dynamique des foules denses.


Dans le cadre des jeux olympiques 2024, nous vous offrons chaque jour un article d’archive issu du magazine ActuIA n°4 (avril 2021), dont le dossier principal est “Le sport à l’ère de l’IA”. Afin de découvrir le magazine ActuIA, nous vous invitons à vous rendre sur notre boutique. Tout nouvel abonnement d’un an vous donne droit à l’ensemble des archives au format numérique.


Comment est né le projet européen CrowdDNA ?

Nous travaillons depuis plus de quinze ans à l’Inria de Rennes sur les algorithmes de simulation de foule avec pour objectif de les rendre le plus réaliste possible, par exemple qu’ils soient capables de prédire les mouvements de foule dans des situations données. Pour ce faire, parallèlement à l’aspect algorithmique du problème, nous avons aussi œuvré à l’observation et la mesure du comportement de foules réelles en réalisant plusieurs expériences en laboratoire. L’idée est de mesurer le comportement humain dans un contexte collectif pour disposer de la matière nécessaire pour modéliser et simuler ces comportements. Les données expérimentales sont aussi là pour nous permettre d’évaluer nos résultats de simulation.

Le projet CrowdDNA est né de l’idée de faire passer cette approche qui réunit observation expérimentale et simulation à plus grande échelle : en impliquant plusieurs équipes de plusieurs pays, chacune spécialiste d’un aspect spécifique. Le projet est délimité dans le temps (trois ans et demi) et nécessite de nous concentrer sur une problématique précise : celle du comportement des foules denses, où le contact physique entre individus influence majoritairement le comportement de celle-ci.

Ce sujet central a un impact fort sur le plan sociétal, il aborde la question du confort et de la sûreté des événements de masse. Il s’agit de détecter les risques liés aux niveaux excessifs de densité qui peuvent apparaître dans une foule : cette surdensité engendre un risque d’étouffement ou de piétinement, et donc un risque mortel.

Il faut comprendre qu’une foule n’est pas contrôlable : lorsque la foule devient trop compacte, les individus n’ont aucune marge de manœuvre et il est alors trop tard pour agir. Il est primordial de détecterla formation de pics de densité dans la foule et de traiter ce risque le plus rapidement possible.

Quelles sont les différentes étapes fixées et comment se déroule la collaboration entre les différents partenaires ?

La vision du projet CrowdDNA à long terme est de mettre à disposition des organisateurs de ces événements des technologies qui les assistent dans la prédiction et la prévention des cas de surdensité. L’évolution récente de l’intelligence artificielle, en particulier des techniques de simulation et de traitement d’images (de foule), ouvre des perspectives dans ce sens. On pourra s’étonner d’aborder ce sujet à une heure où les foules denses ont disparu du fait de la pandémie en cours ! Cela nous montre simplement que ces projets se préparent très en amont, les premières discussions autour de la préparation du nôtre remontent à l’été 2018, pour finalement démarrer en novembre 2020.

Le projet s’articule autour de quatre grands piliers. Le premier concerne l’acquisition de données sur les comportements de foules denses. Deux équipes allemandes y participent (centre de recherche de Jülich et université d’Ulm). Le deuxième pilier travaille sur l’analyse de ces données et leur modélisation. Ici une équipe britannique de l’université de Leeds joue un rôle-clé : son but est de simuler les interactions physiques entre individus qui engendreront un mouvement de foule.

À l’inverse, une équipe espagnole de l’université de Madrid va tenter de définir une méthode pour inverser ces relations : pouvons-nous extraire certaines caractéristiques des interactions physiques à partir de l’observation du mouvement d’une foule ? C’est l’objet du troisième pilier du projet, qui constituera la base des technologies que nous envisageons de mettre en place à long terme. Enfin, le projet vise à nous mesurer à la réalitédu terrain. Les données de laboratoire sont indispensables à l’étude de certains mécanismes, mais il faut nous confronter à la réalité de l’organisation des événements de masse et des possibilités d’y utiliser de nouvelles technologies de gestion opérationnelle de foule. Notre quatrième et dernier pilier consiste à installer des observatoires dans des lieux accueillant des foules, et d’y mener des tests et démonstrations de nos résultats.

En cela, nous nous appuyons sur deux entreprises : une britannique, un des pays phare dans l’étude de la gestion des foules (depuis les jeux olympiques de 2012), et une française, plutôt axée sur le développement de simulateurs de foule. L’équipe française de l’Inria coordonne le projet et participe surtout à renforcer les liens entre expérimentation et modélisation car ces deux aspects proviennent de deux domaines académiques distants.

Le concept de foule est par définition très flou, or le comportement d’une foule et ses aspects imprévisibles peuvent énormément varier selon les caractéristiques et le contexte. Utilise-t-on actuellement le même modèle et les mêmes paramètres pour analyser une foule de manifestants, de spectateurs d’un concert de rock ou de personnes âgées en excursion ?

Je ne dirais pas que le concept de foule est flou, mais plutôt qu’il s’agit d’un sujet largement multidisciplinaire et que ce terme peut par conséquent recouvrir plusieurs définitions. Dans le projet CrowdDNA, nous nous penchons sur les mouvements de foule et sur les phénomènes physiques qui lui sont associés.
Nous pourrions définir simplement la foule comme un regroupement de personnes dans un même lieu, formant ainsi un certain niveau de densité. Il est vrai qu’il n’existe pas de nombre de personnes ni de niveau de densité critique pour commencer à parler de foule, mais celle-ci existe dès lors que l’on y observe des interactions entre individus, des signes clairs montrant que le comportement de chacun est influencé par celui de ses voisins, et qu’un couplage entre le comportement de la foule et celui des individus existe (par exemple la propagation d’une réaction au travers d’une foule).
Cependant il est tout à fait correct de dire qu’il existe une très grande variété de comportements de foule, eux-mêmes influencés par un très grand nombre de facteurs. Prenons quelques exemples. Le comportement d’une foule résulte en premier lieu de l’activité de chacun, influencée par la nature des individus qui la compose, leur âge, leur forme physique, leur état psychologique et émotionnel, leur culture, leurs relations sociales, mais aussi de l’environnement : éclairage, météo, ambiance sonore, etc. Un simulateur de foule a pour objectif de reproduire le comportement d’une foule réelle.

Un grand nombre de modèles différents existe, chacun capture un nombre de comportements limité au sein d’un domaine de validité limité (défini par exemple par le niveau de densité qu’il est capable de couvrir). Il existe deux grandes catégories d’approches. La première définit certains modèles, en analogie avec les fluides, et modélise la foule par les lois de la physique qui déterminent son niveau de densité dans le temps et dans l’espace, alors que dans la seconde des systèmes multi-agents reproduisent les actions des individus et leurs interactions locales pour en déduire le comportement d’une foule. Ainsi, suivant la situation qui doit être simulée, certains modèles se révéleront plus appropriés que d’autres.

Par exemple, dans le cas où les comportements sont uniformes, les premières approches faisant l’analogie avec les fluides seront appropriées, alors que lorsqu’on étudie les mouvements de foules résultant d’interactions entre individus motivés par différents buts, les secondes fondées sur de multiples actions seront plus appropriées.

Quoi qu’il en soit, une étape essentielle d’une simulation consiste à déterminer les paramètres représentatifs de la situation donnée et de la population qui constitue la foule. Des phases d’observations peuvent s’avérer nécessaires afin d’estimer les bonnes valeurs des paramètres utilisés. Pour les situations et comportements les plus basiques, des expériences ont été menées pour tenter d’évaluer des valeurs moyennes ainsi que l’influence des facteurs les plus importants, comme l’âge des individus. De ce fait, pour simuler des contextes et des populations très différentes, des modèles et paramètres différents sont utilisés.

Quelle est l’approche utilisée couramment dans l’état de l’art pour analyser les foules et quel est le rôle de l’IA dans ces recherches ?

Le terme “analyse des foules” recouvre deux concepts assez différents, avec des outils différents à la clé. Il peut s’agir d’essayer de comprendre comment les foules se comportent, comment certains phénomènes émergent ou comment les individus se comportent dans la foule. Dans ce cas, on utilise plutôt une approche par simulation : on vient modifier les règles et paramètres qui guident la simulation pour tester leur validité au regard d’observations de foules réelles. Ou au contraire, nous pouvons chercher à caractériser le comportement de foules réelles. Les approches se feront alors plutôt par le traitement du signal, par exemple dans l’idée d’extraire automatiquement les propriétés d’une foule observée en vidéo : densité, vitesse de déplacement, trajectoires individuelles, etc.
Ces deux types d’analyse, et leurs cortèges d’outils, sont restés relativement
isolés l’un de l’autre car émanant de champs disciplinaires séparés. Les deux appartiennent cependant au domaine de l’IA, l’un cherchant à reproduire le mouvement humain, l’autre cherchant à interpréter automatiquement des images.
Mais surtout les deux sont bouleversés par l’IA récente, entendez les méthodes d’apprentissage profond. Par exemple, plutôt que de définir manuellement les règles qui guident les algorithmes de simulation, la tendance va être d’apprendre automatiquement ces règles à partir de données existantes capturant le mouvement de foules réelles.

Comment décririez-vous votre approche ?

Simulation et traitement d’image de foule opèrent actuellement un rapprochement thématique et le projet CrowdDNA A peut être vu comme un pas supplémentaire dans cette direction. Ce rapprochement est en particulier dû à l’évolution des méthodes de simulation qui se basent de plus en plus sur l’utilisation de données. L’analyse d’images de foule va permettre d’extraire les données qui viennent nourrir les nouvelles méthodes de simulation. Réciproquement, l’amélioration des techniques de simulation permet d’améliorer les techniques d’analyse d’images de foule.
Ce rapprochement entre traitement d’image et simulation se concrétise dans le projet CrowdDNA à travers son objectif de créer des technologies numériques d’assistance à la gestion de foule dense.

En particulier nous cherchons à établir les relations entre mouvement de foule d’une part, et les poussées et pressions subies par les individus au sein de la foule d’autre part. Pourquoi est-ce important ? Parce que le niveau d’intensité des interactions physiques entre individus est celui qui caractérise le niveau de danger qu’encourt la foule. Cependant cette quantité est très difficilement mesurable.

Notre approche est que le mouvement de foule, visible et plus facilement quantifiable, va dépendre très fortement de ce niveau d’intensité. Et la simulation va nous permettre de comprendre et de générer les données de description les liens entre le niveau des forces échangées entre individus et les caractéristiques du mouvement de la foule en résultant. Si nous y parvenons, nous pourrons alors imaginer une technique d’analyse du mouvement d’une foule filmée en vidéo et permettre de révéler le niveau des interactions physiques entre individus, et donc, le niveau de danger actuel encouru.

L’approche CrowdDNA se caractérise aussi par une très forte implication dans l’étude fondamentale des interactions physiques entre individus, afin de mieux comprendre comment chacun réagit aux poussées et pressions qu’il subit. Ces études vont permettre de donner le jour à une nouvelle génération de simulateurs de foule capable de capturer ces phénomènes physiques de manière précise.

Rappelons que la foule dense est un sujet d’étude complexe et encore peu étudié. Le comportement des foules denses dépend largement de la physique des interactions où les individus subissent contacts, poussées et pressions et y réagissent de manière individuelle. CrowdDNA vise à étendre les connaissances au sujet de ces interactions, et à créer une génération de simulateur de foule capable d’en capturer les effets à l’échelle d’une foule entière.

Ces nouveaux simulateurs nous permettront de prédire la dynamique des foules
denses et nous ouvriront à de nouvelles méthodes d’analyse d’images de mouvements de foule pour détecter des niveaux d’intensité excessifs d’interactions entre individus, et ainsi de prévenir le risque de mouvements de foules dangereux avant qu’ils ne se produisent. Les foules peuvent être analysées à la manière de fluides, mais si cette approche permet d’avoir une vision très globale, elle ne tient pas compte des particularités de chacun.

Ne serait-il pas envisageable, grâce aux progrès technologiques, notamment en termes de performances matérielles, d’envisager plutôt les foules comme des systèmes multi-agents, afin de tenir compte des particularités de chaque individu ? Serait-ce utile ?

L’approche du projet CrowdDNA combine une analyse “macroscopique” du mouvement de la foule au travers d’une modélisation “microscopique” de la foule qui vient détailler les interactions physiques entre individus. Ce positionnement nous permet de tirer le meilleur bénéfice des deux approches. Nous visons une analyse temps-réel, en ligne, de la foule pour assister les opérateurs de lieux publics et leur permettre de prendre les meilleures décisions au meilleur moment. Il est naturellement plus réaliste de faire reposer cette analyse sur le mouvement global de la foule, car il est plus facile à mesurer et à traiter en temps réel. Notons par ailleurs que nous évitons certaines problématiques liées à la manipulation de données personnelles ou identifiantes : le mouvement global n’isole pas les individus dans l’analyse. En revanche, par la simulation et les études sur les interactions physiques en amont, nous pouvons comprendre les liens entre ce mouvement global et des comportements ou caractéristiques individuels, mais ces liens sont établis au préalable, hors-ligne. Cette approche nous distingue également d’autres travaux visant plutôt à évaluer directement le niveau de densité d’une foule par analyse d’image, typiquement, en comptant le nombre de personnes visibles à l’image sur une surface connue.

Nous partons du principe que le seuil critique de densité n’est pas facile à déterminer à l’avance, et qu’il dépend des nombreux facteurs évoqués précédemment. Notre idée est plutôt d’alerter lorsque l’atteinte de ce seuil critique de densité, quelle qu’en soit la valeur, transparaît sur les mouvements de la foule. En particulier, nous cherchons à repérer une propagation de certains mouvements au travers de la foule : nous envisageons l’idée selon laquelle la vitesse et la distance de propagation de ces mouvements seraient caractéristiques du niveau de densité et de l’intensité des interactions physiques entre individus. Et pire, au-delà de la propagation, une possible amplification des mouvements de foule se mettrait en place car les réactions de la foule dégagent éventuellement de l’énergie : nous sommes alors face au risque du déclenchement d’un mouvement dangereux. Nous attendons donc de pouvoir prédire l’occurrence de ces phénomènes pour les prévenir suffisamment en amont.

Comment le projet s’intègre-t-il dans le Programme FET Open et en quoi avoir le soutien de deux entreprises est important sur un sujet de ce type ?

Les travaux en laboratoire sont encore éloignés de la réalité du terrain. Si nous voulons tenter de rendre un jour disponibles des technologies nouvelles pour la gestion de foule, il est utile d’installer un dialogue entre ces deux univers. C’est ce que permet la participation des deux entreprises dans ce projet. L’une est plutôt axée sur le conseil à la préparation d’événements de masse et nous permettra d’accéder à certains événements : notre souhait est d’installer des sortes d’observatoires de terrain, des “living labs” pour tester certains concepts, faire connaître nos résultats et mieux intégrer la réalité des modes opératoires existants. L’autre entreprise se tourne vers le développement technologique de solutions pour la gestion opérationnelle de foule, et permet de préparer d’éventuels futurs transferts technologiques.

Partager l'article
intelligence artificielle
À PROPOS DE NOUS
Le portail francophone consacré à l'intelligence artificielle et à la datascience, à destination des chercheurs, étudiants, professionnels et passionnés.