En juin 2022, Meta déclarait vouloir “élargir son travail sur l’équité ses publicités”. Le 9 janvier dernier, l’entreprise a annoncé le lancement aux Etats-Unis de Variance Reduction System (VRS, ou système de réduction des écarts), une nouvelle technologie basée sur le machine learning, qui devrait l’aider à distribuer les publicités de manière plus équitable sur ses applications. Dans un premier temps, elle s’adressera aux annonces immobilières avant d’être étendue aux annonces d’emploi et de crédit.
Facebook a été souvent au coeur de polémiques et le sujet de nombreuses plaintes. La Cour d’appel du Québec vient d’ailleurs tout juste d’approuver un recours collectif intenté au nom d’utilisateurs se disant victimes de discrimination puisque Facebook avait permis aux annonceurs de cibler les annonces d’emploi et de logement en fonction de facteurs tels que l’âge, le sexe ou la race.
L’une de ces plaintes, déposée en août 2018, par le Secrétaire adjoint au logement équitable et à l’égalité auprès du Ministère américain du Logement et du Développement Urbain (HUD) accusait la société, donc aujourd’hui Meta, d’avoir violé le Fair Housing Act, une loi fédérale américaine votée en 1968, prohibant la discrimination en matière de logement.
L’accusation portait donc elle aussi sur le ciblage des annonces immobilières sur les plateformes de l’entreprise. En juin dernier, Meta et HUD ont trouvé un accord selon lequel Meta s’engageait notamment à supprimer les “options de ciblage publicitaire que les gens peuvent trouver sensibles”.
L’entreprise et le Ministère américain de la Justice ont travaillé de concert pour développer la nouvelle technologie VRS.
Meta déclarait en juin dernier :
“La discrimination en matière de logement, d’emploi et de crédit est un problème profondément enraciné avec une longue histoire aux États-Unis, et nous nous engageons à élargir les opportunités pour les communautés marginalisées dans ces espaces et d’autres”.
Elle ajoutait :
“Nous apportons ce changement en partie pour répondre aux commentaires que nous avons entendus de la part de groupes de défense des droits civils, de décideurs et de régulateurs sur la façon dont notre système publicitaire diffuse certaines catégories d’annonces personnalisées, en particulier en matière d’équité”.
Le framework VRS
Le SRV est un cadre d’apprentissage par renforcement dont l’objectif est de minimiser l’écart entre le nombre de personnes qui ont vu une publicité et le public cible plus large qui aurait pu la voir.
L’apprentissage par renforcement (reinforcement learning) est une forme de ML qui apprend des essais et des erreurs pour optimiser vers un résultat prédéfini – dans ce cas, pour minimiser la variance des impressions publicitaires entre les sous-groupes démographiques, quelle que soit la cause de cette variance.
Depuis l’accord avec le Ministère de la justice, les annonceurs ne peuvent pas utiliser les fonctionnalités de ciblage telles que l’âge, le sexe et le code postal lors de la définition de l’audience de leurs annonces. Le SRV ne reçoit donc pas ces données pour prendre des décisions, mais des données agrégées des répartitions démographiques.
Ainsi, lorsqu’une publicité a été présentée à un panel suffisamment important, le SRV mesure la répartition démographique globale des personnes qui l’ont vue pour la comparer à la répartition démographique du public cible admissible sélectionné par l’annonceur.
Afin de respecter la vie privée des personnes, le VRS s’appuie sur le Bayesian Improved Surname Geocoding (BISG), une méthodologie développée par la RAND Corporation qui intègre des informations sur le nom de famille et les géocodages pour mieux imputer la race et l’origine ethnique. Elle est construite avec des améliorations en matière de protection de la vie privée, notamment la confidentialité différentielle, une technique qui peut aider à protéger contre la réidentification des personnes dans les ensembles de données agrégées. Selon Meta, VRS est une avancée technologique significative représentant la façon dont l’IA peut être utilisée de manière responsable pour diffuser des publicités personnalisées.