Données vocales : Le Voice Lab et Datafunding lancent une campagne de data funding

Voice lab datafunding

Les technologies vocales ont connu un grand boom ces dernières années avec des solutions innovantes, des projets de recherche avec de nombreuses applications mais aussi la question de la protection des données. C’est dans ce cadre que le Voice Lab et Datafunding ont lancé une campagne de data funding avec pour principal objectif de collecter 2 000 heures de données vocales.

Cette initiative invite les Français à faire don de leurs données vocales afin de co-construire les technologies vocales de demain, ouvertes et au service de tous et mettre la voix au service d’une intelligence artificielle citoyenne. Au travers de cette collecte disponible sur le site de Datafunding, les utilisateurs peuvent partager leurs données vocales et aider ainsi la recherche, ainsi que l’ensemble de l’écosystème numérique de la voix et l’innovation en France, en Europe et dans le monde francophone.

« Le Message que nous souhaitons transmettre aux utilisateurs de Google Home, Alexa ou Siri l’appel suivant : les données de votre assistant vocal vous appartiennent. Faites-en don à la recherche française ! », explique Karel Bourgois, Président du Voice Lab.

« Aujourd’hui, de plus en plus de personnes souhaitent bénéficier d’appareils avec lesquels elles peuvent réellement communiquer naturellement. Pour développer de tels systèmes il est nécessaire d’accéder à des données vocales libres. C’est pourquoi nous lançons une campagne de data funding citoyen dans le respect des données personnelles. Chaque participant est invité à partager les données vocales stockées chez les GAFAM dans une marketplace française ! Celles-ci permettront à l’écosystème vocal français de développer des technologies souveraines indépendantes des géants du numérique que sont les GAFAM et BATX. Cet acte citoyen permettra de soutenir l’écosystème vocal français et le développement d’une technologie vocale diverse, dynamique et souveraine. »

Les données utilisateurs ont de la valeur. Le Voice Lab souhaite sensibiliser les citoyens sur la pleine propriété qu’ils gardent sur les données recueillies par les différents services d’Assistants Vocaux tels que Google Home, Alexa ou Siri. Le Voice Lab permet aujourd’hui aux citoyens de décider qui peut disposer de leurs données vocales et pour quels objectifs.

Devenus incontournables, les assistants vocaux sur enceintes connectées ou sur d’autres canaux vocaux comme le téléphone, reposent sur des moteurs de reconnaissance de la parole entraînés sur de très grands jeux de données récoltées auprès des utilisateurs lors de leurs interactions et auxquels seules quelques grandes entreprises ont accès. Grâce à l’opération de Data funding du Voice Lab, les utilisateurs peuvent dorénavant partager leurs données vocales et aider ainsi la recherche, ainsi que l’ensemble de l’écosystème numérique de la voix et l’innovation en France, en Europe et dans le monde francophone.

Le Voice Lab et Datafunding ont mis en place un site web qui permet très simplement à chaque utilisateur de donner son consentement au Voice Lab afin que celui-ci puisse récupérer ses données vocales auprès des éditeurs des assistants vocaux. Cet outil permet de gérer les consentements et de les révoquer automatiquement, si l’utilisateur décide d’arrêter sa contribution au Voice Lab.

Une fois récoltées les données sont anonymisées et normalisées pour contribuer aux corpus et créer des modèles de transcription indépendants et contributifs.

L’objectif principal est bien de mutualiser les données et de concevoir des modèles de reconnaissance vocale en langue française pour alimenter différents services de transcription automatique de la parole, entre autres open source. Les moteurs permettent ainsi aux différents acteurs – académiques, privés ou publics – de créer des services ou des produits vocaux en toute indépendance des GAFAM. Les laboratoires Français pourront ainsi lever de nombreux verrous, en particulier liés au volume et à la diversité des données disponibles.

La mission du Voice Lab est de créer une alternative aux solutions et aux modèles économiques existants, afin de garantir d’un côté le respect de la vie privée des utilisateurs et de l’autre de prévenir une dépendance économique aux GAFA et BATX sur les interfaces vocales qui seront les interfaces du futur.

Le Voice Lab (levoicelab.org) précise que ces données seront hébergées dans le strict respect de la vie privée et du droit relatif à la protection des données personnelles et que l’objectif est avant tout degarantir que les données des utilisateurs seront utilisées en respectant les valeurs de l’IA éthique by design, telles que le respect, la transparence, la loyauté, la sécurité, l’équité et la maîtrise.

Cette campagne est l’occasion de communiquer auprès du grand public et de faire connaître cette initiative auprès des citoyens.

Quelques exemples de produits et services qui pourront être créés par les membres du Voice Lab grâce à ces données :

  • Des applications de la reconnaissance vocale qui s’imposent dans de nombreux domaines métiers et sont par ailleurs à la base d’avancées en termes d’accessibilités (handicap visuel et auditif, illectronisme) ;
  • Création d’assistants vocaux embarqué ;
  • Compréhension des conversations téléphoniques avec un téléconseiller ;
  • Création d’assistants vocaux pour téléphone ou enceinte connectée ;
  • Aide aux malentendants ;
  • Sous-titrage et veille médias.
Recevez gratuitement l'actualité de l'intelligence artificielle

Suivez la Newsletter de référence sur l'intelligence artificielle (+ de 18 000 membres), quotidienne et 100% gratuite.


Tout comme vous, nous n'apprécions pas le spam. Vos coordonnées ne seront transmises à aucun tiers.
Partager l'article
1 an d'abonnement au magazine de référence sur l'IA pour 27,60€ Boutique ActuIA Recherche, Business, Impact : Restez à la page en matière d'intelligence artificielle.
intelligence artificielle
À PROPOS DE NOUS
Le portail francophone consacré à l'intelligence artificielle et à la datascience, à destination des chercheurs, étudiants, professionnels et passionnés.