Hadopi et le CSA ont réalisé une étude conjointe sur les assistants vocaux et les enceintes connectées, afin de comprendre les usages et les perspectives de développement de ces technologies qui pourraient transformer les habitudes d’accès aux contenus culturels.
Visionnez la conférence de presse de présentation des résultats de l’étude, organisée par le CSA/Hadopi le 28 mai 2019 :
Le marché des assistants vocaux et enceintes connectées est en forte croissance
La pénétration des enceintes connectées sur le marché américain, où Amazon Echo est apparue en 2014, est encore plus rapide que celle des smartphones et des tablettes. 25% des américains ont aujourd’hui une enceinte connectée, avec une progression de 30% sur un an. Le deuxième marché est celui de la Chine, dominé par les acteurs locaux du fait de la régulation et de la langue mandarine représentant des difficultés techniques. Au Royaume Uni, 14,4% de la population adulte est équipée d’enceintes connectées, suivie de l’Allemagne, avec 10%. Selon l’étude, il est toutefois jugé peu probable qu’un quart des français soient connectés d’ici 2021.
Une technologie pratique dont il reste à développer l’intérêt
Les consommateurs ont majoritairement une vision positive des enceintes connectées, même s’ils restent plus partagés sur leur degré d’intérêt. La principale limite au développement des enceintes est liée à leur utilité encore restreinte par l’offre applicative. Les trois facteurs ayant un impact sur le développement des enceintes connectées identifiés par l’enquête sont : les habitudes et pratiques de consommation en ligne (Commande Amazon…), la disposition à payer pour consommer des contenus audiovisuels (abonnement Spotify, Deezer..) et le développement de la maison connectée, champs d’application dans lesquelles elles peuvent d’ores et déjà avoir une réelle utilité.
Des risques d’enfermement identifiés
Si l’étude évoque les craintes habituelles quant à la confidentialité des données privées, elle identifie également un risque d’enfermement dans des écosystèmes restreints encouragé par des accords commerciaux entre constructeurs et éditeurs ainsi que l’absence d’écran.
Téléchargez l’étude complète :
Vous pouvez télécharger l’étude complète ici.
Notre avis : L’arrivée des écrans va-t-elle changer la donne ?
L’étude ne porte que sur les enceintes connectées et assistants vocaux.
Ces enceintes connectées ont obligé les éditeurs à inventer de nouveaux modes d’interaction, reposant uniquement sur la voix. L’interface vocale trouve assez rapidement ses limites. La voix des assistants vocaux est de plus en plus naturelle, mais pas encore suffisamment pour lire un long texte de façon agréable à l’oreille. C’est probablement la raison pour laquelle seules les applications demandant une réponse brêve de l’assistant remportent un franc succès. Cela amène à s’interroger sur l’intérêt réel des assistants vocaux et quels sont sensés être leurs usages :
Pendant plusieurs années, les fabricants d’enceintes connectées ont tenté de nous vendre les enceintes connectées comme des ordinateurs conviviaux dotés d’un nouveau mode d’accès à l’information, avec par exemple la possibilité d’interroger wikipedia.
En n’exploitant que la synthèse vocale, ils ne sont par définition plus “multi” média et perdent la richesse d’internet : lecture séquentielle de l’information, difficulté à rebondir de sujet en sujet comment on peut aisément le faire de lien en lien. Ces éléments rendent souvent plus fastidieux l’usage des assistants vocaux que celui d’un ordinateur ou d’une tablette.
Or, les nouvelles générations d’assistants vocaux sont dotées d’écrans. Ces assistants pourraient marquer le début d’une première génération d’assistants ludiques réellement adaptés pour être intégrés au sein de notre salon et permettre l’adoption de nouveaux usages.
L’avenir est probablement à une fusion entre ces nouveaux assistants et les tablettes, en dotant les assistants de surfaces tactiles, ou en développant l’usage de la voix sur les tablettes, ce qui en ferait des outils réellement “passe-partout”, qui seraient capables de fournir les réponses sous la forme la plus adaptée, en fonction du contexte :
Une tablette posée sur le siège passager de notre voiture pourrait tout à fait nous répondre par la synthèse vocale, tandis que la même tablette, tenue entre nos mains, confortablement installé dans notre salon pourrait nous proposer un réponse hybride, en affichant les informations à l’écran et en nous proposant leur lecture à haute voix si on le souhaite. Il serait alors possible d’intéragir au choix, de façon tactile ou vocale avec l’appareil.
Ce type d’appareil, dont nous pouvons anticiper l’arrivée dans un futur proche pourrait réellement connaître un véritable succès et défier les projections de cette étude. Il nous semble donc évident que les interfaces vocales ont de l’avenir, mais elles seront très probablement amenées à se fondre, non pas dans des assistants vocaux, mais dans des assistants multimédias “multi-interfaces”. Tout le défi étant pour l’assistant de jongler entre ces interfaces avec le plus de justesse et de naturel possible.