Les assistants vocaux qui imitent le style conversationnel de son utilisateur sont plus fiables et appréciés, selon une nouvelle étude réalisée par des chercheurs d’Apple. Ces résultats peuvent laisser penser comment Siri, l’assistant vocal d’Apple va évoluer avec le temps.
Un assistant mirroir
L’étude, intitulée Mirroring to Build Trust in Digital Assistants, a été conçue par des scientifiques travaillant pour Apple comme un moyen de voir comment les gens réagissent aux différents types de réponses des assistants vocaux. Les chercheurs ont examiné le ton, les manières et d’autres éléments de conversation de ces personnes pour apprendre à construire un assistant avec lequel les utilisateurs se sentent plus à l’aise pour parler et interagir régulièrement. Le rapport a été présenté ce mois-ci à la conférence Interspeech 2019 à Graz, en Autriche.
Selon les chercheurs, 70 % des gens préfèrent des réponses plus conversationnelles à des réponses laconiques et les personnes qui se sont identifiées comme bavardes préfèrent des réponses bavardes, tandis que celles qui ne sont pas bavardes préfèrent des réponses plus brèves de la part des assistants vocaux.
Pour le sondage, 20 bénévoles ont répondu à des questions conçues pour mesurer leur personnalité et leur façon de parler ainsi que pour avoir une idée de la fréquence et de la façon dont ils utilisent les assistants vocaux. Pour l’expérience proprement dite, chaque participant a été mis en relation avec un assistant vocal et s’est vu remettre une liste de demandes à effectuer. Ils ont demandé à l’assistant vocal de répondre à des questions en ligne, d’obtenir des indications, des bulletins météo,d’établir des horaires et des minuteries. L’assistant vocal a ensuite répondu avec différents niveaux de “bavardage”. Au cours de la deuxième phase de l’enquête, les volontaires ont interrogé l’assistant vocal, avec leur voix et leurs expressions faciales analysées par des capteurs.
Dans l’exemple donné dans le rapport, l’assistant vocal répondait à une question sur la météo par “23 degrés et clair”, “Il fera 23 degrés et clair”, “Il fera un minimum de 23 degrés avec un ciel ensoleillé”, “Il est censé faire 23 degrés et clair, alors ne vous fatiguez pas à apporter un pull ou une veste” ou “Mes sources me disent que qu’il devrait faire 23 degrés et clair. Tu n’as probablement pas besoin d’apporter un pull ou une veste.” Les volontaires jugeraient alors les réponses en les qualifiant de “bonnes”, “hors sujet”, “informations erronées”, “trop impolies” ou “trop désinvoltes”.
Un assistant qui parle de la même façon que son utilisateur
Il n’est pas très surprenant que les gens préfèrent un assistant vocal qui correspond à leur propre façon de parler. Refléter ceux avec qui vous communiquez pour les rendre plus à l’aise est quelque chose que les humains font les uns avec les autres, à la fois instinctivement et volontairement. Ce qui ressort, c’est la façon dont cette information peut être extraite de la façon dont les gens parlent et ensuite comprise par l’intelligence artificielle pour être mise à profit.
“Nous avons montré que l’opinion de l’utilisateur sur la sympathie et la fiabilité d’un assistant digital s’améliore lorsque l’assistant reflète le degré de conversation de l’utilisateur et que l’information nécessaire pour réaliser cette mise en miroir peut être extraite du discours de l’utilisateur”, ont écrit les chercheurs.
Les chercheurs ont identifié 95 caractéristiques acoustiques qui pourraient être utilisées pour varier la façon dont un assistant vocal répond à un utilisateur. En appliquant ces identificateurs, l’assistant vocal peut ajuster sa réponse en fonction des préférences de l’utilisateur à un niveau de conversation approprié.
L’application de ces connaissances à Siri pourrait aider Apple à concurrencer ses rivaux assistants vocaux conversationnels comme Alexa et Google Assistant.
La société a déjà travaillé à rendre Siri plus convivial, avec le nouveau logiciel Neural Text-To-Speech qui rend la voix synthétique de Siri plus humaine, en incluant des modèles de parole plus naturels et des phrases complexes. Et cette étude laisse penser qu’il y aura d’autres changements à Siri dans un proche avenir.