L'un des développements les plus intéressants de la technologie basée sur l'intelligence artificielle est l'émergence de Modèles linguistiques étendus (LLM) et Avatars d'intelligence artificielle (Avatars d'IA) s'unir pour créer humains intelligents conversationnels.

Le marché des avatars d'IA a une valeur estimée à 156,19 milliards de dollars d'ici 2032 (The Brainy Insights). De nombreuses entreprises, dont Les laboratoires STAR de Samsung et des startups comme IA DeepBrain et Synthèse, innovent en permanence dans leur technologie d'intelligence artificielle (IA) et améliorent leurs humains IA afin de créer des expériences d'IA attrayantes et agréables.

By 2026, half of B2B buyers will interact with a digital human in a buying cycle. -- Gartner, 2022 HypeCycle Report

Les avatars d'IA conversationnelle modifient déjà la façon dont les entreprises et les organisations interagissent avec leurs clients et leurs utilisateurs.

Poursuivez votre lecture pour découvrir :

Le concept de LLM (Large Language Models)
Le développement d'avatars d'IA
Création d'IA conversationnelles semblables à des humains
L'impact des avatars d'IA conversationnelle sur les interactions entre les clients et les entreprises

Qu'est-ce qu'un modèle de langage large (LLM) ?

Le présentation de ChatGPT le mois de novembre 2022 a marqué un tournant dans la vulgarisation et l'acceptation généralisée de l'IA générative et des grands modèles de langage (LLM). OpenAI a démontré au public comment les LLM et la technologie de l'IA peuvent aider les entreprises et les particuliers à automatiser les tâches, à stimuler la créativité et même à faciliter le codage de logiciels, marquant ainsi le début d'une nouvelle ère d'utilisation de l'IA.

AI is like electricity. Just as electricity transformed every major industry a century ago, AI is now poised to do the same. – Andrew Ng

À la base, les LLM sont un type d'intelligence artificielle qui gère diverses tâches impliquant le traitement du langage naturel (NLP). Ces tâches incluent la génération et la catégorisation de texte, la fourniture de réponses conversationnelles et la traduction de texte entre les langues.

Les grands modèles linguistiques (LLM) sont exceptionnels dans leur capacité à comprendre et à reproduire naturellement le langage humain. Ils peuvent comprendre le contexte, élaborer des réponses naturelles et même imiter les nuances de la conversation, ce qui donne lieu à des interactions qui ressemblent à la façon dont les vrais humains communiquent entre eux.

Grands et petits LLM

Le terme « grand » fait référence au nombre de paramètres (poids et valeurs) que le LLM peut ajuster et modifier au fur et à mesure de son entraînement. Les plus grands LLM comme Open AI GPT-3, GPT-4 et celui de Google PalM 2, La MDA, BERT, Barde, et celui de Meta Lama 2 contiennent des centaines de millions, voire des milliards de paramètres. Des équipes de recherche comme celle du Technology Innovation Institute Falcon40B, Université de Berkeley Vicuna, Koala, ainsi que celui de l'université de Stanford Alpaga ont également publié leurs propres grands modèles linguistiques.

Malgré l'essor des LLM massifs, les tendances récentes se sont orientées vers des modèles plus petits, plus accessibles et personnalisables tels que Ada, Atlas, et Cohère.

Les modèles de langage plus petits sont non seulement plus rentables, mais ils sont également beaucoup plus précis pour réaliser des tâches commerciales spécifiques à un domaine. En effet, ils sont formés et optimisés sur la base de données soigneusement vérifiées qui répondent aux cas d'utilisation exacts qui intéressent les utilisateurs et les entreprises, plutôt que d'être formés sur toutes les données accessibles au public, qui incluent à la fois des bonnes et des mauvaises données.

It’s not enough to just scrub the internet to train LLM. Quality data counts - we all are going back to this truth — Thomas Wolf, co-founder and CSO of Hugging Face

LLM personnalisés

Les utilisateurs et les entreprises qui souhaitent mieux contrôler les réponses peuvent personnaliser les données qu'un LLM extrait pour modifier leur comportement et leurs résultats. Il existe deux manières principales d'y parvenir :

1. Intégrer‍

Les grands modèles de langage utilisent des intégrations pour projeter des données textuelles, telles que des mots ou des phrases, dans un espace vectoriel de grande dimension. Cela permet au LLM de capturer les relations sémantiques et les nuances contextuelles en catégorisant les textes en étiquettes ou en catégories, telles que positif ou négatif, spam ou non, actualités ou opinions, etc. (Microsoft).‍

2. Réglage fin‍

Le réglage de grands modèles de langage fait référence au processus d'affinement d'un modèle de langage d'IA pré-entraîné en l'entraînant sur un ensemble de données plus restreint et spécifique à une tâche. Ce processus permet au modèle de s'améliorer et de mieux fonctionner lors de la création de contenu précis et pertinent, tout en conservant ses capacités d'origine. Lorsque vous peaufinez un modèle d'IA, c'est comme si vous l'envoyiez aux études supérieures une fois qu'il a terminé ses études de premier cycle.

Table showing the differences between Embedding and Fine-tuning LLMs

Quels sont Des avatars d'IA ?

Digital humans are interactive, AI-driven representations that have some of the characteristics, personality, knowledge, and mindset of a human. — Gartner 2023

Les avatars sont des représentations virtuelles d'utilisateurs ou d'objets dans des environnements numériques. Les avatars traditionnels sont toujours sous le contrôle et la gestion des humains et ne peuvent pas effectuer d'actions qui ne sont pas programmées à l'avance. D'autre part, les avatars d'IA et les humains IA peuvent interagir avec de vraies personnes sans dépendre de l'action ou de la direction humaines. Ils peuvent également comprendre et prendre des décisions eux-mêmes en fonction du contexte du monde qui les entoure.

Au cours des dernières années, les humains dotés d'IA ont fait des progrès importants en termes d'apparence et de sonorité incroyablement réalistes. IA DeepBrain affirme que leurs avatars d'IA ressemblent à 96,5 % à ceux des humains, et vous pouvez voir à quel point les humains numériques STAR Labs de Samsung sont réalistes sur l'image ci-dessous.

Crédit d'image : STAR Labs

Généralement, les avatars d'IA hyperréalistes sont créés dans un studio d'enregistrement à l'aide d'un modèle humain réel, mais la création d'avatars peut désormais se faire entièrement numériquement, via des vidéos et des photos auto-enregistrées, ou grâce à la technologie d'échange de visages, qui ne fait que devenir plus rapide et plus facile à utiliser.

Les principaux éléments des avatars d'IA sont les suivants :

Apparence hyperréaliste: Les humains numériques deviennent de plus en plus réalistes et réalistes. Bien qu'ils soient souvent créés en studio puis synthétisés par un programme d'apprentissage automatique, il est désormais de plus en plus rapide et plus facile de créer des avatars numériques en utilisant uniquement des photos ou des vidéos autofilmées.
Mouvements naturels du corps : Les avatars d'IA utilisent un algorithme appelé Generative Adversarial Network (GAN) pour créer des mouvements fluides et naturels de la bouche et du corps. IA Les humains peuvent même synchroniser les mouvements de leurs lèvres de manière réaliste avec n'importe quelle entrée audio ou textuelle.
Réponses à faible latence : DeepBrain AI a signalé un taux de latence inférieur à 1 seconde entre l'entrée humaine et la sortie de l'avatar. Les avatars d'IA conversationnelle sont capables de répondre aux requêtes dans un délai minimal, ce qui permet d'obtenir un flux de conversation naturel et réaliste.
Synthèse vocale (TTS) : La technologie de synthèse vocale (TTS) a beaucoup évolué depuis les premiers assistants vocaux. De nos jours, le TTS peut produire des voix extrêmement réalistes dans toutes les langues. Lorsqu'il est associé à la synchronisation labiale, il peut générer une réplique humaine numérique parlant et réaliste de manière convaincante.

Que sont les conversations Des avatars d'IA ?

En 2023, les technologies AI avatar et LLM ont convergé pour créer un outil puissant pour les utilisateurs et changer la façon dont les entreprises améliorent leur interaction avec les clients. Les équipes de DeepBrain AI, Soul Machine, Uneeq et D-ID ont déjà commencé à créer des humains dotés d'IA conversationnels, et les résultats se sont révélés incroyablement naturels et réussis.

Vous pouvez considérer les LLM comme le cerveau des humains numériques conversationnels, tandis que les avatars de l'IA servent de vaisseau ou de corps. Ensemble, ils sont plus performants que les chatbots IA classiques en imitant l'ensemble du processus de communication humaine, y compris les signaux non verbaux tels que les expressions faciales et le langage corporel.

Les humains numériques conversationnels sont également dotés de puissantes capacités telles que la mémoire, les émotions et la créativité pour imiter pleinement la cognition et l'engagement humains. Cette technologie offre des possibilités infinies aux entreprises qui cherchent à créer des expériences attrayantes et personnalisées pour leurs clients.

Venn Diagram with large language models and AI avatars as the two main topics which overlap to be conversational Ai human

Les LLM donnent vie à des humains dotés d'IA

L'un des aspects les plus intéressants de l'utilisation des LLM avec l'IA conversationnelle est la possibilité de créer et de personnaliser leurs personnages et personnalités.

Vous pouvez concevoir un « représentant du service client qui fait des blagues à papa qui font grincer des dents » ou un « caissier de café sympathique et pétillant qui aime les vrais crimes ». Les entreprises peuvent même donner un personnage à la mascotte de leur marque afin que les clients puissent engager des conversations en face à face !

Des startups comme IA dans le monde et Character.ai utilisent déjà des LLM pour créer des avatars d'IA multidimensionnels dotés de personnalités, d'histoires et même de défauts intéressants. Associés à des avatars d'IA conversationnels, les entreprises peuvent proposer des expériences spéciales et amusantes à leurs utilisateurs.

Imaginez que vous vous rendiez dans un kiosque de Disneyland et que vous obteniez l'itinéraire de votre personnage Disney préféré. Ou demandez à une version IA de votre PDG de vous souhaiter la bienvenue et de vous parler pendant votre journée de travail !

Avantages supplémentaires des avatars d'IA conversationnelle

Les humains dotés d'une IA conversationnelle offrent une gamme complète d'avantages et de bénéfices, à la fois grâce aux LLM et aux avatars de l'IA... et bien plus encore ! Voici quelques points saillants :

Présence accueillante et personnalisée :

Alors que nos vies deviennent de plus en plus numériques, les avatars d'IA conversationnels offrent une interface d'interaction chaleureuse et accueillante. En ajoutant une touche d'humanité à l'IA, ces avatars d'IA créent une expérience utilisateur plus attrayante et personnalisée.

Disponibilité 24 heures sur 24 :

Les humains dotés d'IA peuvent gérer efficacement de grands volumes de demandes simultanément, garantissant ainsi un service personnalisé à tout moment.

Éliminez les barrières linguistiques

Les humains utilisant l'IA conversationnelle comprennent et parlent couramment plusieurs langues à la demande. Selon Uneq, leurs humains numériques peuvent comprendre 74 langues et en parler 43.

Support omnicanal.

Les avatars d'IA conversationnelle peuvent être configurés pour mémoriser tous les points de contact et interactions précédents, garantissant ainsi un parcours de communication cohérent pour les utilisateurs et les clients. Ils sont également accessibles sur toutes les plateformes numériques, du Web aux appareils mobiles en passant par les kiosques et même dans les environnements métavers.

This combination of human avatars and LLMs is re-writing the rule book on traditional human-computer interaction and opening new avenues for enhanced customer experiences, transformative education and training, immersive simulations, personalized content creation, and cross-cultural communication. — Eric Jang, Founder and CEO of Deepbrain AI

L'IA conversationnelle et les humains dans l'expérience client (CX)

Les initiatives commerciales axées sur l'expérience client privilégient les interactions significatives avec les clients par rapport aux transactions simples. Grâce aux avatars conversationnels basés sur l'IA, les clients peuvent participer à des conversations approfondies, poser plusieurs questions et discuter plus facilement de sujets qu'ils pourraient hésiter à aborder avec un agent humain.

Les humains dotés d'IA offrent une assistance aux clients qui souhaitent un service client unique, plus engageant et plus percutant. La section suivante explore les applications pratiques et les impacts positifs que les humains numériques conversationnels ont déjà eus dans divers secteurs.

Meet AI Humans as AI trainer. AI doctor, AI staff, AI Helper, AI engineer, AI anchor, AI tutor, AI chef, Ai coordinator — Crédit d'image : DeepBrain AI

1. Consultation financière :

Les avatars de l'IA remodèlent également la finance, comme le montre Les caissiers de banque basés sur l'IA de DeepBrain chez KB Bank. Ces avatars simplifient les demandes bancaires de routine, permettant à leurs véritables collègues humains de se concentrer sur des tâches plus complexes.

Le « Dani numérique » de l'Uneeq simule des discussions financières entre experts d'UBS, une institution bancaire suisse. Digital Dani offre à ses clients la possibilité de bénéficier de conseils financiers d'experts à la demande.

KB Bank Ai Human Kiosk Used in real life — Kiosque KB Bank. Crédit d'image : DeepBrain AI

2. Soutien pédagogique :

Dans le secteur de l'éducation, les humains utilisant l'IA conversationnelle peuvent devenir des tuteurs d'IA fiables et toujours disponibles. DeepBrain AI étend son portefeuille à l'éducation avec professeurs d'IA en temps réel à Kyowon Co. qui aident les étudiants à apprendre par le biais de conférences interactives et de sessions de questions-réponses.

Des humains intelligents conversationnels tels que Soul Machines Mya et Emma guident les étudiants tout au long de leur parcours universitaire à l'université de Maryville. Ces mentors numériques vous aident à postuler, partagent des informations sur la vie du campus et proposent des conseils professionnels et académiques.

3. Hospitalité :

Les concierges IA de DeepBrain chez Novotel présente l'utilisation de la technologie humaine de l'IA dans le secteur de l'hôtellerie. Disponibles 24 heures sur 24, 7 jours sur 7, ces avatars IA répondent à toutes les questions relatives aux voyages et aux services, permettant ainsi aux clients de profiter pleinement de leur séjour.

De même, « Iris numérique » de Soul Machines propose une assistance aux voyageurs à l'aéroport de Dallas Fort Worth, en améliorant leur voyage et en réduisant le stress des voyageurs grâce à des informations et des mises à jour en temps réel.

2. Engagement avec les médias :

Les humains utilisant l'IA conversationnelle redéfinissent les interactions entre fans et célébrités. En partenariat avec le juge America's Got Talent Howie Mandel, DeepBrain AI comble le fossé entre les célébrités et les fans. La création d'un jumeau IA pour célébrités favorise une connexion plus personnelle en permettant aux fans d'interagir et de converser avec une version numérique de leur star préférée.

Le « Einstein numérique » d'Uneeq approfondit ce concept en permettant aux utilisateurs de découvrir une version recréée du célèbre physicien Albert Einstein, révélant ainsi sa sagesse et son humour.

5. Santé et bien-être :

L'IA conversationnelle améliore les services de santé et de bien-être. DeepBrain AI s'est associé à Roche, une multinationale suisse du secteur de la santé, pour créer un conseiller en santé basé sur l'IA. L'AI Doctor offre une assistance 24h/24 et 7j/7 pour les demandes relatives à la santé et à Roche.

Le « Royaume-Uni numérique » d'Uneq avec Groov aide les utilisateurs à améliorer leurs habitudes de sommeil, contribuant ainsi à une meilleure santé mentale.

6. Des vies enrichissantes :

L'impact des avatars d'IA conversationnels s'étend même à la vie après la mort. « Re ; memory » de DeepBrain« Un service commémoratif permet de recréer des êtres chers sous forme d'avatars d'IA, leur apportant du réconfort et des liens pour aider leur famille à guérir et à préserver leur mémoire.

Re;memory picture of a couple communicating a passed family member as an AI — Re ; mémoire. Crédit d'image : DeepBrain AI

Ce n'est que le début...

L'émergence d'avatars d'IA et d'humains IA conversationnels représente une avancée significative dans le développement technologique. Il ouvre de nouvelles possibilités illimitées aux entreprises qui souhaitent créer des expériences plus personnalisées et plus engageantes pour leurs clients. Il est à la fois passionnant et décourageant de se demander ce que l'avenir nous réserve, mais une chose est sûre : la technologie humaine de l'IA n'en est qu'à ses débuts.

À mesure que nous progressons, il est essentiel de noter que la technologie des avatars LLM et AI en est encore à ses balbutiements et n'a pas encore atteint son plein potentiel. Grâce aux progrès de l'apprentissage automatique et du traitement du langage naturel, nous pouvons nous attendre à voir des avatars d'IA encore plus sophistiqués et des humains IA conversationnels encore plus sophistiqués dans un avenir proche. Ces avancées conduiront sans aucun doute à de nouvelles innovations et capacités, modifiant notre façon de vivre et de travailler d'une manière que nous ne pouvons que commencer à imaginer.

‍