La synthèse vocale (TTS) est la technologie du jour pour la plupart des assistants vocaux. Cela ne fait aucune différence si quelqu'un interagit avec Alexa, Siri, Google ou d'autres ; les réponses sont généralement du son TTS diffusé par un haut-parleur intelligent, un téléphone portable ou un haut-parleur de voiture. Le paradigme actuel de l'assistant vocal qui consiste à parler à une boîte noire et à recevoir une réponse vocale désincarnée fonctionne avec les modèles d'interaction d'aujourd'hui, mais cela ne se traduit pas bien dans le métaverse que nous voyons à l'horizon.
Une foule de nouvelles entreprises en démarrage participeront à une course pour développer des « humains virtuels » ou des « jumeaux numériques ». Ils créent ce qui sera probablement la prochaine génération d'interfaces conversationnelles basées sur des interactions numériques plus naturelles, authentiques et humanistes. Alors pourquoi Virtual Humans, et pourquoi maintenant ? Quelques facteurs technologiques et socio-économiques ont créé la tempête idéale pour la synthèse vidéo en temps réel et les humains virtuels.
MOTEURS TECHNOLOGIQUES
Par rapport aux réponses TTS conversationnelles, il ne fait aucun doute que les solutions de synthèse vidéo nécessitent des charges de travail plus élevées (CPU+GPU) pour générer de la vidéo et des charges utiles plus importantes (taille de fichier) pour diffuser de la vidéo. Cependant, l'augmentation constante des performances du processeur et du processeur graphique et la disponibilité accrue accélèrent le processus de synthèse vidéo dans le cloud et en périphérie. De plus, les avancées en matière de traitement par lots et de mise en cache intelligente ont permis une synthèse vidéo en temps réel qui rivalise avec les solutions TTS en termes de vitesse de conversation. Ainsi, le goulot d'étranglement lié à la génération de vidéos ultra-réalistes à la volée a été principalement résolu. Cela permet de diffuser des vidéos en temps réel, qui, grâce aux vitesses haut débit via Wi-Fi et 5G, sont désormais facilement accessibles à la plupart des foyers, des entreprises et des écoles. Vous pouvez voir la comparaison dans la vidéo ci-dessous.
AIDE (ET CONTENU) SOUHAITÉS
Les entreprises qui ont besoin d'employés pour interagir avec leurs clients, telles que les hôtels, les banques ou les restaurants à service rapide, ont du mal à recruter et à fidéliser de nouveaux employés. Le manque d'employés disponibles et qualifiés peut nuire à la perception de la marque par les clients et entraîner une véritable perte de revenus. Entrez dans les humains virtuels capables de traiter les demandes de base rapidement et de manière cohérente. En Corée, 7-11 et KB Bank ont installé des kiosques IA qui s'appuient sur un humain virtuel pour interagir avec les clients. L'implémentation 7-11 prend en charge une opération sans homme (ou sans femme).
Les médias, à la fois les médias audiovisuels et les réseaux sociaux (influenceurs), constituent un autre secteur d'activité prometteur pour Virtual Humans. Qu'il s'agisse de diffuser des actualités 24 heures sur 24 ou de rester pertinent sur TikTok, le besoin est le même : générer plus de contenu vidéo et le rendre plus rapide. Une fois de plus, l'Asie a pris les devants avec Virtual Humans. Des chaînes de télévision telles que MBN et LG HelloVision complètent leurs émissions en direct avec des versions Virtual Human de leurs présentateurs principaux qui fournissent des mises à jour régulières tout au long de la journée. À l'aide d'appels d'API ou d'une interface Web intuitive « ce que vous tapez est ce que vous obtenez », les vidéos avec Virtual Humans peuvent être réalisées en quelques minutes sans avoir besoin d'une caméra, d'une équipe, d'éclairage, de maquillage, etc. Un outil qui permet de gagner du temps et de l'argent qui peut être mélangé tout au long de la journée pour maintenir le contenu à jour.
« Quelle est notre stratégie pour le métaverse ? » Cette question est posée dans les salles de conférence de tous les secteurs. Il est facile d'imaginer comment les marques qui tirent parti des humains virtuels 2D d'aujourd'hui pour prendre les commandes, aider et partager des actualités évolueront rapidement pour devenir les premières pionnières du monde 3D et du métaverse. Surveillez tout au long de l'année les grandes annonces dans ce domaine.