La conversión de texto a voz (TTS) es la tecnología más avanzada para la mayoría de los asistentes de voz. No importa si alguien interactúa con Alexa, Siri, Google u otros; las respuestas suelen ser audio TTS que se reproduce en un altavoz inteligente, un teléfono móvil o un altavoz de automóvil. El paradigma actual del asistente de voz, que consiste en hablar con una caja negra y recibir una respuesta de voz incorpórea, funciona con los modelos de interacción actuales, pero esto no se traduce bien en el metaverso que vemos en el horizonte.
Participa en una serie de nuevas empresas emergentes en una carrera por desarrollar «humanos virtuales» o «gemelos digitales». Están creando lo que muy probablemente será la próxima generación de interfaces conversacionales basadas en interacciones digitales más naturales, auténticas y humanistas. Entonces, ¿por qué los humanos virtuales y por qué ahora? Unos pocos factores tecnológicos y socioeconómicos han creado la tormenta perfecta para la síntesis de vídeo en tiempo real y los humanos virtuales.
IMPULSORES DE TECNOLOGÍA
En comparación con las respuestas TTS conversacionales, no hay duda de que las soluciones de síntesis de vídeo requieren cargas de trabajo más altas (CPU+GPU) para generar vídeo y cargas útiles más altas (tamaño de archivo) para entregar vídeo. Sin embargo, el rendimiento cada vez mayor de la CPU y la GPU y la mayor disponibilidad aceleran el proceso de síntesis de vídeo en la nube y en la nube. Además, los avances en el procesamiento por lotes y el almacenamiento inteligente en caché han permitido una síntesis de vídeo en tiempo real que compite con las soluciones TTS en cuanto a velocidad de conversación. Por lo tanto, se ha abordado principalmente el problema de generar vídeos ultrarrealistas sobre la marcha. Esto lleva a ofrecer vídeo en tiempo real, lo que, gracias a las velocidades de banda ancha a través de Wi-Fi y 5G, ahora está disponible en la mayoría de los hogares, empresas y escuelas. Puedes ver la comparación en el siguiente vídeo.
SE BUSCA AYUDA (Y CONTENIDO)
Las empresas que exigen que los empleados se relacionen con los clientes, como hoteles, bancos o restaurantes de servicio rápido, tienen problemas para contratar y retener a nuevos empleados. La falta de empleados cualificados y disponibles puede dañar la percepción que los clientes tienen de la marca y generar una verdadera pérdida de ingresos. Introduzca a los humanos virtuales que pueden gestionar las solicitudes básicas de forma rápida y coherente. En Corea, tanto 7-11 como KB Bank han instalado quioscos de inteligencia artificial que dependen de un humano virtual para interactuar con los clientes. La implementación del 7-11 apoya una operación sin hombres (o mujeres).
Otra vertical prometedora para los humanos virtuales son los medios de comunicación, tanto los medios de comunicación como las redes sociales (personas influyentes). Ya sea que transmitas noticias las 24 horas del día o que sigas siendo relevante en TikTok, la necesidad es la misma: generar más contenido de vídeo y hacerlo más rápido. Una vez más, Asia ha tomado la delantera con Virtual Humans. Tanto cadenas de televisión como MBN y LG HelloVision complementan sus transmisiones en directo con versiones en Virtual Human de sus presentadoras principales, que proporcionan actualizaciones periódicas de las noticias a lo largo del día. Con llamadas a la API o una interfaz web intuitiva que dice «lo que escribes es lo que obtienes», los vídeos con Virtual Humans se pueden grabar en cuestión de minutos sin necesidad de cámara, equipo, luces, maquillaje, etc. Una herramienta que ahorra tiempo y costes y que se puede mezclar a lo largo del día para mantener el contenido actualizado.
«¿Cuál es nuestra estrategia para el Metaverso?» Esa pregunta se hace en las salas de conferencias de todos los sectores. Es fácil imaginar cómo las marcas que utilizan los humanos virtuales en 2D de hoy en día para recibir pedidos, ayudar y compartir noticias evolucionarán rápidamente hasta convertirse en las primeras pioneras del mundo 3D y del metaverso. Estad atentos a lo largo del año para ver algunos anuncios importantes en este espacio.