LLM: Construyendo una IA humana menos artificial y más inteligente

Updated on
July 5, 2024
|
Technology
Published
August 23, 2023

Uno de los avances más interesantes en la tecnología impulsada por la inteligencia artificial es la aparición de Modelos de lenguaje extensos (LLM) y Avatares de inteligencia artificial (avatares de IA) uniéndonos para crear humanos con IA conversacional.

El mercado de avatares de IA tendrá un valor estimado de 156 190 millones de dólares en 2032 (The Brainy Insights). Muchas empresas, entre ellas Los laboratorios STAR de Samsung y startups como Inteligencia artificial DeepBrain y Síntesis, innovan continuamente su tecnología de inteligencia artificial (IA) y mejoran sus humanos de IA para crear experiencias de IA atractivas y agradables.

By 2026, half of B2B buyers will interact with a digital human in a buying cycle. -- Gartner, 2022 HypeCycle Report

Los avatares de IA conversacional ya están cambiando la forma en que las empresas y las organizaciones interactúan con los clientes y los usuarios.

Sigue leyendo para descubrir:

  • El concepto de LLM (modelos lingüísticos grandes)
  • El desarrollo de los avatares de IA
  • Creación de IA conversacionales similares a las humanas
  • El impacto de los avatares de IA conversacional en las interacciones entre clientes y empresas

¿Qué es un modelo de lenguaje grande (LLM)?

El introducción de ChatGPT el mes de noviembre de 2022 marcó un momento crucial en la popularización y la aceptación generalizada de la IA generativa y los modelos de grandes lenguajes (LLM). OpenAI demostró al público cómo los LLM y la tecnología de inteligencia artificial pueden ayudar a las empresas y a las personas a automatizar las tareas, estimular el pensamiento creativo e incluso ayudar a la codificación del software, marcando una nueva era en la utilización de la IA.

AI is like electricity. Just as electricity transformed every major industry a century ago, AI is now poised to do the same.  – Andrew Ng

En esencia, los LLM son un tipo de inteligencia artificial que maneja varias tareas relacionadas con el procesamiento del lenguaje natural (PNL). Estas tareas incluyen generar y categorizar textos, proporcionar respuestas conversacionales y traducir textos entre idiomas.

Los grandes modelos lingüísticos (LLM) son excepcionales en su capacidad para comprender y replicar el lenguaje humano de forma natural. Pueden entender el contexto, generar respuestas naturales e incluso emular los matices de una conversación, lo que resulta en interacciones que se asemejan a la forma en que los humanos reales se comunican entre sí.

LLM grandes y pequeños

El término «grande» se refiere a la cantidad de parámetros (pesos y valores) que el LLM puede ajustar y cambiar a medida que se entrena. Los LLM más grandes, como los de Open AI GPT-3, GPT-4 y los de Google Palma 2, La MDA, BERTA, Bardo, y Meta's Llama 2 contienen de cientos de millones a miles de millones de parámetros. Equipos de investigación como el del Instituto de Innovación Tecnológica Falcon 40B, de la Universidad de California en Berkeley Vicuña, Koala, así como la de la Universidad de Stanford Alpaca también han publicado sus propios modelos lingüísticos de gran tamaño.

A pesar del auge de los LLM masivos, las tendencias recientes se han desplazado hacia modelos más pequeños, accesibles y personalizables, como Ada, Atlas, y CoHERE.

Los modelos lingüísticos más pequeños no solo son más rentables, sino que también son mucho más precisos a la hora de realizar tareas empresariales específicas de un dominio. Esto se debe a que están capacitados y optimizados a partir de datos cuidadosamente examinados que abordan los casos de uso exactos que interesan a los usuarios y las empresas, en lugar de capacitarlos sobre todos los datos disponibles públicamente, que incluyen datos buenos y malos.

It’s not enough to just scrub the internet to train LLM.  Quality data counts - we all are going back to this truth   — Thomas Wolf, co-founder and CSO of Hugging Face

LLM personalizados

Los usuarios y las empresas que desean tener más control sobre las respuestas pueden personalizar los datos de los que extrae un LLM para modificar su comportamiento y resultados. Hay dos formas principales de lograrlo:

1. Incrustación

Los modelos de lenguaje de gran tamaño utilizan incrustaciones para proyectar datos textuales, como palabras u oraciones, en un espacio vectorial de alta dimensión. Esto permite al LLM capturar las relaciones semánticas y los matices contextuales al clasificar los textos en etiquetas o categorías, como positivo o negativo, spam o no spam, noticias u opiniones, etc. (Microsoft).

2. Ajuste fino

El ajuste de los modelos de lenguaje de gran tamaño se refiere al proceso de refinar un modelo de lenguaje de IA previamente entrenado entrenándolo en un conjunto de datos más limitado y específico para cada tarea. Este proceso ayuda al modelo a mejorar y a funcionar mejor a la hora de crear contenido preciso y relevante, a la vez que mantiene sus capacidades originales. Cuando perfeccionas un modelo de IA, es como enviarlo a una escuela de posgrado después de terminar la licenciatura.

Table showing the differences between Embedding and Fine-tuning LLMs

Qué son ¿Avatares de IA?

Digital humans are interactive, AI-driven representations that have some of the characteristics, personality, knowledge, and mindset of a human.   — Gartner 2023

Los avatares son representaciones virtuales de usuarios u objetos en entornos digitales. Los avatares tradicionales siempre están bajo el control y la gestión de los humanos y no pueden realizar acciones que no estén programadas de antemano. Por otro lado, los avatares de la IA y los humanos basados en la IA pueden interactuar con personas reales sin depender de la agencia o la dirección humanas. También pueden entender y tomar decisiones por sí mismos en función del contexto del mundo que los rodea.

En los últimos años, los humanos con IA han logrado avances significativos en su apariencia y sonido increíblemente realistas. Inteligencia artificial DeepBrain afirma que sus avatares de IA tienen un aspecto y un comportamiento un 96,5% similares a los de los humanos, y puedes ver lo realistas que son los humanos digitales de STAR Labs de Samsung en la siguiente imagen.

STAR labs avatar examples. AI humans in different outfits and poses
Crédito de imagen: STAR Labs

Por lo general, los avatares de IA hiperrealistas se crean en un estudio de grabación con un modelo humano real, pero ahora la creación de avatares también se puede hacer de forma completamente digital, mediante vídeos e imágenes autograbados o mediante la tecnología de intercambio de rostros, y la tecnología cada vez es más rápida y fácil de usar.

Los elementos clave de los avatares de IA son:

  1. Apariencia hiperrealista: Los humanos digitales son cada vez más realistas y realistas. Aunque a menudo se crean en un estudio y luego se sintetizan mediante un programa de aprendizaje automático, ahora es cada vez más rápido y fácil crear avatares digitales utilizando solo fotos o vídeos filmados por uno mismo.
  2. Movimientos corporales naturales: Los avatares de IA utilizan un algoritmo llamado Generative Adversarial Network (GAN) para crear movimientos suaves y naturales de la boca y el cuerpo. Los humanos basados en la IA pueden incluso sincronizar los movimientos de sus labios de forma realista con cualquier entrada de audio o texto.
  3. Respuestas de baja latencia: DeepBrain AI informó de una tasa de latencia de menos de 1 segundo entre la entrada humana y la salida de avatar. Los avatares de IA conversacional pueden responder a las consultas con un retraso mínimo, lo que genera un flujo de conversación natural y realista.
  4. Conversión de texto a voz (TTS): La tecnología de conversión de texto a voz (TTS) ha recorrido un largo camino desde los primeros asistentes de voz. Hoy en día, el TTS puede producir voces extremadamente realistas en todos los idiomas. Cuando se combina con la sincronización de labios, puede generar una réplica humana digital parlante y convincentemente real.

Qué son conversacionales ¿Avatares de IA?

En 2023, las tecnologías de avatar de IA y LLM convergieron para crear una herramienta poderosa para los usuarios y cambiar la forma en que las empresas mejoran la forma en que interactúan con los clientes. Los equipos de DeepBrain AI, Soul Machine, Uneeq y D-ID ya han empezado a crear seres humanos basados en la IA conversacionales, y los resultados han sido asombrosamente naturales y satisfactorios.

Puedes pensar en los LLM como el cerebro detrás de los humanos digitales conversacionales, mientras que los avatares de la IA actúan como el recipiente o el cuerpo. En conjunto, funcionan mejor que los chatbots de IA normales al imitar todo el proceso de la comunicación humana, incluidas las señales no verbales, como las expresiones faciales y el lenguaje corporal.

Los humanos digitales conversacionales también están equipados con poderosas capacidades como la memoria, las emociones y la creatividad para emular completamente la cognición y el compromiso humanos. Esta tecnología ofrece infinitas posibilidades para las empresas que buscan crear experiencias atractivas y personalizadas para sus clientes.

Venn Diagram with large language models and AI avatars as the two main topics which overlap to be conversational Ai human

Los LLM dan vida a los humanos con IA

Uno de los aspectos más interesantes del uso de los LLM con IA conversacional es la capacidad de crear y personalizar sus personajes y personalidades.

Puedes diseñar un «representante de servicio al cliente que haga bromas sobre papá que provoquen vergüenza» o un «cajero de café amable y alegre al que le encante el crimen real». ¡Las empresas pueden incluso darle un personaje a la mascota de su marca para que los clientes puedan entablar conversaciones cara a cara!

Startups como IA en el mundo y Character.ai ya están utilizando los LLM para crear avatares de IA multidimensionales con personalidades interesantes, historias de fondo e incluso defectos. En combinación con los avatares de IA conversacionales, las empresas pueden crear experiencias especiales y divertidas para los usuarios.

Imagina ir a un quiosco de Disneyland y recibir indicaciones de tu personaje favorito de Disney. ¡O que una versión basada en inteligencia artificial de tu director ejecutivo te dé la bienvenida y hable contigo durante tu día de trabajo!

Ventajas adicionales de los avatares de IA conversacionales

Los humanos con IA conversacional ofrecen una amplia gama de ventajas y beneficios tanto de los LLM como de los avatares de IA... ¡y algo más! Estos son algunos de los aspectos más destacados:

Presencia acogedora y agradable:

A medida que nuestras vidas se vuelven cada vez más digitales, los avatares conversacionales de IA proporcionan una interfaz cálida y acogedora para la interacción. Al añadir un elemento de humanidad a la IA, estos avatares de IA crean una experiencia de usuario más atractiva y personalizada.

Disponibilidad las 24 horas:

Los humanos de IA pueden gestionar de manera eficiente grandes volúmenes de consultas de forma simultánea, garantizando un servicio personalizado en todo momento.

Rompa las barreras lingüísticas

Los humanos con IA conversacional entienden y hablan con fluidez varios idiomas a pedido. Según Uneeq, sus humanos digitales pueden entender 74 idiomas y hablar 43 de ellos.

Soporte omnicanal.

Los avatares de IA conversacional se pueden configurar para recordar todos los puntos de contacto e interacciones anteriores, lo que garantiza un viaje de comunicación coherente para los usuarios y los clientes. También se puede acceder a ellos en todas las plataformas digitales, desde la web y los dispositivos móviles hasta los quioscos e incluso en entornos metaversos.

This combination of human avatars and LLMs is re-writing the rule book on traditional human-computer interaction and opening new avenues for enhanced customer experiences, transformative education and training, immersive simulations, personalized content creation, and cross-cultural communication.   — Eric Jang, Founder and CEO of Deepbrain AI

Los humanos con IA conversacional en la experiencia del cliente (CX)

Las iniciativas empresariales centradas en la experiencia del cliente dan prioridad a las interacciones significativas con los clientes por encima de las transacciones simples. Con los avatares de IA conversacional, los clientes pueden entablar conversaciones extensas, plantear múltiples consultas y tener más facilidad para tratar asuntos que dudarían en plantearle a un agente humano.

Los humanos de IA ofrecen asistencia a los clientes que desean un servicio de atención al cliente único, más atractivo e impactante. La siguiente sección profundiza en las aplicaciones prácticas y los impactos positivos que los humanos digitales conversacionales ya han tenido en varios sectores.

Meet AI Humans as AI trainer. AI doctor, AI staff, AI Helper, AI engineer, AI anchor, AI tutor, AI chef, Ai coordinator
Crédito de imagen: DeepBrain AI

1. Consulta financiera:

Los avatares de la IA también están remodelando las finanzas, como lo demuestra Los cajeros bancarios con inteligencia artificial de DeepBrain en KB Bank. Estos avatares simplifican las consultas bancarias rutinarias, lo que permite a sus compañeros de trabajo humanos de la vida real centrarse en tareas más complejas.

El «Dani digital» de Uneeq simula las conversaciones financieras de expertos de UBS, una institución bancaria de Suiza. Digital Dani ofrece a los clientes la comodidad de un asesoramiento financiero experto bajo demanda.

KB Bank Ai Human Kiosk Used in real life
Quiosco KB Bank. Crédito de imagen: DeepBrain AI

2. Apoyo educativo:

En el sector educativo, los humanos de IA conversacional pueden convertirse en tutores de IA confiables y siempre disponibles. DeepBrain AI amplía su cartera a la educación con Profesores de IA en tiempo real en Kyowon Co. que ayudan a los estudiantes a aprender a través de conferencias interactivas y sesiones de preguntas y respuestas.

Los humanos con IA conversacional, como Soul Machines Mya y Emma, guían a los estudiantes a lo largo de su trayectoria académica en la Universidad de Maryville. Estos mentores digitales ayudan con las solicitudes, comparten ideas sobre la vida en el campus y ofrecen orientación profesional y académica.

3. Hospitalidad:

Los conserjes de inteligencia artificial de DeepBrain en Novotel muestra el uso de la tecnología humana de IA en la hostelería. Disponibles las 24 horas del día, los 7 días de la semana, estos avatares de inteligencia artificial responden a todas las consultas sobre viajes y servicios, lo que permite a los huéspedes disfrutar plenamente de su estancia.

Del mismo modo, «Iris digital» de Soul Machines ofrece apoyo a los viajeros en el aeropuerto de Dallas Fort Worth, mejorando su viaje y reduciendo el estrés de los viajeros con información y actualizaciones en tiempo real.

2. Participación de los medios:

Los humanos con IA conversacional están redefiniendo las interacciones entre fanáticos y celebridades. Al asociarse con el juez de America's Got Talent Howie Mandel, La IA de DeepBrain está cerrando la brecha entre las celebridades y los fanáticos. La creación de un gemelo basado en la IA que sea una celebridad ayuda a fomentar una conexión más personal, ya que permite a los fans interactuar y conversar con una versión digital de su estrella favorita.

El «Einstein digital» de Uneeq lleva este concepto más allá, ya que permite a los usuarios interactuar con una versión recreada del renombrado físico Albert Einstein, desbloqueando su sabiduría y humor.

5. Salud y bienestar:

La IA conversacional está mejorando los servicios de salud y bienestar. DeepBrain AI se ha asociado con Roche, una empresa sanitaria multinacional suiza, para crear un asesor de salud basado en la IA. The AI Doctor ofrece asistencia las 24 horas del día, los 7 días de la semana, para consultas relacionadas con la salud y Roche.

El «Reino Unido digital» de Uneeq with Groov ayuda a los usuarios a lograr mejores patrones de sueño, lo que contribuye a mejorar la salud mental.

6. Enriquecer vidas:

El impacto de los avatares conversacionales de IA se extiende incluso al más allá. «Re; memory» de DeepBrain«El servicio conmemorativo recrea a los seres queridos en avatares de inteligencia artificial, proporcionando consuelo y conexión para ayudar a su familia a sanar y mantener viva su memoria.

Re;memory picture of a couple communicating a passed family member as an AI
Re; memoria. Crédito de imagen: DeepBrain AI

Solo el principio...

La aparición de avatares de IA y humanos conversacionales con IA representa un importante avance en el desarrollo tecnológico. Abre nuevas e ilimitadas posibilidades para las empresas que buscan crear experiencias más personalizadas y atractivas para sus clientes. Es emocionante y abrumador preguntarse qué depara el futuro, pero una cosa es segura: la tecnología humana basada en la inteligencia artificial no ha hecho más que empezar.

A medida que avanzamos, es esencial tener en cuenta que la tecnología de avatares de LLM e IA aún está en pañales y aún no ha alcanzado su máximo potencial. Con los avances en el aprendizaje automático y el procesamiento del lenguaje natural, podemos esperar ver avatares de inteligencia artificial y humanos con IA conversacionales aún más sofisticados en un futuro próximo. Sin duda, estos avances conducirán a nuevas innovaciones y capacidades, y cambiarán la forma en que vivimos y trabajamos de una manera que solo podemos empezar a imaginar.

Most Read

Most Read

Mantengámonos conectados

Nuestro equipo está listo para apoyarlo en su viaje humano virtual. Haga clic a continuación para comunicarse con nosotros y alguien se pondrá en contacto con usted en breve.