Uno degli sviluppi più interessanti della tecnologia basata sull'intelligenza artificiale è l'emergere di Modelli linguistici di grandi dimensioni (LLM) e Avatar di intelligenza artificiale (avatar AI) unirsi per creare umani con intelligenza artificiale conversazionale.

Il mercato degli avatar con intelligenza artificiale ha un valore stimato di 156,19 miliardi di dollari entro il 2032 (The Brainy Insights). Molte aziende, tra cui STAR Labs di Samsung e startup come IA DeepBrain e Sintesi, innovano continuamente la loro tecnologia di intelligenza artificiale (AI) e migliorano i loro umani IA per creare esperienze di intelligenza artificiale coinvolgenti e divertenti.

By 2026, half of B2B buyers will interact with a digital human in a buying cycle. -- Gartner, 2022 HypeCycle Report

Gli avatar di intelligenza artificiale conversazionale stanno già cambiando il modo in cui aziende e organizzazioni interagiscono con clienti e utenti.

Continua a leggere per scoprire:

Il concetto di LLM (Large Language Models)
Lo sviluppo di avatar AI
Creazione di IA conversazionali simili a quelle umane
L'impatto degli avatar di intelligenza artificiale conversazionale sulle interazioni tra clienti e aziende

Cos'è un Large Language Model (LLM)?

Le introduzione di ChatGPT il novembre 2022 ha segnato un momento cruciale nella divulgazione e nell'accettazione diffusa dell'IA generativa e dei modelli in lingua larga (LLM). OpenAI ha dimostrato al pubblico come gli LLM e la tecnologia AI possono aiutare aziende e individui ad automatizzare le attività, stimolare il pensiero creativo e persino aiutare nella codifica del software, segnando una nuova era di utilizzo dell'IA.

AI is like electricity. Just as electricity transformed every major industry a century ago, AI is now poised to do the same. – Andrew Ng

Fondamentalmente, gli LLM sono un tipo di intelligenza artificiale che gestisce varie attività che coinvolgono l'elaborazione del linguaggio naturale (NLP). Queste attività includono la generazione e la categorizzazione del testo, la fornitura di risposte conversazionali e la traduzione di testo tra lingue.

I Large Language Model (LLM) sono eccezionali nella loro capacità di comprendere e replicare il linguaggio umano in modo naturale. Sono in grado di comprendere il contesto, costruire risposte naturali e persino emulare le sfumature della conversazione, dando luogo a interazioni che assomigliano a come i veri umani comunicano tra loro.

LLM grandi e piccoli

Il termine «grande» si riferisce al numero di parametri (pesi e valori) che il LLM può regolare e modificare durante l'allenamento. I più grandi LLM come Open AI GPT-3, GPT-4 e Google PalM 2, La MDA, BERT, Bardoe Meta's Lama 2 contengono da centinaia di milioni a miliardi di parametri. Gruppi di ricerca come quelli del Technology Innovation Institute Falcon 40B, UC Berkeley's Vicuña, Koala, così come la Stanford University Alpaca hanno anche rilasciato i propri modelli linguistici di grandi dimensioni.

Nonostante l'ascesa dei grandi LLM, le tendenze recenti si sono spostate verso modelli più piccoli, più accessibili e personalizzabili come Ada, Atlantee Coerente.

I modelli linguistici più piccoli non sono solo più efficienti in termini di costi, ma sono anche molto più accurati nel raggiungimento di attività aziendali specifiche del dominio. Questo perché sono addestrati e ottimizzati su dati attentamente controllati che rispondono agli esatti casi d'uso che interessano gli utenti e le aziende, anziché essere formati su tutti i dati disponibili al pubblico, inclusi dati validi e non validi.

It’s not enough to just scrub the internet to train LLM. Quality data counts - we all are going back to this truth — Thomas Wolf, co-founder and CSO of Hugging Face

LLM personalizzati

Gli utenti e le aziende che desiderano un maggiore controllo sulle risposte possono personalizzare i dati da cui un LLM attinge per modificarne il comportamento e l'output. Esistono due modi principali per raggiungere questo obiettivo:

1. Incorporamento‍

I modelli linguistici di grandi dimensioni utilizzano gli incorporamenti per proiettare dati testuali, come parole o frasi, in uno spazio vettoriale ad alta dimensione. Ciò consente all'LLM di catturare relazioni semantiche e sfumature contestuali classificando i testi in etichette o categorie, come positivo o negativo, spam o no spam, notizie o opinioni e così via (Microsoft).‍

2. Messa a punto‍

La messa a punto di modelli linguistici di grandi dimensioni si riferisce al processo di perfezionamento di un modello linguistico di intelligenza artificiale pre-addestrato addestrandolo su un set di dati più ristretto e specifico per attività. Questo processo aiuta il modello a migliorare e a ottenere prestazioni migliori nella creazione di contenuti precisi e pertinenti, pur mantenendo le sue capacità originali. Quando si perfeziona un modello di intelligenza artificiale, è come inviarlo a una scuola di specializzazione dopo aver terminato la laurea.

Table showing the differences between Embedding and Fine-tuning LLMs

Cosa sono Avatar AI?

Digital humans are interactive, AI-driven representations that have some of the characteristics, personality, knowledge, and mindset of a human. — Gartner 2023

Gli avatar sono rappresentazioni virtuali di utenti o oggetti in ambienti digitali. Gli avatar tradizionali sono sempre sotto il controllo e la gestione degli esseri umani e non possono eseguire azioni non programmate in anticipo. D'altra parte, gli avatar AI e gli umani dotati di intelligenza artificiale possono interagire con persone reali senza fare affidamento sull'azione o sulla direzione umana. Possono anche comprendere e prendere decisioni da soli in base al contesto del mondo che li circonda.

Negli ultimi anni, gli umani dotati di intelligenza artificiale hanno fatto passi da gigante nell'apparire e suonare incredibilmente realistici. IA DeepBrain afferma che i loro avatar AI sembrano e agiscono per il 96,5% in modo simile agli umani, e puoi vedere quanto siano realistici gli umani digitali STAR Labs di Samsung nella foto qui sotto.

Credito di immagine: STAR Labs

In genere, gli avatar AI iperrealistici vengono creati in uno studio di registrazione con un modello umano reale, ma ora la creazione di avatar può essere eseguita anche in modo completamente digitale, tramite video e immagini autoregistrati o tramite la tecnologia di scambio di volti, e la tecnologia sta diventando sempre più veloce e facile da usare.

Gli elementi chiave degli avatar AI sono:

Aspetto iperrealistico: Gli esseri umani digitali stanno diventando sempre più realistici e realistici. Sebbene siano spesso creati in studio e poi sintetizzati da un programma di apprendimento automatico, ora sta diventando più semplice e veloce creare avatar digitali utilizzando solo foto o video autofilmati.
Movimenti naturali del corpo: Gli avatar AI utilizzano un algoritmo chiamato Generative Adversarial Network (GAN) per creare movimenti fluidi e naturali della bocca e del corpo. Gli umani dotati di intelligenza artificiale possono persino sincronizzare i movimenti delle labbra in modo realistico con qualsiasi input audio o di testo.
Risposte a bassa latenza: DeepBrain AI ha riportato un tasso di latenza inferiore a 1 secondo tra l'input umano e l'output dell'avatar. Gli avatar di intelligenza artificiale conversazionale sono in grado di rispondere alle domande con un ritardo minimo, generando un flusso di conversazione naturale e realistico.
Sintesi vocale (TTS): La tecnologia Text-to-Speech (TTS) ha fatto molta strada dai primi assistenti vocali. Al giorno d'oggi, TTS è in grado di produrre voci estremamente realistiche in tutte le lingue. Se combinato con la sincronizzazione labiale, può generare una replica umana digitale parlante e realistica in modo convincente.

Cosa sono i conversazionali Avatar AI?

Nel 2023, le tecnologie AI avatar e LLM si sono unite per creare un potente strumento per gli utenti e cambiare il modo in cui le aziende migliorano il modo in cui interagiscono con i clienti. I team di DeepBrain AI, Soul Machine, Uneeq e D-ID hanno già iniziato a creare esseri umani dotati di intelligenza artificiale conversazionale e i risultati sono stati straordinariamente naturali e di successo.

Puoi pensare agli LLM come al cervello dietro gli umani digitali conversazionali, mentre gli avatar AI fungono da contenitore o corpo. Insieme, hanno prestazioni migliori rispetto ai normali chatbot di intelligenza artificiale imitando l'intero processo di comunicazione umana, compresi i segnali non verbali come le espressioni facciali e il linguaggio del corpo.

Gli esseri umani digitali conversazionali sono inoltre dotati di potenti funzionalità come memoria, emozioni e creatività per emulare appieno la cognizione e il coinvolgimento umani. Questa tecnologia offre infinite possibilità per le aziende che cercano di creare esperienze coinvolgenti e personalizzate per i propri clienti.

Venn Diagram with large language models and AI avatars as the two main topics which overlap to be conversational Ai human

Gli LLM danno vita agli umani con intelligenza artificiale

Uno degli aspetti più interessanti dell'utilizzo degli LLM con intelligenza artificiale conversazionale è la capacità di creare e personalizzare i propri personaggi e personalità.

Puoi progettare un «rappresentante del servizio clienti che fa barzellette imbarazzanti sul papà» o un «simpatico e frizzante cassiere di un bar che ama il vero crimine». Le aziende possono persino assegnare alla mascotte del proprio marchio un personaggio per consentire ai clienti di intrattenere conversazioni faccia a faccia!

Startup come Intelligenza artificiale nel mondo e Character.ai stanno già utilizzando gli LLM per creare avatar AI multidimensionali con personalità interessanti, retroscena e persino difetti. In combinazione con avatar di intelligenza artificiale conversazionale, le aziende possono creare esperienze speciali e divertenti per gli utenti.

Immagina di andare in un chiosco di Disneyland e ricevere indicazioni stradali dal tuo personaggio Disney preferito. Oppure farti dare il benvenuto da una versione basata sull'intelligenza artificiale del tuo CEO e parlare con te durante la tua giornata di lavoro!

Ulteriori vantaggi degli avatar di intelligenza artificiale conversazionale

Gli esseri umani con intelligenza artificiale conversazionale offrono una gamma completa di vantaggi e benefici sia dagli LLM che dagli avatar AI... e anche di più! Ecco alcuni punti salienti:

Presenza accogliente e simpatica:

Man mano che le nostre vite diventano sempre più digitali, gli avatar di intelligenza artificiale conversazionale forniscono un'interfaccia calda e invitante per l'interazione. Aggiungendo un elemento di umanità all'IA, questi avatar AI creano un'esperienza utente più coinvolgente e personalizzata.

Disponibilità 24 ore su 24:

Gli esseri umani dotati di intelligenza artificiale possono gestire in modo efficiente elevati volumi di richieste contemporaneamente, garantendo un servizio personalizzato in ogni momento.

Abbatti le barriere linguistiche

Gli umani dell'IA conversazionale comprendono e parlano fluentemente più lingue su richiesta. Secondo UNEQ, i loro umani digitali possono comprendere 74 lingue e parlarne 43.

Supporto omnicanale.

Gli avatar di intelligenza artificiale conversazionale possono essere configurati per ricordare tutti i punti di contatto e le interazioni precedenti, garantendo un percorso di comunicazione coerente per utenti e clienti. Sono inoltre accessibili su tutte le piattaforme digitali, dal web e dai dispositivi mobili ai chioschi e persino all'interno degli ambienti del metaverse.

This combination of human avatars and LLMs is re-writing the rule book on traditional human-computer interaction and opening new avenues for enhanced customer experiences, transformative education and training, immersive simulations, personalized content creation, and cross-cultural communication. — Eric Jang, Founder and CEO of Deepbrain AI

Umani con intelligenza artificiale conversazionale nell'esperienza del cliente (CX)

Le iniziative aziendali incentrate sulla CX danno priorità alle interazioni significative con i clienti rispetto alle semplici transazioni. Grazie agli avatar basati sull'intelligenza artificiale conversazionale, i clienti possono impegnarsi in lunghe conversazioni, porre più domande e trovare più facile discutere di questioni che potrebbero esitare a sollevare con un agente umano.

Gli esperti di intelligenza artificiale offrono supporto ai clienti che desiderano un servizio clienti unico, più coinvolgente e di impatto. La sezione seguente approfondisce le applicazioni pratiche e gli impatti positivi che gli umani digitali conversazionali hanno già avuto in vari settori.

Meet AI Humans as AI trainer. AI doctor, AI staff, AI Helper, AI engineer, AI anchor, AI tutor, AI chef, Ai coordinator — Credito di immagine: DeepBrain AI

1. Consulenza finanziaria:

Gli avatar AI stanno rimodellando anche la finanza, come dimostrato da I cassieri bancari AI di DeepBrain presso KB Bank. Questi avatar semplificano le richieste bancarie di routine, consentendo ai loro colleghi umani nella vita reale di concentrarsi su attività più complesse.

«Digital Dani» di Uneq simula le discussioni finanziarie tra esperti di UBS, un istituto bancario in Svizzera. Digital Dani offre ai clienti la comodità di una consulenza finanziaria esperta su richiesta.

KB Bank Ai Human Kiosk Used in real life — Chiosco KB Bank. Credito di immagine: DeepBrain AI

2. Supporto educativo:

Nel settore dell'istruzione, gli esperti di intelligenza artificiale conversazionale possono diventare tutor di intelligenza artificiale affidabili e sempre disponibili. DeepBrain AI estende il suo portafoglio all'istruzione con tutor di intelligenza artificiale in tempo reale presso Kyowon Co. che aiutano gli studenti nell'apprendimento attraverso lezioni interattive e sessioni di domande e risposte.

Umani di intelligenza artificiale conversazionale come Soul Machines Mya ed Emma guidano gli studenti nel loro percorso accademico alla Maryville University. Questi mentori digitali aiutano con le candidature, condividono approfondimenti sulla vita del campus e offrono orientamento professionale e accademico.

3. Ospitalità:

I concierge AI di DeepBrain al Novotel mostra l'uso della tecnologia umana AI nell'ospitalità. Disponibili 24 ore su 24, 7 giorni su 7, questi avatar AI rispondono a tutte le domande di viaggio e di servizio, consentendo agli ospiti di godersi appieno il soggiorno.

Allo stesso modo, «Digital Iris» di Soul Machines offre supporto ai viaggiatori all'aeroporto di Dallas Fort Worth, migliorando il loro viaggio e riducendo lo stress dei viaggiatori con informazioni e aggiornamenti in tempo reale.

2. Coinvolgimento con i media:

Gli umani dell'IA conversazionale stanno ridefinendo le interazioni tra fan e celebrità. Collaborando con il giudice di America's Got Talent Howie Mandel, DeepBrain AI sta colmando il divario tra celebrità e fan. La creazione di una celebrità gemella basata sull'intelligenza artificiale aiuta a promuovere una connessione più personale, consentendo ai fan di interagire e conversare con una versione digitale della loro star preferita.

L' «Einstein digitale» di Uneq approfondisce questo concetto, permettendo agli utenti di interagire con una versione ricreata del famoso fisico Albert Einstein, svelando la sua saggezza e il suo umorismo.

5. Assistenza sanitaria e benessere:

L'IA conversazionale sta migliorando i servizi di salute e benessere. DeepBrain AI ha collaborato con Roche, una multinazionale svizzera del settore sanitario, per creare un consulente sanitario basato sull'intelligenza artificiale. L'AI Doctor offre supporto 24 ore su 24, 7 giorni su 7 per la salute e le richieste relative a Roche.

«Digital JK» di Uneq con Groov aiuta gli utenti a raggiungere migliori schemi di sonno, contribuendo a migliorare la salute mentale.

6. Arricchire la vita:

L'impatto degli avatar di intelligenza artificiale conversazionale si estende anche nell'aldilà. «Re; memory» di DeepBrain«La cerimonia funebre ricrea i propri cari in avatar basati sull'intelligenza artificiale, fornendo conforto e connessione per aiutare la famiglia a guarire e mantenere viva la memoria.

Re;memory picture of a couple communicating a passed family member as an AI — Re; memoria. Credito di immagine: DeepBrain AI

Solo l'inizio...

L'emergere di avatar di intelligenza artificiale e umani con intelligenza artificiale conversazionale rappresenta un significativo balzo in avanti nello sviluppo tecnologico. Apre nuove e illimitate possibilità per le aziende che mirano a creare esperienze più personalizzate e coinvolgenti per i propri clienti. È emozionante e scoraggiante chiedersi cosa ci riserva il futuro, ma una cosa è certa: la tecnologia umana basata sull'intelligenza artificiale è solo all'inizio.

Mentre andiamo avanti, è essenziale notare che la tecnologia degli avatar LLM e AI è ancora agli inizi e deve ancora raggiungere il suo pieno potenziale. Con i progressi nell'apprendimento automatico e nell'elaborazione del linguaggio naturale, possiamo aspettarci di vedere avatar di intelligenza artificiale ancora più sofisticati e umani dotati di intelligenza artificiale conversazionale nel prossimo futuro. Questi progressi porteranno senza dubbio a nuove innovazioni e funzionalità, cambiando il modo in cui viviamo e lavoriamo in modi che possiamo solo iniziare a immaginare.

‍