SEOUL — In qualità di principale startup di intelligenza artificiale conversazionale specializzata in deep learning e sintesi video in Corea del Sud, Deepbrain AI ha espresso fiducia nel suo obiettivo di diventare un attore globale basato su tecnologie comprovate negli esseri umani sintetici che rispondono a domande sul linguaggio naturale, nonché su un costante afflusso di capitali da parte degli investitori.
Fondata nel 2016, Deepbrain fornisce soluzioni di sintesi video e vocale e chatbot, insieme a chioschi AI e soluzioni conversazionali che possono essere utilizzate in vari settori per un servizio clienti ottimizzato. Per creare un umano con intelligenza artificiale, la startup registra un video di un modello umano in uno studio e addestra un sistema di apprendimento automatico che genera un avatar con movimenti sincronizzati di labbra, bocca e testa.
«La tecnologia umana AI ha un potenziale di espansione infinito, quindi può essere utilizzata in vari campi industriali», ha dichiarato il CEO Eric Jang in un'intervista ad Aju Business Daily. «Il mio obiettivo è stato diventare la più grande azienda di intelligenza artificiale al mondo da quando ho iniziato la mia attività», ha affermato, sostenuto da una serie di contratti con clienti aziendali.
Deepbrain ha promesso di spingere attivamente per l'espansione all'estero a partire dalla seconda metà di quest'anno, iniziando con contratti con due emittenti cinesi con sede a Pechino e Qinghai per esportare annunciatori di intelligenza artificiale creati attraverso la tecnologia di deep learning. Jang ha aperto filiali a Pechino e Shanghai per accedere al mercato cinese. È in corso una discussione con le banche cinesi sull'introduzione di chioschi e consulenti basati sull'intelligenza artificiale.
«Con questi contratti, cercheremo di diventare un'azienda globale cercando opportunità di business con varie società nei mercati esteri», ha detto Jang con particolare attenzione agli Stati Uniti. Per il suo ingresso nel mercato statunitense, Deepbrain cercherebbe di stringere una partnership strategica con Veritone, una società statunitense di tecnologia AI, di aprire una filiale locale in California e di fornire un servizio di spiegazione dei prodotti di Amazon, il più grande centro commerciale online del mondo.
«Vogliamo che quest'anno sia il primo anno di piena espansione globale e diventare un'azienda unicorno globale entro due anni al più presto», ha detto Jang, indicando la rapida crescita di Deepbrain stimolata dalla competitività differenziata nella tecnologia di «sintesi delle immagini con sincronizzazione labiale» che utilizza il deep learning per sintetizzare le labbra.
Pochissime aziende sono in grado di implementare esseri umani dotati di intelligenza artificiale realistici. La tecnologia di Deepbrain è in grado di implementare espressioni facciali, intelligenza dialogica ed emozioni simili a quelle di una persona reale. «La tecnologia più importante nell'implementazione di esseri umani artificiali è la tecnologia di sintesi delle immagini sincronizzate con le labbra che abbina la forma delle labbra a ciò che viene detto».
Il valore aziendale di Deepbrain è salito a 200 miliardi di won (171 milioni di dollari) in cinque anni, attirando abbondanti capitali dagli investitori. Vari settori come la finanza, l'istruzione e i media stanno ora adottando le tecnologie di intelligenza artificiale interattiva di Deepbrain. «Stiamo ancora crescendo con molti capitali nazionali», ha affermato Jang, promettendo di offrire SaaS (Software as a Service), un modello di distribuzione del software in cui un'applicazione software basata su cloud viene concessa in licenza a un utente.
Nell'ultimo accordo che ha dimostrato il maggiore riconoscimento di Deepbrain, l'emittente pubblica della Corea del Sud KBS ha utilizzato la tecnologia di sintesi video AI per produrre un documentario storico che getta nuova luce sulle mogli dei combattenti per la libertà durante il dominio coloniale giapponese sulla penisola coreana del 1910-45.
Deepbrain ha supportato la tecnologia «puppet master» per incarnare espressioni e movimenti naturali del viso nelle immagini degli attivisti per l'indipendenza lasciate solo nelle fotografie. La tecnologia è in grado di sintetizzare le espressioni facciali e le forme della bocca in altre persone mantenendo i volti e le caratteristiche delle figure originali nelle immagini. La sintesi di determinati video in un'immagine consente a una persona di sorridere, battere le palpebre e girare la testa, oltre a sottili cambiamenti nelle espressioni facciali che variano a seconda dei movimenti facciali.
Come altre startup, Jang aveva avuto difficoltà a garantire gli investimenti all'inizio, ma ora è ottimista sulla crescita della sua azienda e ha promesso di mostrare «storie di successo» basate sull'uso di tecnologie di sintesi delle immagini AI nei settori della trasmissione, dei film, dell'assistenza medica e del commercio.
«Utilizzeremo il nostro investimento per acquisire rapidamente talenti ed espandere la nostra attività a livello globale», ha affermato Jang, attribuendo il suo successo a audaci investimenti nel reclutamento di talenti e nel miglioramento del benessere dei dipendenti. «L'implementazione di una tecnologia AI di livello mondiale è stata possibile grazie a sviluppatori eccellenti», ha affermato, svelando l'ideale di reclutare più di 100 persone che lavoreranno a casa e nelle filiali all'estero.
Insoddisfatto della crescita raggiunta finora, Jang esplorerà una nuova opportunità di business nel mercato emergente del metaverse. Il metaverse è uno spazio virtuale condiviso collettivo creato dalla convergenza tra una realtà fisica virtualmente migliorata e uno spazio virtuale fisicamente persistente. A maggio è stata lanciata un'alleanza di società private, reti di trasmissione, organizzazioni di ricerca ed enti statali per sostenere la produzione, la sperimentazione e la dimostrazione di servizi nei settori della produzione, della sanità, dell'edilizia, dell'istruzione, della distribuzione e della difesa.
A differenza delle piattaforme metaverse esistenti, Jang spera di sviluppare tecnologie in grado di implementare avatar più realistici e altamente intelligenti. «È uno dei compiti più importanti. A differenza delle attuali piattaforme metaverse che utilizzano simpatici personaggi 3D, il nostro obiettivo è implementare un avatar simile al volto reale (come un essere umano virtuale)».
Per rispondere alle preoccupazioni relative ai deep fake, ovvero ai video generati dall'intelligenza artificiale che riprendono una persona in un video esistente e la sostituiscono con le sembianze di qualcun altro, Deepbrain svilupperebbe una tecnologia in grado di rilevare i falsi e fornire un servizio gratuito. «Stiamo lavorando duramente sugli effetti collaterali derivanti dalle nostre buone capacità di sintesi», ha detto Jang, sottolineando gli effetti positivi dell'intelligenza artificiale umana in quanto la tecnologia riduce al minimo l'attesa di risposte tra le conversazioni, consentendo risposte rapide.
(Questa storia è basata su un'intervista condotta dal reporter dell'Aju Business Daily Lee Na-kyeong)