SÉOUL — En tant que start-up d'intelligence artificielle conversationnelle de premier plan spécialisée dans l'apprentissage profond et la synthèse vidéo en Corée du Sud, Deepbrain AI a exprimé sa confiance dans son objectif de devenir un acteur mondial basé sur des technologies éprouvées chez des humains synthétiques qui répondent à des questions en langage naturel, ainsi que sur un afflux constant de capitaux en provenance d'investisseurs.
Fondée en 2016, Deepbrain fournit des solutions de synthèse vidéo et vocale et de chatbot, ainsi que des kiosques IA et des solutions conversationnelles qui peuvent être utilisées dans divers secteurs pour optimiser les services clients. Pour créer un humain IA, la startup capture une vidéo d'un modèle humain dans un studio et forme un système d'apprentissage automatique qui génère un avatar avec des mouvements synchronisés des lèvres, de la bouche et de la tête.
« La technologie humaine de l'IA a un potentiel d'expansion infini, elle peut donc être utilisée dans divers domaines industriels », a déclaré le PDG Eric Jang dans un entretien avec Aju Business Daily. « Mon objectif était de devenir la plus grande entreprise d'IA au monde depuis que j'ai créé mon activité », a-t-il déclaré, soutenu par une série de contrats avec des entreprises clientes.
Deepbrain s'est engagée à promouvoir activement son expansion à l'étranger dès le second semestre de cette année, en commençant par des contrats avec deux diffuseurs chinois basés à Pékin et au Qinghai pour exporter des annonceurs IA créés grâce à la technologie d'apprentissage profond. Jang a établi des succursales à Pékin et à Shanghai pour exploiter le marché chinois. Des discussions sont en cours avec les banques chinoises sur la mise en place de kiosques et de conseillers IA.
« Grâce à ces contrats, nous essaierons de devenir une entreprise mondiale en recherchant des opportunités commerciales auprès de diverses entreprises sur les marchés étrangers », a déclaré Jang en mettant particulièrement l'accent sur les États-Unis. Pour son entrée sur le marché américain, Deepbrain chercherait à nouer un partenariat stratégique avec Veritone, une société américaine de technologie d'IA, à établir une succursale locale en Californie et à fournir un service expliquant les produits d'Amazon, le plus grand centre commercial en ligne du monde.
« Nous voulons faire de cette année la première année d'une expansion mondiale à part entière et devenir une entreprise mondiale de licornes d'ici deux ans au plus tôt », a déclaré Jang, soulignant la croissance rapide de Deepbrain stimulée par la compétitivité différenciée de la technologie de « synthèse d'images labiale » qui utilise l'apprentissage en profondeur pour synthétiser les lèvres.
Très peu d'entreprises peuvent mettre en œuvre des humains IA réalistes. La technologie de Deepbrain peut implémenter des expressions faciales, une intelligence de dialogue et des émotions similaires à celles d'une personne réelle. « La technologie la plus importante lors de la mise en œuvre d'humains artificiels est la technologie de synthèse d'images synchronisée avec les lèvres qui fait correspondre la forme des lèvres à ce qui est dit. »
La valeur de l'entreprise Deepbrain a grimpé à 200 milliards de wons (171 millions de dollars) en cinq ans, attirant ainsi d'importants capitaux de la part des investisseurs. Divers secteurs tels que la finance, l'éducation et les médias adoptent désormais les technologies d'IA interactive de Deepbrain. « Nous continuons de croître avec beaucoup de capitaux nationaux », a déclaré Jang, promettant de proposer le SaaS (Software as a Service), un modèle de fourniture de logiciels dans lequel une application logicielle basée sur le cloud est concédée sous licence à un utilisateur.
Dans le cadre du dernier accord qui a démontré la reconnaissance accrue de Deepbrain, la chaîne publique sud-coréenne KBS a utilisé la technologie de synthèse vidéo IA pour produire un documentaire historique jetant un nouvel éclairage sur les épouses des combattants de la liberté pendant la domination coloniale du Japon sur la péninsule coréenne de 1910 à 1945.
Deepbrain a soutenu la technologie « Puppet Master » pour incarner les expressions faciales et les mouvements naturels dans les images de militants indépendantistes laissées uniquement sur des photos. La technologie permet de synthétiser les expressions faciales et les formes de la bouche d'autres personnes tout en conservant les visages et les traits des personnages originaux sur les images. La synthèse de certaines vidéos en une image permet à une personne de sourire, de cligner des yeux et de tourner la tête, ainsi que de subtils changements dans les expressions faciales qui varient en fonction des mouvements du visage.
Comme d'autres startups, Jang avait eu des difficultés à obtenir des investissements au début, mais il est aujourd'hui optimiste quant à la croissance de son entreprise et s'est engagé à présenter des « histoires de réussite » basées sur l'utilisation de technologies de synthèse d'images basées sur l'IA dans les domaines de la radiodiffusion, du cinéma, des soins médicaux et du commerce.
« Nous utiliserons notre investissement pour recruter rapidement des talents et développer nos activités à l'échelle mondiale », a déclaré Jang, attribuant son succès à des investissements audacieux dans le recrutement de talents et l'amélioration du bien-être des employés. « La mise en œuvre d'une technologie d'IA de classe mondiale a été possible grâce à d'excellents développeurs », a-t-il déclaré, dévoilant l'idéal consistant à recruter plus de 100 personnes qui travailleront chez elles et dans des succursales à l'étranger.
Insatisfait de la croissance qu'il a réalisée jusqu'à présent, Jang explorera une nouvelle opportunité commerciale sur le marché émergent des métavers. Le métavers est un espace partagé virtuel collectif créé par la convergence d'une réalité physique virtuellement améliorée et d'un espace virtuel physiquement persistant. Une alliance d'entreprises privées, de réseaux de diffusion, d'organismes de recherche et d'organismes publics a été lancée en mai pour soutenir la production, les tests et la démonstration de services dans les domaines de la fabrication, de la santé, de la construction, de l'éducation, de la distribution et de la défense.
Contrairement aux plateformes de métavers existantes, Jang espère développer des technologies capables de mettre en œuvre des avatars plus réalistes et plus intelligents. « C'est l'une des tâches les plus importantes. Contrairement aux plateformes de métavers actuelles qui utilisent de jolis personnages en 3D, notre objectif est d'implémenter un avatar similaire au visage réel (comme un humain virtuel). »
Pour répondre aux préoccupations concernant les deep fakes, c'est-à-dire les vidéos générées par l'IA qui montrent une personne dans une vidéo existante et la remplacent par une autre personne, Deepbrain développerait une technologie capable de détecter les contrefaçons et de fournir un service gratuit. « Nous travaillons d'arrache-pied sur les effets secondaires liés à nos bonnes capacités de synthèse », a déclaré Jang, soulignant les effets positifs de l'IA humaine, car la technologie minimise l'attente de réponses entre les conversations, permettant ainsi des réponses rapides.
(Cette histoire est basée sur une interview menée par Lee Na-kyeong, journaliste du Aju Business Daily)