SEOUL — Als führendes Startup für dialogorientierte künstliche Intelligenz in Südkorea, das sich auf Deep Learning und Videosynthese spezialisiert hat, zeigte sich Deepbrain AI zuversichtlich in sein Ziel, ein globaler Akteur zu werden, der auf bewährten Technologien synthetischer Menschen basiert, die auf Fragen natürlicher Sprache reagieren, sowie auf einem stetigen Kapitalzufluss von Investoren.
Deepbrain wurde 2016 gegründet und bietet Video- und Sprachsynthese- und Chatbot-Lösungen sowie KIOSKs und Konversationslösungen, die in verschiedenen Branchen für einen optimierten Kundenservice eingesetzt werden können. Um einen KI-Menschen zu erschaffen, nimmt das Startup ein Video eines menschlichen Modells in einem Studio auf und trainiert ein maschinelles Lernsystem, das einen Avatar mit synchronisierten Lippen-, Mund- und Kopfbewegungen generiert.
„Die künstliche Humantechnologie hat ein unendliches Expansionspotenzial und kann daher in verschiedenen Industriebereichen eingesetzt werden“, sagte CEO Eric Jang in einem Interview mit Aju Business Daily. „Seit ich mein Unternehmen gegründet habe, war es mein Ziel, das größte KI-Unternehmen der Welt zu werden“, sagte er, unterstützt durch eine Reihe von Verträgen mit Firmenkunden.
Deepbrain versprach, ab der zweiten Hälfte dieses Jahres aktiv auf die Expansion nach Übersee zu drängen, angefangen mit Verträgen mit zwei chinesischen Sendern mit Sitz in Peking und Qinghai über den Export von KI-Ankündern, die mithilfe von Deep-Learning-Technologie entwickelt wurden. Jang hat Niederlassungen in Peking und Shanghai gegründet, um den chinesischen Markt zu erschließen. Mit chinesischen Banken wird derzeit über die Einführung von KIOsken und Beratern für künstliche Intelligenz diskutiert.
„Mit diesen Verträgen werden wir versuchen, ein globales Unternehmen zu werden, indem wir nach Geschäftsmöglichkeiten mit verschiedenen Unternehmen auf ausländischen Märkten suchen“, sagte Jang mit besonderem Schwerpunkt auf den Vereinigten Staaten. Für den Eintritt in den US-Markt würde Deepbrain eine strategische Partnerschaft mit Veritone, einem US-amerikanischen KI-Technologieunternehmen, eingehen, eine lokale Niederlassung in Kalifornien gründen und einen Service anbieten, der Produkte in Amazon, dem weltweit größten Online-Einkaufszentrum, erklärt.
„Wir wollen dieses Jahr zum ersten Jahr einer umfassenden globalen Expansion machen und uns innerhalb von frühestens zwei Jahren zu einem globalen Einhornunternehmen entwickeln“, sagte Jang und wies auf das schnelle Wachstum von Deepbrain hin, das auf die differenzierte Wettbewerbsfähigkeit im Bereich der „Lippensynchronisations-Bildsynthese“ -Technologie zurückzuführen ist, die Deep Learning zur Lippensynthese nutzt.
Nur sehr wenige Unternehmen können realistische KI-Menschen implementieren. Die Technologie von Deepbrain kann Gesichtsausdrücke, Dialogintelligenz und Emotionen implementieren, die denen einer realen Person ähneln. „Die wichtigste Technologie bei der Implementierung künstlicher Menschen ist die lippensynchrone Bildsynthesetechnologie, die die Form der Lippen an das Gesagte anpasst.“
Der Unternehmenswert von Deepbrain ist in fünf Jahren auf 200 Milliarden Won (171 Millionen US-Dollar) gestiegen und hat reichlich Kapital von Investoren angezogen. Verschiedene Branchen wie Finanzen, Bildung und Medien setzen jetzt die interaktiven KI-Technologien von Deepbrain ein. „Wir wachsen immer noch mit viel inländischem Kapital“, sagte Jang und versprach, SaaS (Software as a Service) anzubieten, ein Softwarebereitstellungsmodell, bei dem eine Cloud-basierte Softwareanwendung an einen Benutzer lizenziert wird.
Im jüngsten Deal, der die zunehmende Anerkennung von Deepbrain unter Beweis stellte, verwendete der südkoreanische öffentlich-rechtliche Sender KBS KI-Videosynthesetechnologie, um einen historischen Dokumentarfilm zu produzieren, der ein neues Licht auf die Ehefrauen von Freiheitskämpfern während der japanischen Kolonialherrschaft über die koreanische Halbinsel 1910-45 wirft.
Deepbrain unterstützte die „Puppenspieler“ -Technologie, um natürliche Gesichtsausdrücke und Bewegungen in den Bildern von Unabhängigkeitsaktivisten zu verkörpern, die nur auf Fotos zu sehen waren. Die Technologie kann Gesichtsausdrücke und Mundformen anderer Menschen synthetisieren und gleichzeitig die Gesichter und Gesichtszüge der Originalfiguren auf den Bildern beibehalten. Die Synthese bestimmter Videos zu einem Bild ermöglicht es einer Person, zu lächeln, zu blinzeln und ihren Kopf zu drehen. Hinzu kommen subtile Veränderungen der Gesichtsausdrücke, die je nach Gesichtsbewegung variieren.
Wie andere Startups hatte Jang zu Beginn Schwierigkeiten, Investitionen zu sichern, aber jetzt blickt er optimistisch auf das Wachstum seines Unternehmens und versprach, „Erfolgsgeschichten“ zu veröffentlichen, die auf dem Einsatz von KI-Bildsynthesetechnologien in den Bereichen Rundfunk, Film, medizinische Versorgung und Handel basieren.
„Wir werden unsere Investitionen nutzen, um schnell Talente zu gewinnen und unser Geschäft weltweit auszubauen“, sagte Jang und führte seinen Erfolg auf mutige Investitionen in die Rekrutierung von Talenten und die Verbesserung des Wohlbefindens der Mitarbeiter zurück. „Die Implementierung erstklassiger KI-Technologie war dank exzellenter Entwickler möglich“, sagte er und stellte das Ideal vor, mehr als 100 Mitarbeiter einzustellen, die zu Hause und in Niederlassungen im Ausland arbeiten werden.
Jang ist mit dem bisher erzielten Wachstum unzufrieden und wird eine neue Geschäftsmöglichkeit auf dem aufstrebenden Metaverse-Markt erkunden. Das Metaversum ist ein kollektiver virtueller gemeinsamer Raum, der durch die Konvergenz von virtuell verbesserter physischer Realität und physisch persistentem virtuellem Raum geschaffen wurde. Im Mai wurde eine Allianz aus privaten Unternehmen, Rundfunksendern, Forschungsorganisationen und staatlichen Stellen ins Leben gerufen, um die Produktion, Erprobung und Demonstration von Dienstleistungen in den Bereichen Fertigung, Gesundheitswesen, Bauwesen, Bildung, Vertrieb und Verteidigung zu unterstützen.
Im Gegensatz zu bestehenden Metaverse-Plattformen hofft Jang, Technologien entwickeln zu können, mit denen realistischere und hochintelligentere Avatare implementiert werden können. „Es ist eine der wichtigsten Aufgaben. Im Gegensatz zu aktuellen Metaverse-Plattformen, die niedliche 3D-Charaktere verwenden, ist es unser Ziel, einen Avatar zu implementieren, der dem tatsächlichen Gesicht ähnelt (wie ein virtueller Mensch).“
Um Bedenken hinsichtlich Deepfakes oder KI-generierter Videos auszuräumen, die eine Person in einem vorhandenen Video zeigen und durch das Abbild einer anderen Person ersetzen, würde Deepbrain eine Technologie entwickeln, die Fälschungen erkennen und einen kostenlosen Service anbieten kann. „Wir arbeiten hart an den Nebenwirkungen, die sich aus unseren guten Synthesefähigkeiten ergeben“, sagte Jang und hob die positiven Auswirkungen von KI-Menschen hervor, da die Technologie das Warten auf Antworten zwischen den Konversationen minimiert und schnelle Antworten ermöglicht.
(Diese Geschichte basiert auf einem Interview, das von Lee Na-kyeong, dem Reporter von Aju Business Daily, geführt wurde.)