СЕУЛ — Являясь ведущим стартапом в области разговорного искусственного интеллекта, специализирующимся на глубоком обучении и синтезе видео в Южной Корее, Deepbrain AI выразила уверенность в своей цели стать глобальным игроком, основанным на проверенных технологиях синтетических людей, отвечающих на вопросы о естественном языке, а также постоянном притоке капитала от инвесторов.

Основанная в 2016 году, компания Deepbrain предлагает решения для синтеза видео и речи и чат-ботов, а также киоски искусственного интеллекта и разговорные решения, которые можно использовать в различных отраслях для оптимизации обслуживания клиентов. Чтобы создать человека с искусственным интеллектом, стартап снимает на видео человеческую модель в студии и обучает систему машинного обучения, которая генерирует аватар с синхронизированными движениями губ, рта и головы.

«Человеческие технологии искусственного интеллекта имеют безграничный потенциал для расширения, поэтому их можно использовать в различных промышленных областях», — заявил генеральный директор Эрик Джанг в интервью Aju Business Daily. «Моя цель состояла в том, чтобы стать крупнейшей компанией в мире, занимающейся искусственным интеллектом, с тех пор как я начал свой бизнес», — сказал он, чему способствовала серия контрактов с корпоративными клиентами.

Deepbrain пообещала активно продвигать зарубежную экспансию со второй половины этого года, начав с заключения контрактов с двумя китайскими вещательными компаниями, базирующимися в Пекине и Цинхае, на экспорт дикторов искусственного интеллекта, созданных с помощью технологии глубокого обучения. Для выхода на китайский рынок компания Jang открыла филиалы в Пекине и Шанхае. В настоящее время с китайскими банками обсуждается вопрос о внедрении киосков и консультантов с искусственным интеллектом.

«Благодаря этим контрактам мы постараемся стать глобальной компанией, ища возможности для бизнеса с различными компаниями на зарубежных рынках», — сказал Чан, уделив особое внимание Соединенным Штатам. Для выхода на рынок США Deepbrain попытается наладить стратегическое партнерство с американской компанией Veritone, занимающейся технологиями искусственного интеллекта, открыть местный филиал в Калифорнии и предоставить услугу по описанию продуктов в Amazon, крупнейшем в мире онлайн-торговом центре.

«Мы хотим сделать этот год первым годом полноценной глобальной экспансии и стать глобальной компанией-единорогом не раньше чем через два года», — сказал Чан, указав на быстрый рост Deepbrain, вызванный дифференцированной конкурентоспособностью технологии «синтеза изображений с синхронизацией губ», использующей глубокое обучение для синтеза губ.

Очень немногие компании могут внедрить реалистичных людей с искусственным интеллектом. Технология Deepbrain позволяет реализовать мимику, диалог, интеллект и эмоции, похожие на эмоции реального человека. «Самой важной технологией при создании искусственных людей является технология синтеза изображений с синхронизацией губ, позволяющая приспосабливать форму губ к сказанному».

Корпоративная стоимость Deepbrain за пять лет выросла до 200 миллиардов вон (171 миллион долларов), что привлекло значительный капитал инвесторов. Интерактивные технологии искусственного интеллекта Deepbrain сейчас внедряют различные отрасли, такие как финансы, образование и средства массовой информации. «Мы продолжаем расти благодаря большому внутреннему капиталу», — сказал Чан, пообещав предложить SaaS (программное обеспечение как услугу) — модель доставки программного обеспечения, при которой облачное программное приложение лицензируется пользователю.

В рамках последней сделки, которая продемонстрировала растущее признание Deepbrain, южнокорейская общественная телекомпания KBS использовала технологию синтеза видео с использованием искусственного интеллекта для создания исторического документального фильма, проливающего новый свет на жен борцов за свободу во время колониального господства Японии на Корейском полуострове в 1910-45 годах.

Компания Deepbrain поддержала технологию «pupple master», позволяющую воплотить естественную мимику и движения на изображениях борцов за независимость, оставленных только на фотографиях. Эта технология позволяет синтезировать выражения лица и формы рта других людей, сохраняя при этом лица и черты оригинальных фигур на изображениях. Синтезирование определенных видеороликов в изображение позволяет человеку улыбаться, моргать и поворачивать голову, а также незначительно изменять мимику в зависимости от движений лица.

Как и другие стартапы, поначалу Чан испытывал трудности с привлечением инвестиций, но теперь он с оптимизмом смотрит на рост своей компании и пообещал показать «истории успеха», основанные на использовании технологий искусственного интеллекта для синтеза изображений в области вещания, кино, медицинского обслуживания и торговли.

«Мы будем использовать наши инвестиции для быстрого привлечения талантов и расширения нашего бизнеса по всему миру», — сказал Чан, объяснив свой успех смелыми инвестициями в привлечение талантов и повышение благосостояния сотрудников. «Внедрение технологии искусственного интеллекта мирового уровня стало возможным благодаря отличным разработчикам», — сказал он, представив идеал найма более 100 человек, которые будут работать дома и в зарубежных филиалах.

Не удовлетворенный достигнутым ростом, Чан изучит новые возможности для бизнеса на развивающемся рынке метавселенной. Метавселенная — это коллективное виртуальное общее пространство, созданное в результате конвергенции виртуально улучшенной физической реальности и физически устойчивого виртуального пространства. В мае был создан альянс частных компаний, вещательных сетей, исследовательских организаций и государственных органов для поддержки производства, тестирования и демонстрации услуг в области производства, здравоохранения, строительства, образования, дистрибуции и обороны.

В отличие от существующих платформ метавселенной, Джанг надеется разработать технологии, позволяющие реализовать более реалистичные и высокоинтеллектуальные аватары. «Это одна из самых важных задач. В отличие от современных платформ метавселенной, в которых используются симпатичные трехмерные персонажи, наша цель — создать аватар, похожий на реальное лицо (например, виртуального человека)».

Чтобы решить проблему глубоких подделок или видеороликов, созданных искусственным интеллектом, в которых человек снимается в существующем видео и заменяет его чужим изображением, Deepbrain разработает технологию, позволяющую обнаруживать подделки и предоставлять бесплатные услуги. «Мы усердно работаем над устранением побочных эффектов, связанных с нашими хорошими навыками синтеза», — говорит Чан, подчеркивая положительное влияние искусственного интеллекта на человека, поскольку технология сводит к минимуму ожидание ответов между разговорами и позволяет быстро получать ответы.

(Эта история основана на интервью репортера Aju Business Daily Ли На-кёна)