Одним из самых интересных достижений в области технологий, основанных на искусственном интеллекте, является появление Большие языковые модели (LLM) а также Аватары искусственного интеллекта (аватары ИИ) объединившись для создания разговорные люди с искусственным интеллектом.

По оценкам, к 2032 году рынок аватаров с искусственным интеллектом составит 156,19 миллиарда долларов (Промозглые идеи). Многие компании, в том числе Лаборатории Samsung STAR и стартапы, такие как Искусственный интеллект DeepBrain а также Синтезия, постоянно совершенствуют свои технологии искусственного интеллекта (ИИ) и совершенствуют своих специалистов по искусственному интеллекту, чтобы создавать увлекательные и приятные впечатления от использования искусственного интеллекта.

By 2026, half of B2B buyers will interact with a digital human in a buying cycle. -- Gartner, 2022 HypeCycle Report

Аватары разговорного искусственного интеллекта уже меняют способы взаимодействия компаний и организаций с клиентами и пользователями.

Продолжайте читать, чтобы узнать:

Концепция LLM (большие языковые модели)
Разработка аватаров искусственного интеллекта
Создание разговорных ИИ, похожих на людей
Влияние диалоговых аватаров искусственного интеллекта на взаимодействие между клиентами и компаниями

Что такое модель большого языка (LLM)?

The внедрение ChatGPT ноябрь 2022 года стал поворотным моментом в популяризации и широком принятии генеративного искусственного интеллекта и моделей на больших языках (LLM). OpenAI продемонстрировала публике, как LLM и технологии искусственного интеллекта могут помочь компаниям и частным лицам автоматизировать задачи, стимулировать творческое мышление и даже помогать в написании программного обеспечения, открывая новую эру использования искусственного интеллекта.

AI is like electricity. Just as electricity transformed every major industry a century ago, AI is now poised to do the same. – Andrew Ng

По своей сути LLM представляют собой тип искусственного интеллекта, который выполняет различные задачи, связанные с обработкой естественного языка (NLP). Эти задачи включают создание и классификацию текста, предоставление разговорных ответов и перевод текста с одного языка на другой.

Большие языковые модели (LLM) обладают исключительной способностью естественным образом понимать и воспроизводить человеческий язык. Они могут понимать контекст, создавать естественные реакции и даже имитировать разговорные нюансы, в результате чего взаимодействие напоминает общение реальных людей друг с другом.

Крупные и малые LLM

Термин «большой» относится к числу параметров (весов и значений), которые LLM может корректировать и изменять в процессе обучения. Крупнейшие LLM, такие как Open AI GPT-3, GPT-4 и Google Пальма 2, Лямда, БЕРТ, бард, и Meta Лама 2 содержат от сотен миллионов до миллиардов параметров. Исследовательские группы, такие как Институт технологических инноваций Falcon 40B, Калифорнийского университета в Беркли Викунья, коала, а также Стэнфордского университета Альпака также выпустили свои собственные большие языковые модели.

Несмотря на рост числа массовых LLM, последние тенденции сместились в сторону более компактных, более доступных и настраиваемых моделей, таких как Ада, Атлас, и Кохере.

Меньшие языковые модели не только более экономичны, но и намного точнее решают бизнес-задачи, специфичные для конкретной предметной области. Это связано с тем, что они обучаются и оптимизируются на основе тщательно проверенных данных, учитывающих именно те сценарии использования, которые интересны пользователям и компаниям, а не на основе всех общедоступных данных, включающих как положительные, так и плохие данные.

It’s not enough to just scrub the internet to train LLM. Quality data counts - we all are going back to this truth — Thomas Wolf, co-founder and CSO of Hugging Face

Специализированные LLM

Пользователи и компании, которым нужен больший контроль над ответами, могут настраивать данные, получаемые LLM, для изменения своего поведения и результатов. Этого можно добиться двумя основными способами:

1. Встраивание‍

В больших языковых моделях используются вложения для проецирования текстовых данных, таких как слова или предложения, в многомерное векторное пространство. Это позволяет LLM фиксировать семантические отношения и контекстные нюансы, разделяя тексты на ярлыки или категории, такие как положительные или отрицательные, спам или нет, новости или мнения и т. д. (Майкрософт).‍

2. Тонкая настройка‍

Под тонкой настройкой больших языковых моделей понимается процесс совершенствования предварительно обученной языковой модели искусственного интеллекта путем ее обучения на более узком наборе данных для конкретных задач. Этот процесс помогает модели совершенствоваться и работать эффективнее при создании точного и релевантного контента, сохраняя при этом свои первоначальные возможности. Когда вы дорабатываете модель искусственного интеллекта, это все равно, что отправить ее в аспирантуру после окончания бакалавриата.

Table showing the differences between Embedding and Fine-tuning LLMs

Что такое Аватары искусственного интеллекта?

Digital humans are interactive, AI-driven representations that have some of the characteristics, personality, knowledge, and mindset of a human. — Gartner 2023

Аватары — это виртуальные изображения пользователей или объектов в цифровой среде. Традиционные аватары всегда находятся под контролем и управлением людей и не могут выполнять заранее не запрограммированные действия. С другой стороны, аватары ИИ и люди с искусственным интеллектом могут взаимодействовать с реальными людьми, не полагаясь на человеческое волеизъявление или руководство. Они также могут понимать и принимать решения самостоятельно, исходя из контекста окружающего мира.

За последние несколько лет люди с искусственным интеллектом добились значительных успехов в том, чтобы выглядеть и звучать невероятно реалистично. Искусственный интеллект DeepBrain утверждает, что их искусственные аватары выглядят и ведут себя на 96,5% как люди, а на картинке ниже вы можете увидеть, насколько реалистично выглядят цифровые люди Samsung STAR Labs.

Изображение предоставлено STAR Labs

Как правило, гиперреалистичные аватары с искусственным интеллектом создаются в студии звукозаписи с использованием реальной модели человека, но теперь аватар можно создавать полностью в цифровом виде, с помощью самостоятельно записанных видео и фотографий или с помощью технологии смены лица — и эта технология становится все быстрее и проще в использовании.

Ключевые элементы аватаров искусственного интеллекта:

Гиперреалистичный внешний вид: Цифровые люди становятся все более реалистичными и реалистичными. Хотя их часто создают в студии, а затем синтезируют с помощью программы машинного обучения, теперь создавать цифровые аватары, используя только фотографии или видео, снятые самостоятельно, становится все быстрее и проще.
Естественные движения тела: Аватары искусственного интеллекта используют алгоритм под названием Generative Adversarial Network (GAN) для создания плавных и естественных движений рта и тела. Люди с искусственным интеллектом могут даже реалистично синхронизировать движения губ с любым звуковым или текстовым вводом.
Ответы с низкой задержкой: DeepBrain AI сообщил о задержке между вводом данных человеком и выводом аватара менее 1 секунды. Диалоговые аватары с искусственным интеллектом способны отвечать на запросы с минимальной задержкой, в результате чего процесс разговора становится естественным и реалистичным.
Преобразование текста в речь (TTS): Технология преобразования текста в речь (TTS) прошла долгий путь со времен первых голосовых помощников. В настоящее время TTS может воспроизводить чрезвычайно реалистичные голоса на всех языках. В сочетании с синхронизацией губ он может создать убедительно реальную цифровую копию человека, говорящего на языке.

Что такое разговорные Аватары искусственного интеллекта?

В 2023 году технологии AI Avatar и LLM объединились, чтобы создать мощный инструмент для пользователей и изменить подход компаний к улучшению взаимодействия с клиентами. Команды из DeepBrain AI, Soul Machine, Uneeq и D-ID уже начали создавать людей, умеющих общаться с искусственным интеллектом, и результаты оказались удивительно естественными и успешными.

Вы можете думать, что LLM — это мозг, лежащий в основе разговорных цифровых людей, а аватары искусственного интеллекта служат сосудом или телом. В совокупности они работают лучше обычных чат-ботов с искусственным интеллектом, имитируя весь процесс человеческого общения, включая невербальные сигналы, такие как мимика и язык тела.

Разговорные цифровые люди также обладают мощными способностями, такими как память, эмоции и творческие способности, позволяющие полностью имитировать человеческое познание и вовлеченность. Эта технология открывает безграничные возможности для компаний, стремящихся создать привлекательный и персонализированный опыт для своих клиентов.

Venn Diagram with large language models and AI avatars as the two main topics which overlap to be conversational Ai human

LLM воплощают в жизнь людей с искусственным интеллектом

Одним из самых интересных аспектов использования LLM с разговорным искусственным интеллектом является возможность создавать и настраивать своих персонажей и личностей.

Вы можете создать «представителя службы поддержки клиентов, который шутит над отцом, вызывающим треск», или «дружелюбного, игривого кассира кафе, который любит настоящие преступления». Компании даже могут сделать талисман своего бренда таким образом, чтобы клиенты могли общаться лицом к лицу!

Такие стартапы, как Искусственный интеллект в мире а также Character.ai уже используют LLM для создания многомерных аватаров искусственного интеллекта с интересными личностями, предысториями и даже недостатками. В сочетании с диалоговыми аватарами искусственного интеллекта компании могут создавать особенные и увлекательные впечатления для пользователей.

Представьте, что вы идете в киоск Диснейленда и получаете указания от своего любимого диснеевского персонажа. Или поприветствуйте своего генерального директора в версии с искусственным интеллектом и побеседуйте с вами в рабочий день!

Дополнительные преимущества диалоговых аватаров с искусственным интеллектом

Люди с разговорным искусственным интеллектом предлагают широкий спектр преимуществ и преимуществ как от LLM, так и от аватаров искусственного интеллекта... и даже от некоторых других! Вот несколько ключевых моментов:

Гостеприимное и представительное присутствие:

Поскольку наша жизнь становится все более цифровой, разговорные аватары искусственного интеллекта предоставляют теплый и уютный интерфейс для общения. Добавляя в искусственный интеллект элемент человечности, эти аватары искусственного интеллекта создают более привлекательный и персонализированный пользовательский интерфейс.

Круглосуточная доступность:

Люди с искусственным интеллектом могут эффективно обрабатывать большие объемы запросов одновременно, обеспечивая персонализированное обслуживание в любое время.

Устраните языковые барьеры

Люди с разговорным искусственным интеллектом свободно понимают и говорят на нескольких языках по запросу. Согласно UNEEQ, их цифровые люди понимают 74 языка и говорят на 43 из них.

Многоканальная поддержка.

Диалоговые аватары искусственного интеллекта можно настроить так, чтобы они запоминали все предыдущие точки соприкосновения и взаимодействия, обеспечивая пользователям и клиентам последовательное общение. Они также доступны на всех цифровых платформах: от Интернета и мобильных устройств до киосков и даже в среде метавселенной.

This combination of human avatars and LLMs is re-writing the rule book on traditional human-computer interaction and opening new avenues for enhanced customer experiences, transformative education and training, immersive simulations, personalized content creation, and cross-cultural communication. — Eric Jang, Founder and CEO of Deepbrain AI

Интеллектуальный искусственный интеллект и взаимодействие с клиентами (CX)

Бизнес-инициативы, ориентированные на CX, отдают приоритет значимому взаимодействию с клиентами, а не простым транзакциям. С помощью интерактивных аватаров с искусственным интеллектом клиенты могут вести обстоятельные беседы, задавать несколько вопросов и легче обсуждать вопросы, которые они, возможно, не решаются обсуждать с агентом-человеком.

Специалисты по искусственному интеллекту оказывают поддержку клиентам, которые хотят уникального, более интересного и эффективного обслуживания клиентов. В следующем разделе рассказывается о практическом применении и положительном влиянии разговорных цифровых людей в различных отраслях.

Meet AI Humans as AI trainer. AI doctor, AI staff, AI Helper, AI engineer, AI anchor, AI tutor, AI chef, Ai coordinator — Изображение предоставлено искусственным интеллектом DeepBrain

1. Финансовая консультация:

Аватары искусственного интеллекта также меняют финансы, о чем свидетельствует Банковские кассиры DeepBrain с искусственным интеллектом в KB Bank. Эти аватары упрощают рутинные банковские запросы, позволяя их реальным коллегам-людям сосредоточиться на более сложных задачах.

«Цифровой дань» UNEEQ имитирует экспертные финансовые дискуссии в швейцарском банковском учреждении UBS. Digital Dani предоставляет клиентам удобные консультации экспертов по финансовым вопросам по запросу.

KB Bank Ai Human Kiosk Used in real life — Киоск банка KB. Изображение предоставлено искусственным интеллектом DeepBrain

2. Образовательная поддержка:

В сфере образования люди, владеющие разговорным искусственным интеллектом, могут стать надежными и всегда доступными преподавателями по искусственному интеллекту. DeepBrain AI расширяет свое портфолио в сфере образования репетиторы по искусственному интеллекту в реальном времени в Kyowon Co. которые помогают студентам в обучении с помощью интерактивных лекций и сессий вопросов и ответов.

Люди с разговорным искусственным интеллектом, такие как Soul Machines Мия и Эмма, помогают студентам пройти академический путь в Мэривилльском университете. Эти цифровые наставники помогают подавать заявки, делиться информацией о жизни в кампусе, а также предлагают профессиональную и академическую ориентацию.

3. Гостеприимство:

Консьержи DeepBrain с искусственным интеллектом в Novotel демонстрирует использование человеческих технологий искусственного интеллекта в гостиничном бизнесе. Эти аватары с искусственным интеллектом, доступные круглосуточно и без выходных, отвечают на все запросы о путешествиях и услугах, позволяя гостям в полной мере насладиться пребыванием.

Аналогичным образом, «Цифровой радужный глаз» от Soul Machines предлагает поддержку путешественникам в аэропорту Даллас-Форт-Уэрт, улучшая их путешествие и снижая стресс путешественников с помощью информации и обновлений в режиме реального времени.

2. Взаимодействие со СМИ:

Люди, умеющие общаться с искусственным интеллектом, переосмысливают взаимодействие фанатов и знаменитостей. В сотрудничестве с судьей журнала America's Got Talent Хоуи Мэндел, Искусственный интеллект DeepBrain сокращает разрыв между знаменитостями и фанатами. Создание искусственного близнеца знаменитостей помогает наладить более тесные личные связи, позволяя фанатам общаться и общаться с цифровой версией своей любимой звезды.

«Цифровой Эйнштейн» UNEEQ развивает эту концепцию, позволяя пользователям познакомиться с воссозданной версией известного физика Альберта Эйнштейна, раскрывая его мудрость и юмор.

5. Здравоохранение и оздоровление:

Разговорный искусственный интеллект расширяет возможности медицинских и оздоровительных услуг. DeepBrain AI в партнерстве со швейцарской транснациональной медицинской компанией Roche создала консультанта по вопросам здравоохранения с использованием искусственного интеллекта. Доктор по искусственному интеллекту предлагает круглосуточную поддержку по вопросам здравоохранения и связанным с компанией Roche.

«Цифровое Великобритания» UNEQ with Groov помогает пользователям улучшить режим сна, способствуя улучшению психического здоровья.

6. Обогащение жизни:

Влияние разговорных аватаров с искусственным интеллектом распространяется даже на загробную жизнь. «Красная память» от DeepBrain«панихида превращает близких в аватары искусственного интеллекта, обеспечивая утешение и связь, помогая их семье выздороветь и сохранить память.

Re;memory picture of a couple communicating a passed family member as an AI — Красный; память. Изображение предоставлено искусственным интеллектом DeepBrain

Только начало...

Появление аватаров искусственного интеллекта и разговорных людей с искусственным интеллектом представляет собой значительный шаг вперед в технологическом развитии. Это открывает новые безграничные возможности для компаний, стремящихся создать более персонализированный и привлекательный опыт для своих клиентов. Удивляться, что нас ждет в будущем, не только интересно, но одно можно сказать наверняка: технологии искусственного интеллекта и человека только начинаются.

По мере продвижения вперед важно отметить, что технологии аватаров LLM и AI все еще находятся в зачаточном состоянии и еще не полностью раскрыли свой потенциал. Благодаря достижениям в области машинного обучения и обработки естественного языка в ближайшем будущем мы можем ожидать появления еще более совершенных аватаров искусственного интеллекта и людей с разговорным искусственным интеллектом. Эти достижения, несомненно, приведут к появлению новых инноваций и возможностей, которые изменят наш образ жизни и работы так, как мы только можем себе представить.

‍