LLMs: Construindo um ser humano de IA menos artificial e mais inteligente

Updated on
July 5, 2024
|
Technology
Published
August 23, 2023

Um dos desenvolvimentos mais empolgantes da tecnologia alimentada por inteligência artificial é o surgimento de Modelos de linguagem grande (LLMs) e Avatares de inteligência artificial (Avatares de IA) se unindo para criar humanos de IA conversacionais.

O mercado de avatares de IA tem um valor estimado de $156,19 bilhões até 2032 (Os insights inteligentes). Muitas empresas, incluindo Laboratórios STAR da Samsung e startups como IA do DeepBrain e Síntese, estão continuamente inovando sua tecnologia de inteligência artificial (IA) e aprimorando seus humanos de IA para criar experiências de IA envolventes e agradáveis.

By 2026, half of B2B buyers will interact with a digital human in a buying cycle. -- Gartner, 2022 HypeCycle Report

Os avatares de IA conversacional já estão mudando a forma como empresas e organizações interagem com clientes e usuários.

Continue lendo para descobrir:

  • O conceito de LLMs (Large Language Models)
  • O desenvolvimento de avatares de IA
  • Criação de IAs conversacionais semelhantes às humanas
  • O impacto dos avatares de IA conversacional nas interações entre clientes e empresas

O que é um modelo de linguagem grande (LLM)?

O introdução do ChatGPT em novembro de 2022 marcou um momento crucial na popularização e ampla aceitação da IA generativa e dos modelos de linguagem grande (LLMs). A OpenAI demonstrou ao público como os LLMs e a tecnologia de IA podem ajudar empresas e indivíduos a automatizar tarefas, estimular o pensamento criativo e até mesmo auxiliar na codificação de software, marcando uma nova era de utilização da IA.

AI is like electricity. Just as electricity transformed every major industry a century ago, AI is now poised to do the same.  – Andrew Ng

Em sua essência, os LLMs são um tipo de inteligência artificial que lida com várias tarefas que envolvem processamento de linguagem natural (PNL). Essas tarefas incluem gerar e categorizar texto, fornecer respostas de conversação e traduzir texto entre idiomas.

Grandes modelos de linguagem (LLMs) são excepcionais em sua capacidade de compreender e replicar a linguagem humana naturalmente. Eles podem entender o contexto, construir respostas naturais e até mesmo emular nuances de conversação, resultando em interações que se assemelham à forma como humanos reais se comunicam entre si.

LLMs grandes versus pequenos

O termo “grande” se refere ao número de parâmetros (pesos e valores) que o LLM pode ajustar e alterar à medida que treina. Os maiores LLMs, como os Open AIs GPT-3, GPT-4 e do Google Palm 2, LamDA, BERT, Bardo, e Meta's Lhama 2 contêm centenas de milhões a bilhões de parâmetros. Equipes de pesquisa como as do Instituto de Inovação Tecnológica Falcão 40B, UC Berkeley Vicunha, Coala, bem como da Universidade de Stanford Alpaca também lançaram seus próprios grandes modelos de linguagem.

Apesar do aumento de grandes LLMs, as tendências recentes mudaram para modelos menores, mais acessíveis e personalizáveis, como Ada, Atlas, e Coerente.

Modelos de linguagem menores não são apenas mais econômicos, mas também são muito mais precisos na realização de tarefas comerciais específicas de um domínio. Isso ocorre porque eles são treinados e otimizados com base em dados cuidadosamente examinados que abordam os casos de uso exatos que interessam aos usuários e às empresas, em vez de serem treinados em todos os dados disponíveis ao público, o que inclui dados bons e ruins.

It’s not enough to just scrub the internet to train LLM.  Quality data counts - we all are going back to this truth   — Thomas Wolf, co-founder and CSO of Hugging Face

LLMs personalizados

Usuários e empresas que desejam mais controle sobre as respostas podem personalizar os dados dos quais um LLM extrai para modificar seu comportamento e sua saída. Existem duas maneiras principais de conseguir isso:

1. Incorporação

Modelos de linguagem grandes usam incorporações para projetar dados textuais, como palavras ou frases, em um espaço vetorial de alta dimensão. Isso permite que o LLM capture relacionamentos semânticos e nuances contextuais categorizando textos em rótulos ou categorias, como positivo ou negativo, spam ou não spam, notícias ou opiniões e assim por diante (Microsoft).

2. Ajuste fino

O ajuste fino de grandes modelos de linguagem se refere ao processo de refinar um modelo de linguagem de IA pré-treinado, treinando-o em um conjunto de dados mais restrito e específico para tarefas. Esse processo ajuda o modelo a melhorar e a ter um melhor desempenho ao criar conteúdo preciso e relevante, mantendo suas habilidades originais. Quando você ajusta um modelo de IA, é como enviá-lo para a pós-graduação depois de terminar a graduação.

Table showing the differences between Embedding and Fine-tuning LLMs

O que são Avatares de IA?

Digital humans are interactive, AI-driven representations that have some of the characteristics, personality, knowledge, and mindset of a human.   — Gartner 2023

Avatares são representações virtuais de usuários ou objetos em ambientes digitais. Os avatares tradicionais estão sempre sob o controle e o gerenciamento de humanos e não podem realizar ações que não sejam programadas com antecedência. Por outro lado, avatares de IA e humanos de IA podem interagir com pessoas reais sem depender da agência ou direção humana. Eles também podem entender e tomar decisões sozinhos com base no contexto do mundo ao seu redor.

Nos últimos anos, os humanos com IA fizeram avanços significativos em aparências e sons incrivelmente realistas. IA do DeepBrain afirma que seus avatares de IA parecem e agem 96,5% de forma semelhante aos humanos, e você pode ver como os humanos digitais STAR Labs da Samsung parecem realistas na imagem abaixo.

STAR labs avatar examples. AI humans in different outfits and poses
Crédito da imagem: STAR Labs

Normalmente, avatares de IA hiper-realistas são criados em um estúdio de gravação com um modelo humano da vida real, mas agora a criação de avatares também pode ser feita de forma totalmente digital, por meio de vídeos e imagens gravados por você mesmo ou por meio da tecnologia de troca facial — e a tecnologia está ficando cada vez mais rápida e fácil de usar.

Os principais elementos dos avatares de IA são:

  1. Aparência hiper-realista: Os humanos digitais estão se tornando cada vez mais realistas e realistas. Embora muitas vezes sejam criados em um estúdio e depois sintetizados por um programa de aprendizado de máquina, agora está se tornando mais rápido e fácil criar avatares digitais usando apenas fotos ou vídeos autofilmados.
  2. Movimentos naturais do corpo: Os avatares de IA usam um algoritmo chamado Generative Adversarial Network (GAN) para criar movimentos suaves e naturais da boca e do corpo. Os humanos com IA podem até mesmo sincronizar seus movimentos labiais de forma realista com qualquer entrada de áudio ou texto.
  3. Respostas de baixa latência: O DeepBrain AI relatou uma taxa de latência de menos de 1 segundo entre a entrada humana e a saída do avatar. Os avatares de IA conversacional são capazes de responder às consultas com o mínimo de atraso, resultando em um fluxo conversacional natural e realista.
  4. Conversão de texto em fala (TTS): A tecnologia de conversão de texto em fala (TTS) percorreu um longo caminho desde os primeiros assistentes de voz. Atualmente, o TTS pode produzir vozes extremamente realistas em todos os idiomas. Quando combinado com a sincronização labial, ele pode gerar uma réplica humana digital convincentemente real e falante.

O que são conversacionais Avatares de IA?

Em 2023, as tecnologias de avatar de IA e LLM convergiram para criar uma ferramenta poderosa para os usuários e mudar a forma como as empresas melhoram a forma como interagem com os clientes. Equipes da DeepBrain AI, Soul Machine, Uneeq e D-ID já começaram a criar humanos de IA conversacional, e os resultados foram impressionantemente naturais e bem-sucedidos.

Você pode pensar nos LLMs como o cérebro por trás de humanos digitais conversacionais, enquanto os avatares de IA servem como recipiente ou corpo. Juntos, eles têm um desempenho melhor do que os chatbots de IA comuns, imitando todo o processo de comunicação humana, incluindo sinais não verbais, como expressões faciais e linguagem corporal.

Humanos digitais conversacionais também são equipados com recursos poderosos, como memória, emoções e criatividade, para emular totalmente a cognição e o engajamento humanos. Essa tecnologia oferece possibilidades infinitas para empresas que buscam criar experiências envolventes e personalizadas para seus clientes.

Venn Diagram with large language models and AI avatars as the two main topics which overlap to be conversational Ai human

LLMs dão vida aos humanos com IA

Um dos aspectos mais interessantes do uso de LLMs com IA conversacional é a capacidade de criar e personalizar suas personalidades e personalidades.

Você pode criar um “representante de atendimento ao cliente que faça piadas assustadoras sobre o pai” ou um “caixa de café simpático e alegre que adora crimes reais”. As empresas podem até mesmo dar ao mascote de sua marca uma persona para que os clientes se envolvam em conversas cara a cara!

Startups como Inteligência artificial no mundo e Character.ai já estão usando LLMs para criar avatares de IA multidimensionais com personalidades, histórias de fundo e até falhas interessantes. Combinadas com avatares de IA conversacional, as empresas podem criar experiências especiais e divertidas para os usuários.

Imagine ir a um quiosque da Disneylândia e receber instruções de seu personagem favorito da Disney. Ou fazer com que uma versão de IA do seu CEO seja bem-vinda e fale com você no seu dia de trabalho!

Vantagens adicionais dos avatares de IA conversacional

Humanos de IA conversacional oferecem uma ampla gama de vantagens e benefícios tanto dos LLMs quanto dos avatares de IA... e muito mais! Aqui estão alguns destaques principais:

Presença acolhedora e agradável:

À medida que nossas vidas se tornam cada vez mais digitais, os avatares de IA conversacionais fornecem uma interface acolhedora e convidativa para interação. Ao adicionar um elemento de humanidade à IA, esses avatares de IA criam uma experiência de usuário mais envolvente e personalizada.

Disponibilidade 24 horas por dia:

Os humanos de IA podem gerenciar com eficiência grandes volumes de consultas simultaneamente, garantindo um serviço personalizado em todos os momentos.

Derrube as barreiras linguísticas

Humanos de IA conversacional entendem e falam fluentemente vários idiomas sob demanda. De acordo com Uneeq, seus humanos digitais podem entender 74 idiomas e falar 43 deles.

Suporte omnicanal.

Os avatares de IA conversacional podem ser configurados para lembrar todos os pontos de contato e interações anteriores, garantindo uma jornada de comunicação consistente para usuários e clientes. Eles também são acessíveis em todas as plataformas digitais, desde a web e dispositivos móveis até quiosques e até mesmo em ambientes de metaverso.

This combination of human avatars and LLMs is re-writing the rule book on traditional human-computer interaction and opening new avenues for enhanced customer experiences, transformative education and training, immersive simulations, personalized content creation, and cross-cultural communication.   — Eric Jang, Founder and CEO of Deepbrain AI

Humanos de IA conversacional na experiência do cliente (CX)

Iniciativas de negócios focadas em CX priorizam interações significativas com o cliente em vez de transações simples. Com avatares de IA conversacional, os clientes podem participar de conversas extensas, fazer várias perguntas e achar mais fácil discutir assuntos que talvez hesitem em abordar com um agente humano.

Os humanos de IA oferecem suporte para clientes que desejam um atendimento ao cliente exclusivo, mais envolvente e impactante. A seção a seguir investiga as aplicações práticas e os impactos positivos que humanos digitais conversacionais já causaram em vários setores.

Meet AI Humans as AI trainer. AI doctor, AI staff, AI Helper, AI engineer, AI anchor, AI tutor, AI chef, Ai coordinator
Crédito da imagem: DeepBrain AI

1. Consulta financeira:

Os avatares de IA também estão remodelando as finanças, conforme mostrado por Contadores bancários de IA do DeepBrain no KB Bank. Esses avatares simplificam as consultas bancárias rotineiras, permitindo que seus colegas de trabalho humanos da vida real se concentrem em tarefas mais complexas.

“Digital Dani” da Uneeq simula discussões financeiras de especialistas do UBS, uma instituição bancária na Suíça. A Digital Dani oferece aos clientes a conveniência de consultoria financeira especializada sob demanda.

KB Bank Ai Human Kiosk Used in real life
Quiosque bancário KB. Crédito da imagem: DeepBrain AI

2. Suporte educacional:

No setor educacional, os humanos de IA conversacional podem se tornar tutores de IA confiáveis e sempre disponíveis. O DeepBrain AI estende seu portfólio para a educação com professores de IA em tempo real na Kyowon Co. que ajudam os alunos a aprender por meio de palestras interativas e sessões de perguntas e respostas.

Humanos de IA conversacional, como Soul Machines, Mya e Emma, guiam os alunos em sua jornada acadêmica na Maryville University. Esses mentores digitais auxiliam com inscrições, compartilham ideias sobre a vida no campus e oferecem orientação profissional e acadêmica.

3. Hospitalidade:

Concierges de IA do DeepBrain no Novotel mostra o uso da tecnologia humana de IA na hospitalidade. Disponíveis 24 horas por dia, 7 dias por semana, esses avatares de IA respondem a todas as perguntas sobre viagens e serviços, permitindo que os hóspedes aproveitem ao máximo sua estadia.

Da mesma forma, “Íris digital” do Soul Machines oferece suporte aos viajantes no Aeroporto Fort Worth de Dallas, aprimorando suas viagens e reduzindo o estresse dos viajantes com informações e atualizações em tempo real.

2. Engajamento com a mídia:

Humanos de IA conversacional estão redefinindo as interações entre fãs e celebridades. Em parceria com o jurado da America's Got Talent Howie Mandel, A IA do DeepBrain está preenchendo a lacuna entre celebridades e fãs. Criar uma celebridade gêmea com inteligência artificial ajuda a promover uma conexão mais pessoal, permitindo que os fãs interajam e conversem com uma versão digital de sua estrela favorita.

O “Digital Einstein” da Uneeq leva esse conceito ainda mais longe, permitindo que os usuários se envolvam com uma versão recriada do renomado físico Albert Einstein, revelando sua sabedoria e humor.

5. Saúde e bem-estar:

A IA conversacional está aprimorando os serviços de saúde e bem-estar. A DeepBrain AI fez parceria com a Roche, uma empresa multinacional suíça de saúde, para criar um consultor de saúde de IA. O AI Doctor oferece suporte 24 horas por dia, 7 dias por semana, para consultas relacionadas à saúde e à Roche.

O “Reino Unido Digital” da Uneeq com Groov auxilia os usuários a alcançar melhores padrões de sono, contribuindo para melhorar a saúde mental.

6. Enriquecendo vidas:

O impacto dos avatares de IA conversacional se estende até a vida após a morte. A memória “Re;” do DeepBrain“O serviço fúnebre recria entes queridos em avatares de IA, proporcionando consolo e conexão para ajudar sua família a se curar e manter sua memória viva.

Re;memory picture of a couple communicating a passed family member as an AI
Re; memória. Crédito da imagem: DeepBrain AI

Só o começo...

O surgimento de avatares de IA e humanos de IA conversacional representa um salto significativo no desenvolvimento tecnológico. Isso abre possibilidades novas e ilimitadas para empresas que desejam criar experiências mais personalizadas e envolventes para seus clientes. É empolgante e assustador se perguntar o que o futuro reserva, mas uma coisa é certa: a tecnologia humana de IA está apenas começando.

À medida que avançamos, é essencial observar que a tecnologia de avatar LLM e AI ainda está em sua infância e ainda não atingiu todo o seu potencial. Com os avanços no aprendizado de máquina e no processamento de linguagem natural, podemos esperar ver avatares de IA ainda mais sofisticados e humanos de IA conversacional em um futuro próximo. Esses avanços, sem dúvida, levarão a novas inovações e capacidades, mudando a maneira como vivemos e trabalhamos de maneiras que só podemos começar a imaginar.

Most Read

Most Read

Vamos ficar conectados

Nossa equipe está pronta para apoiá-lo em sua jornada humana virtual. Clique abaixo para entrar em contato e alguém entrará em contato em breve.