LLMs: Aufbau eines weniger künstlichen und intelligenteren KI-Menschen

Updated on
July 4, 2024
|
Technology
Published
August 23, 2023

Eine der aufregendsten Entwicklungen in der Technologie, die auf künstlicher Intelligenz basiert, ist das Aufkommen von Große Sprachmodelle (LLMs) und Avatare für künstliche Intelligenz (KI-Avatare) zusammenkommen, um etwas zu erschaffen Konversations-KI-Menschen.

Der Markt für KI-Avatare hat bis 2032 einen geschätzten Wert von 156,19 Milliarden US-Dollar (Die klugen Einblicke). Viele Unternehmen, darunter Die STAR Labs von Samsung und Startups wie DeepBrain KI und Synthesis, entwickeln kontinuierlich ihre Technologie für künstliche Intelligenz (KI) weiter und verbessern ihre KI-Mitarbeiter, um ansprechende und unterhaltsame KI-Erlebnisse zu schaffen.

By 2026, half of B2B buyers will interact with a digital human in a buying cycle. -- Gartner, 2022 HypeCycle Report

Konversations-KI-Avatare verändern bereits jetzt die Art und Weise, wie Unternehmen und Organisationen mit Kunden und Nutzern umgehen.

Lesen Sie weiter, um zu entdecken:

  • Das Konzept der LLMs (Large Language Models)
  • Die Entwicklung von KI-Avataren
  • Erstellung menschenähnlicher Konversations-KIs
  • Der Einfluss von dialogorientierten KI-Avataren auf Interaktionen zwischen Kunden und Unternehmen

Was ist ein Large Language Model (LLM)?

Das Einführung von ChatGPT der November 2022 markierte einen entscheidenden Moment für die Popularisierung und breite Akzeptanz generativer KI und Large Language Models (LLMs). OpenAI demonstrierte der Öffentlichkeit, wie LLMs und KI-Technologie Unternehmen und Einzelpersonen dabei helfen können, Aufgaben zu automatisieren, kreatives Denken anzuregen und sogar bei der Softwarecodierung zu helfen — was eine neue Ära der KI-Nutzung einläutete.

AI is like electricity. Just as electricity transformed every major industry a century ago, AI is now poised to do the same.  – Andrew Ng

Im Kern sind LLMs eine Art künstlicher Intelligenz, die verschiedene Aufgaben im Zusammenhang mit der Verarbeitung natürlicher Sprache (NLP) erledigt. Zu diesen Aufgaben gehören das Generieren und Kategorisieren von Text, das Bereitstellen von Antworten auf Konversationen und das Übersetzen von Text zwischen Sprachen.

Large Language Models (LLMs) sind außergewöhnlich in ihrer Fähigkeit, menschliche Sprache auf natürliche Weise zu verstehen und zu replizieren. Sie können den Kontext verstehen, natürliche Reaktionen konstruieren und sogar Konversationsnuancen nachahmen, was zu Interaktionen führt, die der Kommunikation zwischen echten Menschen ähneln.

Große und kleine LLMs

Der Begriff „groß“ bezieht sich auf die Anzahl der Parameter (Gewichte und Werte), die das LLM während des Trainings anpassen und ändern kann. Die größten LLMs wie die von Open AI GPT-3, GPT-4 und Googles Palme 2, Lamda, BERT, Barde, und Metas Lama 2 enthalten Hunderte von Millionen bis Milliarden von Parametern. Forschungsteams wie die des Technology Innovation Institute Falcon 40 B, UC Berkeleys Vicuña, Koala, sowie der Stanford University Alpaka haben auch ihre eigenen großen Sprachmodelle veröffentlicht.

Trotz des Aufstiegs massiver LLMs haben sich die jüngsten Trends hin zu kleineren, zugänglicheren und anpassbaren Modellen verlagert, wie Ada, Atlas, und Kohere.

Kleinere Sprachmodelle sind nicht nur kostengünstiger, sondern erfüllen auch fachspezifische Geschäftsaufgaben wesentlich genauer. Das liegt daran, dass sie anhand sorgfältig geprüfter Daten geschult und optimiert werden, die genau die Anwendungsfälle behandeln, die Benutzern und Unternehmen wichtig sind, und nicht anhand aller öffentlich verfügbaren Daten geschult werden müssen — zu denen sowohl gute als auch schlechte Daten gehören.

It’s not enough to just scrub the internet to train LLM.  Quality data counts - we all are going back to this truth   — Thomas Wolf, co-founder and CSO of Hugging Face

Benutzerdefinierte LLMs

Benutzer und Unternehmen, die mehr Kontrolle über die Antworten haben möchten, können die Daten, aus denen ein LLM abruft, anpassen, um ihr Verhalten und ihre Ergebnisse zu ändern. Dies lässt sich im Wesentlichen auf zwei Arten erreichen:

1. Einbettung

Große Sprachmodelle verwenden Einbettungen, um Textdaten wie Wörter oder Sätze in einen hochdimensionalen Vektorraum zu projizieren. Auf diese Weise kann das LLM semantische Beziehungen und kontextuelle Nuancen erfassen, indem es Texte in Bezeichnungen oder Kategorien unterteilt, z. B. positiv oder negativ, Spam oder kein Spam, Nachrichten oder Meinungen usw. (Microsoft).

2. Feinabstimmung

Die Feinabstimmung großer Sprachmodelle bezieht sich auf den Prozess der Verfeinerung eines vorab trainierten KI-Sprachmodells, indem es anhand eines engeren, aufgabenspezifischen Datensatzes trainiert wird. Dieser Prozess hilft dem Modell, sich zu verbessern und bei der Erstellung präziser und relevanter Inhalte eine bessere Leistung zu erzielen, während gleichzeitig seine ursprünglichen Fähigkeiten erhalten bleiben. Wenn Sie ein KI-Modell optimieren, ist das so, als würden Sie es nach Abschluss des Studiums an die Hochschule schicken.

Table showing the differences between Embedding and Fine-tuning LLMs

Was sind KI-Avatare?

Digital humans are interactive, AI-driven representations that have some of the characteristics, personality, knowledge, and mindset of a human.   — Gartner 2023

Avatare sind virtuelle Repräsentationen von Benutzern oder Objekten in digitalen Umgebungen. Traditionelle Avatare stehen immer unter der Kontrolle und Verwaltung von Menschen und können keine Aktionen ausführen, die nicht im Voraus programmiert wurden. Andererseits können KI-Avatare und KI-Menschen mit echten Menschen interagieren, ohne sich auf menschliche Einflussnahme oder Anweisung verlassen zu müssen. Sie können auch den Kontext der Welt um sie herum verstehen und selbst Entscheidungen treffen.

In den letzten Jahren haben KI-Menschen bedeutende Fortschritte gemacht, um unglaublich lebensecht auszusehen und zu klingen. DeepBrain KI behauptet, dass ihre KI-Avatare Menschen zu 96,5% ähnlich aussehen und sich auch so verhalten, und Sie können auf dem Bild unten sehen, wie realistisch die digitalen STAR Labs-Menschen von Samsung aussehen.

STAR labs avatar examples. AI humans in different outfits and poses
Bildquelle: STAR Labs

Normalerweise werden hyperrealistische KI-Avatare in einem Aufnahmestudio mit einem echten menschlichen Vorbild erstellt, aber die Avatar-Erstellung kann jetzt auch vollständig digital erfolgen, durch selbst aufgenommene Videos und Bilder oder durch Face-Swap-Technologie — und die Technologie wird immer schneller und benutzerfreundlicher.

Die wichtigsten Elemente von KI-Avataren sind:

  1. Hyperrealistisches Aussehen: Digitale Menschen werden immer realistischer und lebensechter. Während sie oft in einem Studio erstellt und dann von einem Programm für maschinelles Lernen synthetisiert werden, wird es jetzt immer schneller und einfacher, digitale Avatare allein aus Fotos oder selbst gedrehten Videos zu erstellen.
  2. Natürliche Körperbewegungen: KI-Avatare verwenden einen Algorithmus namens Generative Adversarial Network (GAN), um sanfte und natürliche Mund- und Körperbewegungen zu erzeugen. KI-Menschen können ihre Lippenbewegungen sogar realistisch mit jeder Audio- oder Texteingabe synchronisieren.
  3. Antworten mit niedriger Latenz: DeepBrain AI meldete eine Latenzrate von weniger als 1 Sekunde zwischen menschlicher Eingabe und Avatar-Ausgabe. Konversations-KI-Avatare sind in der Lage, Anfragen mit minimaler Verzögerung zu beantworten, was zu einem natürlichen und realistischen Gesprächsfluss führt.
  4. Text-zu-Speech (TTS): Die Text-to-Speech (TTS) -Technologie hat seit den Anfängen der Sprachassistenten einen langen Weg zurückgelegt. Heutzutage kann TTS extrem realistische Stimmen in allen Sprachen erzeugen. In Kombination mit der Lippensynchronisierung kann eine überzeugend echte, sprechende digitale menschliche Kopie erzeugt werden.

Was sind Conversational KI-Avatare?

Im Jahr 2023 kamen KI-Avatar- und LLM-Technologien zusammen, um ein leistungsstarkes Tool für Benutzer zu schaffen und die Art und Weise zu verändern, wie Unternehmen ihre Kundeninteraktion verbessern. Teams von DeepBrain AI, Soul Machine, Uneeq und D-ID haben bereits damit begonnen, dialogorientierte KI-Menschen herzustellen, und die Ergebnisse waren beeindruckend natürlich und erfolgreich.

Du kannst dir LLMs als das Gehirn hinter dialogfähigen digitalen Menschen vorstellen, während KI-Avatare als Gefäß oder Körper dienen. Zusammen schneiden sie besser ab als normale KI-Chatbots, indem sie den gesamten Prozess der menschlichen Kommunikation nachahmen, einschließlich nonverbaler Hinweise wie Gesichtsausdrücke und Körpersprache.

Digitale Konversationsmenschen sind außerdem mit leistungsstarken Fähigkeiten wie Gedächtnis, Emotionen und Kreativität ausgestattet, um die menschliche Kognition und das Engagement vollständig nachzuahmen. Diese Technologie bietet endlose Möglichkeiten für Unternehmen, die ihren Kunden ansprechende und personalisierte Erlebnisse bieten möchten.

Venn Diagram with large language models and AI avatars as the two main topics which overlap to be conversational Ai human

LLMs erwecken KI-Menschen zum Leben

Einer der aufregendsten Aspekte bei der Verwendung von LLMs mit Konversations-KI ist die Möglichkeit, ihre Personas und Persönlichkeiten zu erstellen und anzupassen.

Sie können einen „Kundendienstmitarbeiter entwerfen, der Papa-Witze macht, die das Grauen auslösen“, oder eine „freundliche, sprudelnde Café-Kassiererin, die wahre Kriminalität liebt“. Unternehmen können ihrem Markenmaskottchen sogar eine Persona geben, mit der Kunden persönliche Gespräche führen können!

Startups wie KI in der Welt und Character.ai verwenden LLMs bereits, um mehrdimensionale KI-Avatare mit interessanten Persönlichkeiten, Hintergrundgeschichten und sogar Fehlern zu erstellen. In Kombination mit dialogorientierten KI-Avataren können Unternehmen ihren Nutzern besondere und unterhaltsame Erlebnisse bieten.

Stellen Sie sich vor, Sie gehen zu einem Disneyland-Kiosk und lassen sich von Ihrer Lieblings-Disney-Figur eine Wegbeschreibung geben. Oder lassen Sie sich von einer KI-Version Ihres CEO begrüßen und an Ihrem Arbeitstag mit Ihnen sprechen!

Zusätzliche Vorteile von Conversational AI Avataren

Menschen mit dialogorientierter KI bieten eine umfassende Palette von Vorteilen und Vorteilen sowohl von LLMs als auch von KI-Avataren... und noch mehr! Hier sind einige wichtige Highlights:

Einladende und persönliche Präsenz:

Da unser Leben zunehmend digitaler wird, bieten dialogorientierte KI-Avatare eine warme und einladende Oberfläche für Interaktionen. Indem sie der KI ein menschliches Element hinzufügen, sorgen diese KI-Avatare für ein ansprechenderes und persönlicheres Nutzererlebnis.

Verfügbarkeit rund um die Uhr:

KI-Menschen können große Mengen an Anfragen gleichzeitig effizient verwalten und so jederzeit einen personalisierten Service gewährleisten.

Sprachbarrieren abbauen

Menschen mit dialogorientierter KI verstehen und sprechen bei Bedarf fließend mehrere Sprachen. Laut Uneq, ihre digitalen Menschen können 74 Sprachen verstehen und 43 davon sprechen.

Omnichannel-Unterstützung.

Konversations-KI-Avatare können so konfiguriert werden, dass sie sich an alle vorherigen Kontaktpunkte und Interaktionen erinnern und so eine konsistente Kommunikationsreise für Benutzer und Kunden gewährleisten. Sie sind auch auf allen digitalen Plattformen zugänglich, vom Internet über Mobilgeräte bis hin zu Kiosken und sogar in Metaverse-Umgebungen.

This combination of human avatars and LLMs is re-writing the rule book on traditional human-computer interaction and opening new avenues for enhanced customer experiences, transformative education and training, immersive simulations, personalized content creation, and cross-cultural communication.   — Eric Jang, Founder and CEO of Deepbrain AI

Conversational AI — Menschen im Kundenerlebnis (CX)

CX-orientierte Geschäftsinitiativen priorisieren sinnvolle Kundeninteraktionen gegenüber einfachen Transaktionen. Mit dialogorientierten KI-Avataren können Kunden umfangreiche Konversationen führen, mehrere Anfragen stellen und es fällt ihnen leichter, Angelegenheiten, die sie möglicherweise nicht ansprechen, mit einem menschlichen Agenten zu besprechen.

KI-Menschen bieten Unterstützung für Kunden, die einen einzigartigen, ansprechenderen und wirkungsvolleren Kundenservice wünschen. Der folgende Abschnitt befasst sich mit den praktischen Anwendungen und positiven Auswirkungen, die digitale Konversationsmenschen bereits in verschiedenen Branchen erzielt haben.

Meet AI Humans as AI trainer. AI doctor, AI staff, AI Helper, AI engineer, AI anchor, AI tutor, AI chef, Ai coordinator
Bildquelle: DeepBrain AI

1. Finanzielle Beratung:

KI-Avatare gestalten auch das Finanzwesen neu, wie gezeigt von Die KI-Bankangestellten von DeepBrain bei der KB Bank. Diese Avatare optimieren routinemäßige Bankanfragen und ermöglichen es ihren echten menschlichen Mitarbeitern, sich auf komplexere Aufgaben zu konzentrieren.

Uneeqs „Digital Dani“ simuliert Finanzfachgespräche von UBS, einem Bankinstitut in der Schweiz. Digital Dani bietet Kunden den Komfort einer fachkundigen Finanzberatung auf Abruf.

KB Bank Ai Human Kiosk Used in real life
KB Bankkiosk. Bildquelle: DeepBrain AI

2. Pädagogische Unterstützung:

Im Bildungssektor können Menschen mit dialogorientierter KI zu zuverlässigen, immer verfügbaren KI-Tutoren werden. DeepBrain AI erweitert sein Portfolio um den Bildungsbereich mit KI-Tutoren in Echtzeit bei Kyowon Co. die den Studierenden durch interaktive Vorlesungen und Fragerunden beim Lernen helfen.

Konversationsfähige KI-Menschen wie Soul Machines Mya und Emma begleiten Studenten auf ihrer akademischen Reise an der Maryville University. Diese digitalen Mentoren helfen bei Bewerbungen, geben Einblicke in das Campusleben und bieten berufliche und akademische Beratung.

3. Gastlichkeit:

Die KI-Concierges von DeepBrain im Novotel zeigt den Einsatz von künstlicher Technologie für Menschen im Gastgewerbe. Diese KI-Avatare sind rund um die Uhr verfügbar und beantworten alle Reise- und Serviceanfragen, sodass die Gäste ihren Aufenthalt in vollen Zügen genießen können.

In ähnlicher Weise Die „Digitale Iris“ von Soul Machines bietet Reisenden am Flughafen Dallas Fort Worth Unterstützung, verbessert ihre Reise und reduziert den Stress der Reisenden mit Informationen und Updates in Echtzeit.

2. Engagement der Medien:

Menschen mit dialogorientierter KI definieren Interaktionen zwischen Fans und Prominenten neu. Durch die Zusammenarbeit mit dem Richter von America's Got Talent Howie Mandel, DeepBrain AI überbrückt die Kluft zwischen Prominenten und Fans. Die Schaffung eines prominenten KI-Zwillings trägt zu einer persönlicheren Verbindung bei, indem Fans mit einer digitalen Version ihres Lieblingsstars interagieren und sich mit ihnen unterhalten können.

Uneeqs „Digitaler Einstein“ führt dieses Konzept weiter und ermöglicht es Benutzern, sich mit einer nachgebildeten Version des renommierten Physikers Albert Einstein zu beschäftigen und seine Weisheit und seinen Humor freizusetzen.

5. Gesundheitswesen und Wellness:

Conversational AI verbessert die Gesundheits- und Wellnessangebote. DeepBrain AI hat sich mit Roche, einem multinationalen Schweizer Gesundheitsunternehmen, zusammengetan, um einen KI-Gesundheitsberater zu entwickeln. Der AI Doctor bietet rund um die Uhr Unterstützung bei Gesundheits- und Roche-bezogenen Anfragen.

Uneeqs „Digital UK“ with Groov unterstützt Benutzer dabei, bessere Schlafmuster zu erreichen und trägt so zu einer verbesserten psychischen Gesundheit bei.

6. Bereicherndes Leben:

Die Wirkung von dialogorientierten KI-Avataren erstreckt sich sogar auf das Jenseits. DeepBrains „Re; memory“„Der Gedenkgottesdienst lässt geliebte Menschen in KI-Avatare nachbilden und bietet Trost und Verbindung, um ihrer Familie zu helfen, zu heilen und ihre Erinnerung lebendig zu halten.

Re;memory picture of a couple communicating a passed family member as an AI
Re; Erinnerung. Bildquelle: DeepBrain AI

Nur der Anfang...

Das Aufkommen von KI-Avataren und dialogorientierten KI-Menschen stellt einen bedeutenden Fortschritt in der technologischen Entwicklung dar. Es eröffnet Unternehmen, die ihren Kunden ein persönlicheres und ansprechenderes Erlebnis bieten wollen, neue und grenzenlose Möglichkeiten. Es ist sowohl aufregend als auch entmutigend, sich zu fragen, was die Zukunft bereithält, aber eines ist sicher: Die menschliche KI-Technologie hat gerade erst begonnen.

Im weiteren Verlauf ist es wichtig zu beachten, dass die LLM- und KI-Avatar-Technologie noch in den Kinderschuhen steckt und ihr volles Potenzial noch nicht ausgeschöpft hat. Angesichts der Fortschritte im Bereich des maschinellen Lernens und der Verarbeitung natürlicher Sprache können wir davon ausgehen, dass wir in naher Zukunft noch anspruchsvollere KI-Avatare und dialogorientierte KI-Menschen sehen werden. Diese Fortschritte werden zweifellos zu neuen Innovationen und Fähigkeiten führen und die Art und Weise, wie wir leben und arbeiten, auf eine Weise verändern, die wir uns nur ansatzweise vorstellen können.

Most Read

Most Read

Bleiben wir in Verbindung

Unser Team ist bereit, Sie auf Ihrer virtuellen menschlichen Reise zu unterstützen. Klicken Sie unten, um Kontakt aufzunehmen. In Kürze wird sich jemand mit Ihnen in Verbindung setzen.