音声合成(TTS)は、ほとんどの音声アシスタントにとって最新の技術です。Alexa、Siri、Google などと対話しても違いはありません。応答は通常、スマートスピーカー、携帯電話、または自動車のスピーカーから再生される TTS 音声です。ブラックボックスに向かって話しかけ、肉体のない音声応答を受け取るという現在の音声アシスタントパラダイムは、今日の対話モデルではうまく機能しますが、これはこれから見られるメタバースにはうまく当てはまりません。
「バーチャルヒューマン」や「デジタルツイン」の開発を競い合う新しいスタートアップ企業をたくさん参加させてください。彼らは、より自然で、本物そっくり、ヒューマニスティックなデジタルインタラクションをベースにした、次世代の会話型インターフェースとなる可能性が最も高いものを作り出しています。では、なぜバーチャルヒューマンなのか、そしてなぜ今なのか?いくつかのテクノロジードライバーと社会経済的要因が、リアルタイムビデオ合成とバーチャルヒューマンにとって絶好のチャンスとなっています。
テクノロジードライバー
会話型のTTS応答と比較すると、ビデオ合成ソリューションがビデオを生成するためにより高いワークロード(CPU+GPU)を必要とし、ビデオを配信するためにより高いペイロード(ファイルサイズ)を必要とすることは間違いありません。ただし、CPU と GPU のパフォーマンスが向上し、可用性が向上するにつれて、クラウドとエッジでのビデオ合成プロセスは高速化されます。また、バッチ処理とスマートキャッシュの進歩により、会話速度という点では TTS ソリューションに匹敵するリアルタイムビデオ合成が可能になりました。そのため、超リアルな動画をその場で生成することのボトルネックは、主に解決されました。これが動画のリアルタイム配信につながり、Wi-Fi と 5G の両方でのブロードバンド速度のおかげで、ほとんどの家庭、企業、学校ですぐに利用できるようになりました。比較は下の動画でご覧いただけます。
ヘルプ (およびコンテンツ) 募集
ホテル、銀行、クイックサービスレストランなど、従業員に顧客との関わりを必要とする企業は、新しい従業員の雇用と維持に苦労しています。有能な人材が不足していると、ブランドに対する顧客の認識が損なわれ、実質的に収益が減少する可能性があります。基本的な要求を迅速かつ一貫して処理できるバーチャルヒューマンが登場しましょう。韓国では、セブンイレブンとKB銀行の両方が、バーチャルヒューマンに頼って顧客とやり取りするAIキオスクを設置しています。セブンイレブンの実装は、マンレス (またはウーマンレス) の運用をサポートします。
Virtual Humansにとってもう1つの有望な業種は、放送メディアとソーシャルメディア(インフルエンサー)の両方のメディアです。ニュースを24時間ストリーミングするにしても、TikTokで関連性を維持するにしても、ニーズは同じです。より多くの動画コンテンツをより速く生成することです。バーチャルヒューマンに関しては、アジアが再び主導権を握りました。MBN や LG HelloVision などのテレビ局はどちらも、1 日中定期的にニュース更新を提供する主役キャスターのバーチャルヒューマン版でライブ放送を補完しています。Virtual Humansを使った動画は、API呼び出しまたは直感的な「入力したとおりに表示される」Webインターフェイスを使用すれば、カメラ、スタッフ、照明、メイクアップなどを必要とせずに数分で作成できます。時間とコストを節約できるツールで、1日中組み合わせてコンテンツを新鮮に保つことができます。
「メタバースの戦略は?」その質問は、あらゆる分野の会議室で聞かれています。注文の受け付け、支援、ニュースの共有に今日の2Dバーチャルヒューマンを活用しているブランドが、3D世界とメタバースの初期のパイオニアへと急速に進化していくことは容易に想像できます。この分野での重要な発表については、年間を通して注目してください。