På sin årlige GTC-konference tirsdag annoncerede Nvidia Omniverse Avatar, en ny platform til at skabe interaktive AI-avatarer.
På sin årlige GTC-konference tirsdag annoncerede Nvidia Omniverse Avatar, en ny platform til at skabe interaktive AI-avatarer. Platformen samler Nvidias forskellige teknologier inden for tale-AI, computervision, naturlig sprogforståelse og simulering.
Nvidia siger digitale avatarer oprettet ved hjælp af platformen er interaktive med strålesporet 3D-grafik og kan se, tale og samtale om forskellige emner (via Randen). Platformen åbner døren til skabelsen af virtuelle assistenter, der kan implementeres i stort set enhver branche. Nvidia forestiller sig, at teknologien kan hjælpe med en bred vifte af kundeserviceinteraktioner såsom restaurantbestillinger, aftaler og reservationer, banktransaktioner og så videre.
Under præsentationen viste Nvidia et par demoer af Omniverse Avatar. I en demo ser vi en legetøjsversion af Nvidias administrerende direktør Jensen Huang, der besvarer spørgsmål om emner som biologi og klimaændringer. I mellemtiden viser en anden en animeret karakter i en
restaurant kiosk samtaler med kunder da de bestiller mad fra menuen."Den daggry af intelligente virtuelle assistenter er ankommet. Omniverse Avatar kombinerer NVIDIAs grundlæggende grafik-, simulerings- og AI-teknologier for at lave nogle af de mest komplekse realtidsapplikationer, der nogensinde er skabt. Anvendelsen af kollaborative robotter og virtuelle assistenter er utrolige og vidtrækkende,” sagde Jensen Huang, administrerende direktør for Nvidia.
Omniverse Avatar er en del af Nvidia Omniverse, virksomhedens virtuelle verdenssimulerings- og samarbejdsplatform. Oprindeligt begrænset til ingeniører og udviklere, Omniverse er nu i Open Beta næsten alle og bliver i øjeblikket brugt af mere end 70.000 brugere. BMW, Adobe, South Park, Bently, Ericsson og Epigraph er blandt de virksomheder, der bruger OmniVerse.
Som nævnt ovenfor gør Omniverse Avatar brug af forskellige tale-AI, computervision og naturlige sprogbehandlingsteknologier. Til talegenkendelse og sprogforståelse er den afhængig af NVIDIA Riva og Megatron 530B, mens NVIDIA Merlin og NVIDIA Metropolis leverer anbefalingsmotor og perceptionsfunktioner, henholdsvis.