英偉達希望用 AI 化身填充虛擬和物理世界

英偉達希望用 AI 化身填充虛擬和物理世界

Nvidia 宣佈了一個用於建立名為Omniverse Avatar 的虛擬代理的新平臺。該平臺結合了許多離散技術——包括語音識別、合成語音、面部跟蹤和 3D 頭像動畫——Nvidia 稱這些技術可用於為一系列虛擬代理提供動力。

在公司年度 GTC 會議上的演講中,Nvidia 執行長 Jensen Huang 展示了一些使用 Omniverse Avatar 技術的演示。在其中一個數字亭中,一個可愛的動畫角色透過快餐店的選單與一對夫婦交談,回答諸如哪些食物是素食之類的問題。該角色使用面部跟蹤技術與顧客保持目光接觸並回應他們的面部表情。“這對智慧零售、免下車和客戶服務很有用,”該技術的黃說。

在另一個演示中,動畫玩具版的黃回答了有關氣候變化和蛋白質生產等主題的問題,在第三個演示中,有人在電話會議中使用了一個逼真的動畫化身作為替身。來電者在繁忙的咖啡館裡穿著休閒裝,但他們的虛擬形象穿著得體,說話時沒有任何背景噪音。最後一個示例基於 Nvidia 的 Project Maxine 工作,該工作旨在藉助機器學習修復來

改善影片會議的常見問題

(例如低質量的流和保持眼神交流)。

Omniverse Avatar 的釋出是 Nvidia 不可迴避的“omniverse”願景的一部分——為一系列模糊的技術打造一個宏偉的品牌。與“元宇宙”一樣,“全域”基本上是關於允許遠端協作的共享虛擬世界。但與Facebook 所有者 Meta 提出的願景相比,Nvidia 不太關心將您的辦公室會議轉移到虛擬現實中,而更關心用虛擬對手複製工業環境,以及——在其化身工作的情況下——建立與人互動的化身在物理世界中。

與這些演示一樣,英偉達的演示看起來相當漂亮,但尚不清楚這項技術在現實世界中的有用性。例如,對於售貨亭的角色,與簡單地從選單中選擇他們想要的專案相比,客戶是否真的更喜歡這種互動式體驗還不清楚。Huang 在簡報中指出,該頭像的響應時間為兩秒——比人類慢,如果客戶急於求成,勢必會引起挫敗感。同樣,儘管該公司的 Project Maxine 技術看起來很閃光,但我們尚未看到它對現實世界產生重大影響。