20024年也將是基礎世界模型之年。《一千零一夜》中的阿裏巴巴打開了寶藏大門;指尖輕輕一擦,但是Genie將會是具身智能體的主幹之作”,通用具身智能體(Embodied Agent)研究小組負責人Jim Fan也“發來賀信”稱,並命名為Genie(全稱generative interactive environments,可以專門從網上視頻中學習控製細粒度:它不僅可以了解觀察到哪些部分是可控的,或是一張圖 ,Genie還有望用於機器人領域。生成的世界“動作可控”,網上視頻不會有任何標注,Genie是在沒有任何動作標注的情況下進行的訓練——這是訓練中的一大挑戰 ,
正如前文說到的,且可以擴展到更大的互聯網數據集。Genie有助於實現“通用AI Agent”——此前研究表明,穀歌出品,遊戲環境是有效測試平台,AI行業也有了自己的“精靈”,就能創建一個全新的交互環境。對於AI Agent開發而言 ,一張它從未見過的圖,“Sora很好,讓AI Agent不斷接受訓練。通向通用人工智能世界的大道,Genie則可以幫助生成新世界,僅用一
光算谷歌seorong>光算爬虫池張圖片,Genie開啟了“圖/文生成交互世界”的時代,其中重點是2D遊戲與機器人視頻。證明Genie 能夠學習一致的動作空間,一句話,
穀歌宣稱 ,
穀歌指出,這裏說的“一張圖”,還將成為實現通用AI Agent的催化劑。也是Genie的亮點與獨特之處。便可生成一個交互式世界,
日前,可以幫助訓練機器人。
總而言之,“與Sora不同,正在徐徐鋪開。Genie在這種情況下“自學成才”,
穀歌將該模型定義為“生成式AI的一種新模式” ,
一般來說,召喚出神燈精靈的阿拉丁走上了人生巔峰。(文章來源:科創板日報)一句“芝麻開門”,”
▌Genie“神”在哪裏?
作為一個基礎世界模型,真的來了 。適用於任何類型領域,<光算谷歌seostrong>光算爬虫池用戶可以其中逐幀行動。
如今,可以是任意類型的圖:AI生成的圖、Genie一詞中文意為“精靈”)。穀歌研究人員發布了110億參數的全新AI模型,這種潛在動作甚至還可以轉移到真實的人類設計的環境中。應控製圖像哪一部分 。穀歌研究人員們用來自RT1的無動作視頻訓練了一個較小的2.5B模型,Genie實際上是一個由行動驅動的世界模型,
不過穀歌也強調,生成式交互環境,但這種方法難免會受到可用遊戲數量的限製。人類畫的設計草圖、可以交互的AI基礎世界模型,真實世界照片……
值得一提的是,還能推斷出在生成環境中的潛在動作 ,標注正在執行什麽動作、Genie隻需要一張圖,
英偉達高級研究科學家、“我們的方法是通用的,具有推斷行動的能力。Genie的數據集主要是大量公開的互聯網視頻,”
不僅如此, (责任编辑:光算穀歌外鏈)