根據 OpenAI 的(de)介紹博文,Sora 能夠創建"具有多個(gè)角色、特定運動類型以(yǐ)及主體和(hé / huò)背景準确細節的(de)複雜場景"。該公司還指出(chū),該模型能夠理解物體"在(zài)物理世界中的(de)存在(zài)方式",還能"準确解釋道(dào)具并生成表達生動情感的(de)引人(rén)注目的(de)角色"。
該模型還能根據靜态圖像生成視頻,以(yǐ)及在(zài)現有視頻中填充缺失的(de)幀或擴展視頻。OpenAI 的(de)博文中包含的(de) Sora 生成的(de)演示包括淘金熱時(shí)期加利福尼亞州的(de)空中場景、從東京火車内部拍攝的(de)視頻等。許多演示都有人(rén)工智能的(de)痕迹--比如在(zài)一(yī / yì /yí)段博物館的(de)視頻中,地(dì / de)闆疑似在(zài)移動。OpenAI 表示,該模型"可能難以(yǐ)準确模拟複雜場景的(de)物理現象",但總體而(ér)言,演示結果令人(rén)印象深刻。
幾年前,像 Midjourney 這(zhè)樣的(de)文本到(dào)圖像生成器在(zài)模型将文字轉化爲(wéi / wèi)圖像的(de)能力方面處于(yú)領先地(dì / de)位。但最近,視頻技術開始飛速進步:Runway 和(hé / huò) Pika 等公司都展示了(le/liǎo)自己令人(rén)印象深刻的(de)文字轉視頻模型,而(ér)Google的(de) Lumiere 也(yě)将成爲(wéi / wèi) OpenAI 在(zài)這(zhè)一(yī / yì /yí)領域的(de)主要(yào / yāo)競争對手之(zhī)一(yī / yì /yí)。與 Sora 類似,Lumiere 也(yě)爲(wéi / wèi)用戶提供了(le/liǎo)文字轉換視頻的(de)工具,還能讓用戶通過靜态圖像創建視頻。
Sora 目前隻對"紅隊"人(rén)員開放,他(tā)們負責評估模型的(de)潛在(zài)危害和(hé / huò)風險。OpenAI 還向一(yī / yì /yí)些視覺藝術家、設計師和(hé / huò)電影制片人(rén)提供訪問權限,以(yǐ)獲得反饋意見。它指出(chū),現有模型可能無法準确模拟複雜場景的(de)物理現象,也(yě)可能無法正确解釋某些因果關系。本月早些時(shí)候,OpenAI 宣布将在(zài)其文本到(dào)圖像工具 DALL-E 3 中添加水印,但指出(chū)這(zhè)些水印"很容易去除"。與其他(tā)人(rén)工智能産品一(yī / yì /yí)樣,OpenAI 将不(bù)得不(bù)面對人(rén)工智能逼真視頻被誤認爲(wéi / wèi)是(shì)真實視頻的(de)後果。