OpenAI 推出(chū)文本到(dào)視頻人(rén)工智能模型 Sora-上海伍波網絡科技有限公司

根據 OpenAI 的(de)介紹博文，Sora 能夠創建"具有多個(gè)角色、特定運動類型以(yǐ)及主體和(hé / huò)背景準确細節的(de)複雜場景"。該公司還指出(chū)，該模型能夠理解物體"在(zài)物理世界中的(de)存在(zài)方式"，還能"準确解釋道(dào)具并生成表達生動情感的(de)引人(rén)注目的(de)角色"。

該模型還能根據靜态圖像生成視頻，以(yǐ)及在(zài)現有視頻中填充缺失的(de)幀或擴展視頻。OpenAI 的(de)博文中包含的(de) Sora 生成的(de)演示包括淘金熱時(shí)期加利福尼亞州的(de)空中場景、從東京火車内部拍攝的(de)視頻等。許多演示都有人(rén)工智能的(de)痕迹--比如在(zài)一(yī / yì ／yí)段博物館的(de)視頻中，地(dì / de)闆疑似在(zài)移動。OpenAI 表示，該模型"可能難以(yǐ)準确模拟複雜場景的(de)物理現象"，但總體而(ér)言，演示結果令人(rén)印象深刻。

幾年前，像 Midjourney 這(zhè)樣的(de)文本到(dào)圖像生成器在(zài)模型将文字轉化爲(wéi / wèi)圖像的(de)能力方面處于(yú)領先地(dì / de)位。但最近，視頻技術開始飛速進步：Runway 和(hé / huò) Pika 等公司都展示了(le／liǎo)自己令人(rén)印象深刻的(de)文字轉視頻模型，而(ér)Google的(de) Lumiere 也(yě)将成爲(wéi / wèi) OpenAI 在(zài)這(zhè)一(yī / yì ／yí)領域的(de)主要(yào / yāo)競争對手之(zhī)一(yī / yì ／yí)。與 Sora 類似，Lumiere 也(yě)爲(wéi / wèi)用戶提供了(le／liǎo)文字轉換視頻的(de)工具，還能讓用戶通過靜态圖像創建視頻。

Sora 目前隻對"紅隊"人(rén)員開放，他(tā)們負責評估模型的(de)潛在(zài)危害和(hé / huò)風險。OpenAI 還向一(yī / yì ／yí)些視覺藝術家、設計師和(hé / huò)電影制片人(rén)提供訪問權限，以(yǐ)獲得反饋意見。它指出(chū)，現有模型可能無法準确模拟複雜場景的(de)物理現象，也(yě)可能無法正确解釋某些因果關系。本月早些時(shí)候，OpenAI 宣布将在(zài)其文本到(dào)圖像工具 DALL-E 3 中添加水印，但指出(chū)這(zhè)些水印"很容易去除"。與其他(tā)人(rén)工智能産品一(yī / yì ／yí)樣，OpenAI 将不(bù)得不(bù)面對人(rén)工智能逼真視頻被誤認爲(wéi / wèi)是(shì)真實視頻的(de)後果。

新聞資訊

行業新聞