OpenAI全新AI影片生成工具Sora是甚麼?一句說話即可生成影片!優點缺點一文看清

Esquire HK - Park Chan
  • 20 Feb 2024

OpenAI 發佈全新AI影片生成工具Sora,成為突破性的影片生成模型,超寫實及擬真的效果,與一年前的AI影片生成技術進步了何止10倍!到底Sora有多厲害?有甚麼限制?你又可以使用嗎?一次過讓你了解清楚!

ADVERTISEMENT
SCROLL TO CONTINUE

甚麼是Sora?

SORA是OpenAI推出的一種新型AI模型,它可以根據用戶的文字描述生成長達60秒的視頻,「SORA」一名取自日文中的天空「そら」,靈感源自天空可以喚起無限創造潛力的想像!而SORA這種模型使用了Diffusion模型和Transformer模型的結合,可以非常擬真地,將倒影、毛髮、反光、流水及動作等細節呈現出來。OpenAI的目標是,教授人工智慧理解和模擬運動中的物理世界,練模型解決現實世界互動的問題。

一如這一條最多人細看的「東京步行」影片,女人的自然擺動行走,加上地面的倒影,全部都是極之高質,而背後的Prompt是:

「A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.」

只要一段句子,就可以生成遠鏡、近鏡、移動效果,加上人物的自然動作及形態,全部都不需要專業人員的後製工序,就可以產生出來。

OpenAI全新AI影片生成工具Sora是甚麼?一句說話即可生成影片!優點缺點一文看清

一年前美國Runway AI都曾推出過影片生成工具,但是一看就很「AI」,畫質差,人樣差、而且當初只有4秒長度,想不到一年後,OpenAI推出的SORA,可以一口氣將市場上的影片生成工具擊倒。

ADVERTISEMENT
SCROLL TO CONTINUE

Sora的優點:複雜場景應對

Sora 能夠產生具有多個角色、特定類型的運動以及主體和背景的準確細節的複雜場景。 該模型不僅了解使用者在提示中提出的要求,還了解這些東西在物理世界中的存在方式。例如是長毛象在雪地中奔跑,那些揚起的雪非常自然踢起,再加上影子及光線的調節,令到畫面都極之擬真!

而背後的Prompt是:
「Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance creates a warm glow, the low camera view is stunning capturing the large furry mammal with beautiful photography, depth of field.」

Sora的優點:連反射、影子的計算都非常準

這段影片中,你可以見到火車玻璃的倒影,這些計算在往日的電腦動畫中,也是需要大量時間去運算,如今卻可以輕鬆做出來!

ADVERTISEMENT
SCROLL TO CONTINUE

Sora的優點:多鏡頭多角度

該模型對語言有深入的理解,使其能夠準確地解釋提示。而且 Sora 還可以在單一生成的影片中創建多個鏡頭,準確地保留角色和視覺風格,隨著相機移動和旋轉,人物和場景元素在三維空間中保持連貫的運動,不會有不連續的效果,可以輕鬆組成真正連貫的內容!

Sora的弱點

當前的Sora模型雖然看起來非常強大,但仍然存在不少弱點,它可能難以準確模擬複雜場景的物理原理,並且可能無法理解因果關係的具體實例。 例如,一個人可能咬了一口餅乾,但之後餅乾可能沒有咬痕。該模型還可能混淆提示的空間細節,例如混淆左右,並且可能難以精確描述隨著時間推移發生的事件,例如遵循特定的相機軌跡。

ADVERTISEMENT
SCROLL TO CONTINUE

Sora如今有甚麼限制?

SORA將限制文本提示,以避免生成性、暴力、仇恨或名人形象的圖像,以及包含現有知識產權的內容。此外,SORA的一些技術挑戰,如視頻的自然性、細節的真實性和生成速度可能是短期內需要克服的不足。

你可以用到Sora嗎?

Sora如今只由「Red Team」去使用,來評估關鍵區域的危害或風險。 而OpenAI還向一些視覺藝術家、設計師和電影製作人提供訪問權限,以獲取有關如何改進該模型以對創意專業人士最有幫助的反饋。未來可能一年內,Sora都可能已經可以正式讓公眾參與使用!

ADVERTISEMENT
SCROLL TO CONTINUE

有片都無真相

雖然Sora今天偶有失敗反物理的可能性,但不需演員場地,你就是導演,不需懂電腦繪圖或拍攝原理,也可以天馬行空地創作,未來的創作世界,已經愈來愈廣,所有人都有能力參與影片製作!
但最令人擔心的,是以後不只「有圖無真相」,連「有片都無真相」,你隨時完全分不開是真實拍攝或是人工智能生成,不過OpenAI明言,檢查並拒絕極端暴力、性內容、仇恨圖像、名人肖像或他人 IP 的文字輸入提示,但未來實際使用時,大家會如何使用?仍是未知之數。

Esquire Picks
Topic:
Tags:
投票即賺20分換取豐富 Cosmart 獎賞
投票即賺20分換取豐富 Cosmart 獎賞
訂閱Esquire接收最新科技資訊
Sign up FOR ESQUIRE_PAPER NOW!!
下篇文章