Snowdrop 引擎帶來的次世代音效進步對即時「光跡追蹤音效」有何意義

雖然你可能知道 Ubisoft Massive 是《全境封鎖 2》以及即將推出的《星際大戰》和《阿凡達》遊戲幕後開發工作室,但他們也是 Snowdrop 引擎的創造者。Snowdrop 是 Ubisoft 最廣為使用的遊戲引擎之一,協助創作了《全境封鎖 2》、《瑪利歐+瘋狂兔子 王國之戰》、《銀河聯軍:阿特拉斯之戰》和《南方四賤客:浣熊俠聯盟》等遊戲。上面提到的《星際大戰》和《阿凡達》遊戲,也是使用 Snowdrop 開發製作。

為了瞭解這款引擎如何隨著次世代主機發展與變化,我們專訪了 Snowdrop 音效架構師 Robert Bantin。他在 Ubisoft 開發者大會上的演說「Snowdrop 音效:最新技術發展」闡明了未來遊戲的音效如何更有影響力。

 

你在 Snowdrop 引擎的音效方面有不少令人興奮的進展,能否用白話文說明一下到底什麼是遊戲引擎?有自己的專用引擎有什麼好處?

RB:簡單來說,好的遊戲引擎就像一套樂高玩具。樂高玩具的設計方式讓積木能完美地結合在一起。你可以給別人一套樂高玩具,而他們可以用各種方式將積木拼接起來。擁有我們自己的引擎意味著,你不僅可以提供開發者這些樂高積木去構建我們的遊戲,而且他們還可以開發自己的樂高作品,然後可以回饋到 Snowdrop 生態系統中供大家使用。

很多時候,專用引擎可以用來製作特定類型的遊戲,所以最後會發展出專門給該特定遊戲使用的特製版本。Snowdrop 正是針對這種趨勢而打造的,而且真正地用途多廣。玩家們永遠不會猜到,《全境封鎖 2》使用的引擎也用來製作了《工人物語》、《瑪利歐+瘋狂兔子 王國之戰》和《銀河聯軍:阿特拉斯之戰》。遊戲的美學可以隨著素材變化而改變,這很簡單,但像移動、戰鬥、導航等元素都可以成為引擎中永久存在的底層元素,可以從一款遊戲轉移到另一款遊戲。這樣我們就不用每次都重建所有一切,可以避免資源浪費。

次世代主機如何改變了 Snowdrop 製作和處理音效的方式?

RB:設計師總是要在一定的預算範圍內完成工作。我們可以使用多少處理能力?我們可以使用多少記憶體?處理能力和記憶體用量的增加顯然可以讓我們做更多的事情,但也許最大的改變來自於 PlayStation 5 和 Xbox Series X|S 都使用固態硬碟。在前代主機上,當你進入一個新的區域時,我們必須預先將素材載入記憶體,而載入時花的部分時間是用來將音訊提示和音效搬進系統記憶體中,這樣就可以快速使用這些素材 – 這些音效需要即時重播,例如撞擊聲、槍聲等等。我們只能從磁碟中安全地串流的不需要低延遲的聲音內容,例如背景音樂和環境聲音。

當你擁有這些主機的固態硬碟時,你開始意識到,你不必再將大部分資料載入系統記憶體中,因為硬碟本身的速度非常快。基本上,你可以根據需求直接從 SSD 上取用大量的音效資料。當然,一些不斷重複使用的音效,例如槍聲或腳步聲,可能仍會全數載入到系統記憶體中,因為這些音效的出現頻率很高,但其他很多音效資料就不需要完全載入記憶體。

你可以把這想成 Netflix:不用在看電影之前下載整部電影,而能以串流方式播放電影,一次只需將一小段電影內容載入記憶體中。就我們的情況而言,主要的區別是我們的音效素材是建構整個音場的材料,而這些素材現在絕大部分不需要完全載入記憶體。

「光跡追蹤」通常是指在遊戲中的光線如何在環境表面反射和反彈,但當涉及到你們的工作時,我曾經聽說過「光跡追蹤音效」這個詞。這到底是什麼意思?這對玩家的體驗有什麼影響?

RB:過去,我們已經使用光跡追蹤在室內空間裡產生物理精確的殘響。在《全境封鎖 2》裡,有數千個實例。我想大約是 2200 個,但如果有必要的話,可以增加到 5000 個。所有的聲學光跡追蹤都是在 Snowdrop 主開發工具內以非即時程序完成的,並寫入我們出貨給玩家的遊戲資料中。因此,這些房間被烙印上了它們的殘響脈衝資料,唯一需要即時運算的部分是我們特製的混響引擎,該引擎負責將本地和鄰近房間殘響資料套用至在這些房間中播放出來的無殘響聲音上。

雖然,最近我們已經能使用最新顯示卡上的 GPU 產生的即時光跡追蹤資料。對於殘響來說,傳真度還不夠高,但對於聲音阻礙測試,或者窗/門聲音傳播來說,則幾乎不費吹灰之力,因為我們需要的資料已經由圖形渲染器產生出來了。這意味著我們現在或許能在完全不動用到 CPU 的情況下完成大部分工作。

然後是 Snowdrop 音效專用技術,例如「Slapback」系統。目前其工作原理是利用 CPU 的物理光投射來追蹤玩家聲音可以抵達和反彈的地方,這樣我們就可以讓聲音在環境中產生回音。如此一來,同樣的動作會根據你所處的位置產生大大不同的聲音。

但這樣做並不只是為了「產值」。我們希望獨特的視覺空間也能成為獨特的聲學空間,這很合情合理。

以電影為例,比方說我們的英雄需要盪過一個巨大的裂縫。通常情況下,這些場景的拍攝手法,不會讓你看到完整的環境,但會讓你感覺到,那是個令人難以置信的深淵,因為你從他們的聲音中聽到回音。他們四周的聲音也會讓你有所感覺,在這種情況下,光靠聲音就可以告訴觀眾他們所處的環境,讓你知道這是個危險的情況。很容易讓人想像那是個超寬的深淵或是濃密叢林環境。

對我們來說,製作遊戲的不同之處在於,玩家是鏡頭的主人,所以我們需要做很多額外的工作來將你所看到的和你所聽到的結合起來。如果這些感官輸入之間開始脫節,那麼你的大腦就會告訴你這些不是有用的資訊,你就會停止關注較不那麼重要的資訊。這時我們可能就不能用聲音來暗示意象了。

是不是要有環繞喇叭或耳機才能體會?

RB:使用像樣的耳機,或者使用昂貴的環繞喇叭系統,可以讓感受有相當程度的提升,但只要你不使用電腦螢幕內建的喇叭,這類的音效處理通常都可以帶來一定程度的臨場感。最近真正有幫助的技術,是用於耳機的 3D 音效編碼(HRTF),現在 Microsoft 和 Sony 的遊戲主機都已內建了這類功能。這可以讓玩家用平易近人的價格獲得令人印象深刻的 3D 聲音沉浸感,對我們來說,這項技術與我們正在做的事情非常契合。

在 UDC 上對其他 Ubisoft 開發者進行這次演說的目的是什麼?

RB:現在 Ubisoft 已經有相當多的團隊在使用 Snowdrop。對我們來說,最重要的是在內部不斷分享,向其他音效團隊展示我們不斷積極改進的東西,讓他們可以用新功能直接升級自己的專案。這就是 UDC 存在的意義!

在未來聲音設計的潛力上,最讓你感到興奮的是什麼?

RB:如果你仔細研究新主機的打造方式,就會發現每台主機都用自己獨到的方式提供了更好的音效設備。

Xbox Series X 續用了 Microsoft 在 Xbox One 生命週期中加入的空間音效 API(例如支援杜比 Atmos),但現在性能更強大。而且這個 Xbox Series X|S 音效技術的工作原理與 Windows 10 一模一樣,所以我們只需付出小小的努力,就能觸及廣大的用家。

在 PlayStation 5 主機上,Sony 幾乎複製了我們為《全境封鎖 2》設計的音效處理管線,只不過是透過名為 Tempest Engine 的專用硬體來處理。這意味著我們很可能會把很多原本透過 CPU 進行的音效處理,轉移到該系統上,當然,這樣一來,CPU 就可以騰出時間來做其他事情。最初,我注意到其中有個處理區塊 – 光投射的部分 – 不是交由 Tempest 處理,這讓我感到很困惑。但當我看到有可用的光跡追蹤資料後,一切便豁然開朗。Sony 並沒有強迫你使用光跡追蹤資料 – 你仍然可以在 CPU 上使用特別訂製的物理光投射,現在每個開發者都可以根據具體情況決定如何處理這個部分。

所有次世代平臺都提供了更多的音效選項,現在就看我們如何利用了。這也是我夢寐以求的。

เมนู