首頁 > 現代都市 > 這個吞金獸不好養 > 第兩百六十七章 概念

第兩百六十七章 概念(2/2)

目錄

視頻不再僅僅是娛樂工具,而是變身為生產力工具。

各個領域和各個垂直行業,都希望藉助音視頻技術的賦能,改變現有的企業經營模式,提升效率,降低成本。

尤其是VR/AR技術,經過多年的發展,已經在文旅、教育、工業、醫療等領域有了成功的應用案例。

越來越多的企業希望擁抱它們,但是,又對其背後的技術門檻和資源投入望而卻步。

我們現在每天都在討論數位化轉型,其實,音視頻對垂直行業的賦能,就是企業數位化轉型的一個極佳的入口。

究竟如何應對上面提到的音視頻發展需求和挑戰?國內網際網路巨頭企鵝,已經給出了自己的回答。

自QQ時代以來,企鵝在音視頻通信領域已經有二十一年的技術積累。

為了更好地進行音視頻黑科技的探索、研發及應用落地,企鵝也是專門成立了多媒體實驗室。

多媒體實驗室通過企鵝雲,輸出通?解決?案及產品。

2021年,企鵝全新推出「騰訊雲音視頻」品牌,就是依託於企鵝多媒體實驗室的研究成果,為客戶提供更高質量、更低成本的音視頻通信服務,共創「全真互聯」。

首先,是智能媒體的內容生產。

先看智能視頻。做過視頻的人都知道,視頻內容創作的大部分工作量,都集中在視頻內容剪輯和渲染上,既費時又費力。

相比於傳統的人工剪輯,企鵝雲音視頻可以提供視頻的智能裁剪、智能綠幕替換,還可以實現智能拆條、集錦和封面。

說白了,就是系統基於算法和學習,自動對視頻素材進行「深加工」。

以智能裁剪為例。一個橫屏製作的視頻,如果用戶手機豎屏觀看,圖像要麼會變小,要麼會被固定裁剪,影響觀看體驗。有了智能裁剪,系統會自動識別圖像中的關鍵區域,進行最合理的裁剪,讓用戶看到關鍵內容。

智能拆條,則是智能識別和分析視頻原始素材中人物的動作、事件和表情,自動定位精彩片段,將其提取出來,完成剪輯、配樂等工作,變成精彩視頻集錦。

再看智能音樂,這是對音頻信號的智能識別、編創。

具體識別對象,可以是歌曲中的鼓點、節奏點或音樂高潮。針對音樂的強度、情緒、風格、情感等維度,對音樂進行理解和打標籤。在編創時,支持將音樂中人聲、伴奏、吉他、鋼琴等音軌分離,

智能音樂有一個非常有趣的能力,它可以自動對歌詞進行續寫,將一首流行歌改編成Rap,中文語境下支持押韻。

基於音頻和視頻的融合,應用更為廣闊,可以實現視頻配樂、音樂MV和自動vlog。現在短視頻特別流行,通過音視頻融合,可以幫助普通創作者針對視頻提供推薦音樂、自動生成配樂,或者針對音樂找到符合情緒和律動的視頻,大幅降低作品的生產難度。

除了內容創作以外,智能媒體還可以用於視頻修復和視頻增強。

企鵝多媒體實驗室通過深度學習敦煌壁畫病害數據,形成自動識別並添加圖示的一整套算法,打造出高效的AI壁畫病害識別工具。

同時企鵝訊多媒體實驗室也開啟了對老舊影像資料進行修復的工作,解決老電影抖動、劃痕、不清晰等問題,使之可以適配更高清的顯示設備。

如果採取人工修復的方式,每人每天只能修復4、 5分鐘影片。而基於騰訊雲音視頻的智能修複方案,修復一部影片只需要幾個小時。

再來看看沉浸媒體(也就是VR)的關鍵技術和解決方案。

VR是元宇宙和全真互聯的核心技術,也是音視頻最具挑戰的領域。

企鵝雲音視頻,基於企鵝多媒體實驗室研發的VR全景技術,可以實現VR360超高清點播和VR360高清實時通信兩大核心能力,提供端到端一站式全景導覽方案,包括VR園區街景導航、VR360全景景區慢直播、VR數字沙盤、VR360全景會議會展直播,等等。

提升編解碼壓縮能力,是應用VR的關鍵。

VR視頻因為含有三維的時間和空間信息,所以冗餘高,數據體積大,對帶寬的要求高。如果不進行適當壓縮處理,很難存儲、傳輸和計算,占用的資源會很多。

當前有一種壓縮方式,是處理後去除25%的冗餘點,但渲染cube邊界明顯,無傳輸方面的處理。騰訊多媒體實驗室的方案,比這種更接近原片,播放時無明顯邊界。而且騰訊的方案增加了傳輸的處理,對可視區域進行切塊、渲染播放,能夠節省50%的帶寬。

在「一部手機游雲南·VR全景點播」項目中,基於騰訊雲的雲渲染PaaS解決方案,將南頭古城以1:1的比例,超精細化還原到了雲端,任何人都可以通過小程序暢遊古城。

在同等網絡條件下,傳統4K無切塊方案帶寬需求大於 9 MBps,而採用了騰訊的8K切塊方案後,帶寬需求小於 8 MBps。

全景導覽方案的四大核心技術,分別是全景拼接、點雲空間重建、圖像增強、點雲數據壓縮。

全景拼接,可以通過算法將單張照片拼接為全景照片,算法效果極佳,有效減少了畫面變形、畸變。

圖像增強,則是通過圖像降噪、AI色彩增強技術,增強畫面色彩和細節,提升人眼的主觀效果。

點雲空間重建,是以一個實用性很強的技術。

它可以通過全景圖景深估計,重建空間點雲模型,展示空間結構。因為算法經過優化,數據可以壓縮至原來的六分之一,同時保持主觀視覺一致,非常適配移動端展示。

基於點雲重建的物體數位化技術,通過非接觸式的數據採集,能夠重建物體的數字模型,形成數字檔案。這一技術,非常適合文物的數據採集、存檔和展示,降低文物損壞風險。在零售行業,這些技術也可用於商品信息的採集、歸檔。

還是前面提到的敦煌研究院合作項目,沉浸式VR遠程會診,基於多媒體實驗室的高性能編解碼直播引擎,用4K超清畫質的360度沉浸式畫面,無死角展示洞窟內的景象和文物的細節。

企鵝雲音視頻解決方案涵蓋了智能採集、數據處理和渲染展示等多個環節,具備全景漫遊、熱點交互、多模式切換、沉浸式展示等多種實用功能。對用戶來說,使用過程非常簡單。

正如前面所說,音視頻技術的研發,是對解決方案提供商綜合能力的考驗,離不開長期的資源投入和能力沉澱。

說白了,先進的數據壓縮算法,強悍的算力硬體,對5G、AI等技術的掌握和運用,是一個優秀音視頻解決方案企業的必備條件。

目錄
返回頂部