近年來,隨著科技發展,越來越多數字技術相關的服務和產品得以精準落地。AI數字人的智能服務成為數實融合的“連接器”,實時3D數字建模技術讓文化遺產得到“數字永生”,文化消費的空間更加豐富多維,從社會消費端向生產端延伸,廣泛發揮“以數促實”的價值。這些數字技術的發展不僅支撐文化產業升級,也以豐富的數字化場景促進社會高效協作、實體產業轉型,助力企業降本、增效、提質并最終走向全真互聯。
生成式AI技術為AIGC注入新動能
近年來,隨著生成式AI(Generative AI)技術的快速發展創新,尤其是AI大模型和多模態AI技術的融合發展,以生成式AI為代表的AIGC技術的通用化能力和工業化水平快速提升,AIGC迎來“物種大爆發”,從語言文字快速擴展到圖像、音視頻、3D場景等各類數字內容。2022年,AIGC在技術進展、商業應用等層面都進入新階段,其對數字內容和社會各行各業的影響在未來幾年將持續彰顯。
《2022文化科技十大前沿應用趨勢》(下稱報告)指出,OpenAI的DALL-E 2、Stable Diffusion、MidJourney等可以生成圖片的AIGC模型引爆了AI作畫領域,讓AIGC加速進入公眾視野,各主流互聯網公司也紛紛推出自己的圖片、視頻生成模型。2022年11月OpenAI推出的ChatGPT模型,發布后不到一周就獲得了100萬用戶。ChatGPT作為一個通用性的對話機器人,在與用戶交互過程中可以完成各式各樣的文本任務,包括寫代碼、作詩、寫文章、提供專業知識等等。
隨著生成式AI模型的軟件開源、API接口開放等,越來越多的“大眾式”AI內容生產工具不斷出現,讓普通大眾可以通過AIGC參與文化藝術創作,這種創作力的大爆發將推動創作主體格局改變,使文化藝術的生產與消費進一步走向大眾化,助力文化藝術的創新發展與普及傳承。
報告認為,在這一趨勢下,要更加關注并妥善解決AICG可能帶來的信息內容安全、知識產權保護、算法歧視和社會倫理等問題,建立生成式AI和AIGC應用的倫理指南,通過技術手段識別、標記AI生成、合成內容,打造安全、可控、可信的AIGC應用。

數字孿生技術應用于國際賽事制播
近年來,國際重大文體活動成為文化科技創新的“孵化器”,數字孿生技術屢屢成為賽場“黑科技”。
一是通過虛擬仿真技術搭建文化遺產、景區、體育館等場景的“副本”,既能夠支持觀眾進行虛擬游覽,也能對場景進行可視化、實時動態的監測與管理。2022年卡塔爾世界杯通過數字孿生方案,為每個體育場都構建了一個“3D數字孿生”,將八大賽事場館連接為一體,并從約4萬個物聯網設備獲取實時數據;谶@套技術方案,數字孿生統一指揮中心能夠實現對賽場的實時可視化監控、遠程指揮控制,以更高的效率解決問題、保障體育賽事的運營安全。
二是支持文化創意在仿真場景中進行預演,推動演出、賽事等內容的制播更加高效、精準。2022年,北京冬奧會首次以數字孿生的方式搭建了“VSS虛擬場館仿真系統”,支持媒體完成“線上彩排”,谷愛凌在北京首鋼滑雪大跳臺比賽時,位于裁判塔的轉播機位完美記錄了她的奪冠瞬間,最終轉播實時呈現的效果,與轉播導演團隊借助仿真系統設計好的效果高度一致。
虛擬制作技術應用提速
2022年,工信部發布《虛擬現實與行業應用融合發展行動計劃(2022—2026年)》,提出要搭建常態化的虛擬現實線上演播攝制播出環境,支持沉浸式業態體驗落地推廣。
相關技術和政策環境的日益成熟,推動虛擬制作技術應用提速,為視聽節目制作帶來深遠影響。
一方面,虛擬制作技術拓展了現實舞臺場景,豐富了視聽節目的表達空間。2022年,虛擬制作被越來越多地應用于電視臺和網絡節目制作中,呈現出多樣化的視聽設計。2022年,河南衛視“奇妙游”系列節目通過“5G+XR”技術實現舞臺與虛擬場景特效的結合,將河南歷史文化中最耀眼的元素與精彩的歌舞、戲曲、武術等藝術表演結合起來;央視推出的《中國考古大會》節目,借助XR技術模擬考古探險地面實景和空中虛擬景觀共同構成的“魔幻場景”,實現“現實—考古進行時—歷史事件發生時”三重時態的舞臺轉換,以創造性表達的方式向觀眾還原考古探險場景。
另一方面,虛擬制作技術增強了實時交互體驗,塑造了“虛擬化在場+實時互動”的內容直播效果。2022北京冬奧會賽事直播中,咪咕公司基于“5G+XR”技術打造了虛實結合的多賽同看三維直播空間,在技術上突破了傳統的演播廳模式,同時支持三場比賽直播,實現360度全方位自由布局與實時互動。
“數字人含量”實現爆發式增長
2022年,社會生活與服務場景下的“數字人含量”實現爆發式增長。根據市場分析機構預測,到2026年中國AI數字人市場規模將達102.4億元。
伴隨數字人生產效能的提升,2022年高保真數字人、超寫實數字人、AI數字人在多方向的應用進一步成熟,為行業效率提升、服務升級提供人性化的工具,引發了數字人社會應用的新爆發:一方面,高保真數字人、超寫實數字人提升了信息交互的沉浸感,為新聞報道、直播、綜藝等領域提供了創新業務形態、吸引年輕人的突破口。例如,新華社聯手騰訊公司NExT Studios打造的全球首位數字航天員小諍,作為超寫實數字人實現了逼真、細膩的外形塑造,在航天新聞報道、知識科普等領域和年輕人群建立溝通,成為數字人助力媒體融合的典型案例。
另一方面,AI驅動的數字人能夠在各類場景提供接近真人的服務,成為傳媒、文旅、金融等行業數字化轉型的“加速器”。例如,央視頻3D智能語音助手“央小云”首次將數字人的技術能力應用于新聞熱點問答;在企業服務領域,結合行業知識圖譜,數字人能夠通過不斷的自學習、自適應提升服務能力,助力企業數字化轉型力,越來越多的“數字員工”開始走進千行百業。
報告指出,未來,行業也需要探索建立數字人領域的知識產權保護措施,加強對知識產權、人文倫理等風險的研究和關注。

3D數字建模高精度還原文化遺產
隨著掃描建模技術、引擎渲染技術、PCG(Procedural Content Generation,程序化內容生成)等技術的進步,文化遺產的3D還原走向更加精細、逼真、具有沉浸感。
2022年,3D數字建模技術為文化遺產的保護與傳承提供了創新路徑,進一步拉近大眾與文化遺產之間的距離。例如,故宮和騰訊聯合主辦的“紋”以載道——故宮騰訊沉浸式數字體驗展,向大眾展示了“故宮最大裸眼3D文物”,讓文物實現22倍高清放大,使用戶體驗到實物展也難以感受的豐富細節,同時打破物理空間限制,將故宮文物展覽“搬運”到距離故宮博物院兩千余公里外的廣東深圳,實現了“文化+科技”的創新融合發展,以數字技術助力文化遺產煥發新的活力。
目前通過3D建模助力文化遺產數字化的方式,主要歸為兩種:一是將現實世界中的文化遺產,通過激光或者照掃的方式,制作為數字模型。目前在對精妙珍稀的小型文物進行數字化掃描時,通常使用16K高精度照掃模型制作。16K代表貼圖分辨率,數值越高,照掃出來的模型精度就越細膩。二是在3D建模軟件中建構模型,讓已經消失的文化遺產在數字世界中“復生”。借助Houdini、ZBrush、Adobe Substance等三維內容制作軟件制作場景,同時可以通過PCG(程序化內容生成)工具,利用算法來自動生成相應的內容。
3D數字建模高精度超寫實還原文化遺產,其成果可以廣泛應用于影視、游戲、藝術設計、工業設計、廣告等領域,讓觀眾以更加立體和沉浸式的方式感受文化遺產,貼近與歷史和文化的距離,并助力文化遺產實現“數字永生”。
游戲引擎助力實體領域
報告指出,以游戲引擎為代表的數字交互引擎,不僅能夠支持游戲創意落地,也能助力實體經濟領域進行測試、演練,實現“以數促實”,正在成為建筑設計、汽車制造、航空航天等實體領域的“新型工業軟件”,為“超級數字場景”的構建提供底層技術支撐。
2022年,游戲產業在硬件和軟件突破的加持下,向實現更大規模、更流暢、更逼真的實時3D體驗進發。硬件層面,英偉達、AMD、Intel三家芯片巨頭均發布新一代顯卡產品,圖形芯片算力加速發展;軟件層面,Epic發布最新虛幻5游戲引擎,使實時3D畫面接近真實世界;終端層面,Meta等公司帶來新一代XR設備,帶動消費級XR產品銷量提升,更多用戶在虛擬世界中體驗沉浸式視頻、直播、娛樂、社交生活。
文保場景中,敦煌研究院聯合騰訊推出“數字敦煌”項目,通過數字照掃、游戲引擎、云游戲等游戲技術,毫米級高精度復現了敦煌藏經洞及其百年前室藏6萬余卷珍貴文物的盛況,生動演繹藏經洞及文物背后的千年文化故事。
未來,各行各業的數字化轉型將產生更多對實時3D場景、沉浸式人機協作與交互的需求。以游戲引擎為代表的數字交互引擎,有望在新型終端、云邊協同等領域實現廣泛應用,成為更多社會需求的創新解決方案,助力構建一個具有豐富價值與可能的“超級數字場景”。
遠程實時操控跑出“加速度”
隨著實時音視頻技術(Real-time Communication,RTC)在穩定性和流暢性方面實現提升,音視頻技術融入會議、教育、電商直播等廣泛場景。2022年,以RTC技術為核心的遠程實時操控類應用發展迅速,并廣泛落地于生產作業、專業服務、大眾消費體驗等各類場景。
當前在遠程操控場景下,音視頻技術可以跨界應用于多種場合:第一類是生產作業類場景。在高危和環境惡劣的作業場景下,5G和RTC技術的結合,能夠以遠程操作的方式替代工作人員“在場作業”,將工作人員從艱苦的作業環境中解放出來,轉移到安全舒適的遠程端,實現少人化和安全作業。
第二類是專業服務類場景。傳統的實時音視頻主要是支持人與人的線上交互,而遠程操控為“線上人力向線下服務”帶來了全新可能。在遠程醫療領域,5G和RTC技術的結合能夠支持實時影像的高清、流暢傳輸,讓處于線上的醫生如同“在場”一般對病人進行檢查、診斷與手術。
第三類是大眾消費體驗類場景。在5G和RTC技術的支持下,遠程操控使“線上用戶體驗線下資源”成為可能。例如在“無人機云旅游”場景下,用戶通過操控無人機,在家就可以自由觀賞風景、獲得旅游體驗。
當前技術融合的速度明顯加快,實時音視頻技術和5G、VR/AR等技術的深入融合,將使人與人、人與物、物與物實現更深層次、更逼真的連接,為社會協作、實時交互提供更加順暢便捷的渠道,愈發成為打破時空局限、推動“在線”轉向“在場”的橋梁。