在5月27日閉幕的第15屆中國(深圳)國際文化產業博覽交易會上,騰訊集團副總裁、騰訊研究院院長司曉以《大模型時代文化內容生產的范式革命》為題發表主旨演講,系統闡述了大模型技術對文化內容生產、傳播及產業生態的顛覆性變革。他指出,大模型已從“工具賦能”躍升為“生態重構”,推動文化內容產業從“專業主導”向“全民共創”跨越,并加速文化傳承與創新的深度融合。
以下是司曉的演講內容整理。
人工智能的加速演進為文化內容領域帶來新的發展機遇。這一波生成式人工智能的發展浪潮可謂“日新月異”。以2022年底ChatGPT面世作為大模型進入公眾視野的首個重要節點,后續Midjourney、Gemini間隔數月陸續推出;而2025年未過半時Deepseek R1、Grok3等主流大模型就密集發布。毫不夸張地說,人類歷史上首次進入了技術以“天”為單位進化的時代,從技術發展到應用落地的間隔也被壓縮至無限短。
文化內容行業已成為智能實踐的先鋒領域。騰訊研究院曾調研了百余位各行業專家,憑借業態豐富、場景明確的優勢,文化產業中的傳媒、游戲等板塊對大模型的應用程度,在十多個不同行業中處于中上游位置。廣告、軟件、教育這些以智力和創意為核心的產業,成為大模型滲透速度最快的領域。
來源:騰訊研究院行業大模型報告
多模態突破:內容生產從"單一維度"邁向"全感官沉浸"
多模態大模型技術持續突破,生成效率與質量顯著提升。以騰訊混元為例,其文生圖能力在一年內實現跨越式升級:混元圖像2.0支持邊輸入文字邊實時生成圖像,用戶可即時調整美術風格、特效等視覺元素,相較此前需等待完整生成后再修改的模式大幅優化。文生視頻領域同樣進步明顯,2023年,有網友利用AI工具僅用5晚便完成《流浪地球3》“概念預告片”制作,引發導演郭帆關注。到今天,主流模型如混元、可靈到剛剛發布的谷歌Veo3,已經逐步有效解決手部穿模等畫面缺陷,生成視頻的連貫性與物理模擬能力顯著增強,甚至可以為畫面同時匹配準確的人聲和音效。面向影視生產的Flow等專業工具及國內同類軟件已實現腳本、分鏡、鏡頭控制等多項專業能力集成,展現驚人進化速度。
在文生圖片的擴散模型基礎上,疊加深度參數則升級為3D生成。騰訊在文生3D領域有諸多創新:混元3D生成模型2.5版本較上一版本,總參數量提升了10倍,能夠實現超高清的幾何細節建模。我們的同事已通過文生3D功能結合家用3D打印機,制作出原創玩具模型。未來,用戶不僅可以購買創意服務,更能自主構思創意,通過家用打印機直接輸出。
大模型對世界的理解與交互能力也在增強。我曾將手機作為GPT-4o大模型的“眼睛”,問它窗臺上有幾個公仔。它不僅準確回答了類型和數量——四個騰訊公仔,還在追問下識別出后方隱藏的一只兔子。盡管大模型的理解能力并非人類意義上的物理世界認知,但其基于視覺與推理能力的實現方式已具突破性——例如谷歌最新發布的通用AI智能體項目Project Astra,便如同鋼鐵俠的個人助理,可通過眼鏡或手機指導洗衣等日常操作,并與現實世界實現更自然交互。這些未來硬件與大模型結合的創新,必將為我們的生活帶來更多便利。
雖然我不是技術專家,對技術細節了解有限,但反而更能跳出細節去審視大模型當前的缺陷。現階段,用戶對大模型部分能力的不滿,本質上源于對其"許愿"般的進化期待——按照當前的進化節奏,諸多技術瓶頸將在未來最長以年、最短以月為單位的時間尺度內被突破。因此,AI在文化內容領域的應用前景更加值得期待。
效率革命:從"人力堆砌"到"智能涌現"的內容生產新范式
技術變革對文化內容生產范式帶來的影響是廣泛而深遠的。
大模型不僅讓知識觸手可及,更大幅降低了表達能力的門檻。用戶無需深入學習專業理論和工具技法,即可創作出以假亂真的圖片、視頻甚至電影等復雜形態內容。當然,創意本身也變得易得:例如,當寫作遇阻時,可讓大模型生成多個后續版本,從中選擇和優化內容,度過靈感“枯竭期”。未來,閱文等平臺上的網絡文學創作可能形成模式進化:從讀者逐章追更,到可主動“許愿”希望劇情如何發展,結合大模型的無限表達與創意涌現能力,使創作正真正進入“千人千面”的全新時代。
綜上,我們已進入“智力即服務”時代——人類首次通過云端模擬出一種智能形態,這種智能如同水、電般“打開水龍頭或電閘”即可獲取,推動我們真正邁入AI平權時代,生產效率大幅提升。AIGC加持下,創意與表達的實際供給量趨于無窮大,內容質量也將顯著提升,這將帶來一大批“超級創作個體”的崛起。
可以從兩個具體案例中看到這種趨勢:其一,上海民族樂團攜手騰訊音樂打造全國首臺國樂AI音樂會《零·壹 |中國色》。藝術家們基于“琴樂大模型”生成的音樂內容進行二次創作,同時幫助大模型改進算法,使擅長西方樂理的模型更加理解民樂獨特構成方式,實現生成內容從形似到神似的跨越。其二,中國傳媒大學師生制作AI短片《電火花之舞》獲國際認可。創作團隊借助大模型能力巧妙致敬十余部中外經典影片,并自然融入影片故事主線,斬獲麻省理工學院(MIT)AI電影節最佳敘事獎。
向善而行:技術溫度是內容產業的"終極競爭力"
最后,我想談談人工智能時代,智能向善三個重要路標“可信”“可靠”“普惠”中的“可信”問題。
大模型的“幻覺問題”成因復雜,包括技術原理、數據語料等。“幻覺”與“創新”本是一體兩面,在實際應用中,可以調整大模型生成內容的“溫度”(Temperature)參數,使得生成內容的“天馬行空”程度有所降低。但在教育、醫學等大量實際場景中,我們仍然希望大模型提供的內容無限接近“100%”可信。
為探索這一問題的解決方案,騰訊與多家出版機構開展合作,增加文化資源和可信大模型的雙向互動。一是共同構建出版智能體,支持用戶進行工具類圖書的內容咨詢。例如,人民衛生出版社基于騰訊元器智能平臺開發"人衛知識服務"智能體,不僅能為用戶提供特定醫學領域的權威解答,還能精準定位并引用相關書籍原文,并可跳轉至書籍電商平臺進行購買。二是微信讀書不斷升級“AI問書”功能,當用戶遇到生僻古語不知出處時,選定具體文字即可在出版機構專業語料庫中快速定位來源,并展示更多相關圖書鏈接,幫助用戶打開更廣闊的知識視界。此外,在微信除紅包外新增的“藍包禮物贈送”功能中,圖書贈送是最常用的場景。這些嘗試也推進了出版社的智能化轉型。
騰訊始終定位為“科技+文化”公司,從另一維度也可稱為“連接+內容”公司,因此我們與敦煌、長城合作開展了“云游敦煌”“云游長城”“數字藏經洞”等多個可持續社會價值項目,騰訊始終將“科技活化傳統文化”作為承擔社會價值的重要方向。
“探元計劃”是這一方向下的重要實踐:項目通過征集產業前沿技術與文旅應用場景,推動更多來自新興科技企業的技術與場景實現最優匹配。例如,我們近期與香港九龍城合作的“在九龍城 閱見香港”項目,對不同歷史時期的九龍城進行數字化,并融入專家級智能體。用戶可在H5互動體驗中游玩,同時向智能NPC提問關于九龍城的故事,獲得游戲化交互體驗。這種模式為文旅業帶來了更大的想象空間。
最后,推薦大家使用研究院在ima平臺搭建的AGI知識庫。AI以“天”為單位進化,我們團隊通過“人工+AI”方式每日搜集整理全球AI資訊,形成《AI每日速遞》,并整合至同一知識庫。這種基于人工篩選的定向知識庫對垂類知識進行了更系統和結構化的梳理,使大模型在回答用戶提問時可進行增強檢索,生成內容更具可信度。推薦大家使用!
謝謝大家!