東西作者江宇編輯漠影智東西6月16日報道,騰訊混元團隊于6月14日正式開源了其混元3D2.1大模型。這款模型作為首個全鏈路開源的工業級3D生成大模型,其核心在于對3D資產生成流程的全面優化,尤其是在幾何質量和材質表現上的提升,并首次開放了PBR(基于物理的渲染)材質生成能力。一、幾何更細膩,材質更逼真混元3D2.1在混元3D2.0的基礎上,優化了“幾何-紋理解耦”架構,這使得模型在處理3D資產時,兼具形態細節和視覺表現。1.幾何生成:基于DiT架構的細節建模優化混元3D2.1的幾何生成能力,得益于其采用的DiT(DiffusionTransformer)幾何架構。
這一架構進一步優化了3D網格細節建模能力。無論結構輪廓還是微觀紋理,該模型都能輸出更高精度、形狀一致性的網格,為后續材質渲染打下高質量基礎。2.紋理生成:引入PBR材質,實現光學效果混元3D2.1在開源模型中首次集成了PBR(PhysicallyBasedRendering)紋理生成技術,通過多視圖生成、逆渲染和貼圖技術的協同作用,該模型不再僅僅生成簡單的RGB顏色貼圖,而是能夠輸出一套完整的PBR紋理。這些紋理包括:基礎顏色貼圖(Albedo/BaseColor):還原物體最原始的顏色信息。
金屬度貼圖(Metallic):區分材質的金屬屬性,影響光線的反射方式。
粗糙度貼圖(Roughness):模擬表面微觀結構,決定光線散射的程度,直接影響材質的光澤感。這些PBR貼圖通過模擬光線與材質的物理交互,能夠真實還原皮革、木質、金屬、陶瓷等多種復雜材質的固有屬性。與傳統的RGB貼圖相比,PBR技術能夠確保模型在不同光照環境下呈現出始終如一的視覺效果。用戶盲測數據顯示,混元3D2.1生成的PBR紋理在質感表現上,勝出傳統RGB貼圖的比例高達78%。PBR材質的標準化特性,也使其能夠無縫兼容UnrealEngine、Unity等主流渲染引擎,可大幅提升3D資產的跨平臺適配與工業落地效率。三、混元3D經三輪迭代,代碼、權重、流程全面開放目前,開發者不僅可以獲得模型權重,還能接觸到完整的訓練代碼和數據處理流程。這種開放度允許用戶根據自身需求進行微調、二次訓練或深度優化,滿足定制化的開發需求,也為學術研究提供了平臺。在部署方面,混元3D2.1支持消費級顯卡運行,并在GitHub等開源社區提供了使用教程,降低了應用門檻。自2024年11月首次開源3D生成模型以來,混元3D持續迭代:2025年1月,混元3D2.0在文本一致性與幾何精度上有所提升,其技術報告詳細闡述了其擴散模型應用于高分辨率紋理和大規模形狀生成方面的技術細節。3月,一次性開源了5款3D生成模型,將資產生成效率提升至秒級4月,混元3D2.5模型將精度提升了超過10倍,使其進入超高清時代。此外,混元3D團隊還發布了3DAI創作引擎。該引擎具備文生、圖生以及多視圖輸入功能,并加入了智能拓撲能力——通過自回歸技術,能夠生成拓撲結構接近手工布線的低模。同時,該引擎整合了多套針對3D設計師需求的專業工作流,覆蓋角色/道具設計等場景,充分滿足游戲開發、動畫影視及3D打印等專業領域的需求。目前,混元3D模型在HuggingFace平臺的下載量已突破180萬次,在全球開源社區中保持高活躍度。四、實際體驗:上傳圖片,一鍵生成手辦3D模型智東西第一時間在混元3DAI創作引擎(混元3D-V2.5)上進行了體驗,將圖片導入后,即可生成3D模型。
用戶僅需上傳符合規格的圖像,即可自動生成3D模型。
平臺支持上傳PNG、JPG、JPEG、WebP格式,最大10M,最低分辨率128×128,建議背景純色、單一主體、無文字干擾。
參考圖:在上傳參考圖后,用戶可選擇是否生成PBR貼圖,生成流程約耗時180秒,最終導出可在3D引擎中直接調用的模型資產。效果模型:用戶還可以通過綁定骨骼來驅動動作,生成3D動畫。在體驗過程中,智東西選擇了摔倒動作,此外,還可以選擇揮擊、跳舞等其他動作。3D動畫展示:結語:國產3D生成模型,開始接近“能用”的標準混元3D2.1在其開源體系中首次加入PBR材質生成能力,使國產3D模型在幾何和紋理兩個維度上進一步靠近工業制作標準。相比傳統RGB貼圖,也讓該模型在游戲、影視等場景中的應用可能性上了一個臺階。不過,“能用”的判斷不僅取決于生成效果本身,更取決于它能否融入真實生產鏈條、適配行業工具與流程規范。對國產3D模型來說,從參數升級到產業嵌入,是接下來更艱難的一段路。