昆仑万维发布Matrix-Zero世界模型
2月14日,昆仑万维正式推出 Matrix-Zero世界模型。Matrix-Zero世界模型包含两款子模型,第一款是昆仑万维自研3D场景生成大模型,支持将用户输入的图片转化为可自由探索的真实合理的3D场景。第二款是昆仑万维自研可交互视频生成大模型,提供以用户输入为核心驱动的可交互空间智能视频生成方案,支持根据用户实时输入生成互动视频效果。
2月14日,昆仑万维正式推出 Matrix-Zero世界模型。Matrix-Zero世界模型包含两款子模型,第一款是昆仑万维自研3D场景生成大模型,支持将用户输入的图片转化为可自由探索的真实合理的3D场景。第二款是昆仑万维自研可交互视频生成大模型,提供以用户输入为核心驱动的可交互空间智能视频生成方案,支持根据用户实时输入生成互动视频效果。
作为针对图片对应的3D世界中自由探索提出的视频生成系统,Matrix-Zero 能够在不同环境下高效地生成高质量的视频内容,并确保视频的流畅性、一致性和合理性。
昆仑万维Matrix-Zero的3D场景生成功能,支持将用户输入的图片转化为可自由探索的真实合理的3D场景,具备全局一致性、可自由探索、支持不同风格图片输入、支持风格迁移、支持动态场景生成等特点。能够实现这样的逼真效果,得益于昆仑万维自研3D场景生成大模型,包含两个核心模块:场景布局生成模块和纹理生成模块。几何生成模块借助可微渲染和扩散模型技术,能创造出和输入图片一致的3D场景布局;纹理生成模块在图片生成模型和视频生成模型基础上训练,当用户在场景中运动时,昆仑自研3D场景生成大模型不断对场景缺失区域进行几何和纹理的补全,从而确保用户在任何位置、任何角度都能看到合理、一致的场景。
为达到更好的流畅性、一致性等,昆仑万维可交互视频大模型建立在先进的生成式视频模型之上,结合自主研发的用户交互模块,最终实现了一种以用户输入为核心驱动的空间智能视频生成方案。该方法能够在保证开放领域视频生成能力的同时,进一步增强对视频内容中视角移动的精确控制,使其更加符合用户的交互需求和预期。通过这种方式,不仅可以生成符合用户意图的视频内容,还能够优化空间智能模型的适配性,从而拓展在虚拟环境、交互式应用以及沉浸式体验中的应用场景。
昆仑万维始终践行公司使命——实现通用人工智能,让每个人更好地塑造和表达自我,坚持在人工智能领域自主研发,持续推出AI产品。
过去三年,昆仑万维在视觉多模态、深度学习、强化学习等关键技术方向取得了一系列成绩,同时构建起了完整的AI矩阵:天工AI搜索,AI音乐创作平台Mureka,AI 短剧平台SkyReels,AI社交产品Linky,AI游戏等,形成了“AI前沿基础研究——基座模型——AI矩阵产品/应用”的产业链。
2025年1月,「天工大模型4.0」o1版(Skyworko1)和4o版(Skywork4o)正式上线天工APP和网页。2025年2月8日,昆仑万维旗下「天工AI」正式推出PC版重大更新——上线“DeepSeekR1 + 联网搜索”功能。
今天,昆仑万维Matrix-Zero系列模型的开发和迭代是公司对未来AI技术的提前布局,进一步赋能公司AI业务矩阵。交互生成模型的落地将变革可交互内容引擎,大大提升公司AI多矩阵产品的生产力。
Matrix-Zero世界模型预计4月份上线,将对公司AI游戏生产、AI短剧生产和编辑等业务进一步赋能,为用户和开发者带来新的平台和工具。(cis)
评论