
作者 |创建者:陈陈 |网易科技 李飞飞、杨立坤、马斯克,这三位顶尖头脑正在“合作”干大事。他们不再痴迷于滚动大型模型,而是开始了AI的下半场:世界模型。 (AI生成的图片)他们的野心早已超越了写诗或敲代码,而是试图利用这种黑科技在数字空间中彻底“重建”一个遵守物理定律的现实世界。而产值达1900亿美元的电子游戏产业,正是这一伟大创意实验的第一个“试验场”。 1.《空间智能》:李飞飞对降维的攻击。很长一段时间以来,人工智能都陷入了文本和像素的“平坦世界”。 ChatGPT 理解语言逻辑,但不理解重力;可以生成视频的si Sora,但是视频中的吸管经常让它渗入杯子里。李飞飞,开启ImageNet深度学习时代的“AI教母”试图打破这堵墙。他新成立的独角兽公司World Labs估值超过10亿美元。今年11月,它亮出了自己的第一张王牌:名为Marble的商业世界模型平台。 Marble 不仅仅制作视频。它可以根据你的文字或图片,瞬间构建一个可以实时进入、自由探索、符合物理逻辑的3D世界。李飞飞在最新的宣言中平静地说:“它超越了语言的界限。”他将这种能力称为“空间智能”。在Marble平台上,用户输入“赛博朋克风格的小巷”,AI给它的不再是一幅画,而是一个像玩《赛博朋克2077》一样可以行走、回望、甚至导出的三维关卡。 (图片由AI生成,不代表实际效果)李飞飞明确针对行业主导地位:“Unity和Epic的Unreal(虚幻引擎)是时候被‘推翻’了。”传统模拟游戏工程ines将带来改进,世界模型可以彻底颠覆这个领域。 2、杨丽坤的“逆袭”:为什么LLM只是一台“复读机”?随着李飞飞实力的释放,AI行业的另一位领军人物杨立坤也坐不住了。上月底,他正式宣布成立AMI Labs(高级机器智能实验室),并给出了令人印象深刻的价格。据报道,该公司计划耗资 30 亿欧元(约合 35 亿美元)筹集 5 亿欧元(约合 5.86 亿美元)。杨丽坤一直是“大语言模型(LLM)”最激烈的批评者。他认为,目前的聊天机器人只是在玩概率游戏,没有真正的常识。 “世界模型”是他的终极解决方案。 (AI生成的图像)与LLM不同,杨丽坤的世界模型试图让AI像人类一样通过观察和感官数据(视频、声音、传感器)来学习:如果我推杯子,它会倒出来吗?如果我放手,球会掉下来吗?时间这种理性理解水果法则和物理法则,将主要解决AI的“幻觉”问题。有趣的是,AMI Labs 解雇了明星医疗 AI 初创公司 Nabla 的联合创始人 Alex LeBrun,担任首席执行官。勒布伦是一个冷酷无情的人,他知道自己的生意。他曾经将自己的初创公司卖给了 Facebook。这意味着杨丽坤不再满足于学术实验室的研究。他想直接进入医疗、游戏等实际领域。 3. Google DeepMind Genie 3:实时生成“Ready Player One” 如果说杨立坤勾勒出了世界模型的逻辑蓝图,那么 Google DeepMind 则直接创建了“Creator”原型。随着李飞飞、杨丽坤相继亮剑,DeepMind也推出了旗下的科技“大杀器”精灵3。它不再是一个只能看不能摸的视频生成器,而是一个可以实时生成并交互的动态世界模型。 “这可能是这个难题中最关键的一块DeepMind 的研究科学家 Jack Parker-Holder 评论道。(图像由 AI 生成,并不代表实际效果)Genie 3 的神奇之处在于它的昂贵程度,它与“交互”有关。它可以以每秒 24 帧的速度、720p 的分辨率实时响应用户文本命令。当你输入命令时,它不会给你静态图像,而是立即但内部团队最令人难以置信的是它所展示的“物理记忆”功能,在传统的人工智能生成的图像中,物体往往是“短暂的”——当你转身时,你身后的树可能是一根电线杆。但精灵 3 具有物理一致性: · 墙壁油漆:如果你在虚拟世界中将墙壁涂成红色,即使你出去探索森林再回来,红色油漆也会留在那里。沙子,皮肤的惯性g,或者游泳的浮力,Genie 3可以提供精确的反馈。 (AI生成的图像)最可怕的是精灵3的物理常识并不是由程序员手动编写的代码定义的。 DeepMind 研究总监 Shlomi Fruchter 表示,该模型没有被告知什么是“水”、什么是“摩擦”。通过大量的数据训练,模拟现实的能力是完全“自发”的。这意味着人工智能通过观察人类世界的图像自行推断牛顿力学。研究团队坚信Genie 3将成为具身智能的最佳训练场。在昂贵的原型机器人进入现实世界之前,它们可以在 Genie 3 创建的无限、高保真模拟环境中接受数百万次训练。就连 DeepMind 也谦虚地承认,该模型距离“完美模拟现实”还很远,但他们已经有了开放该模型的计划。显然,谷歌还没有准备好仅仅成为一个观察者。它想要直接定义未来3D交互的标准。 4.马斯克和xAI:让我也造一个。如果说从实验室出来的AI科学家还在谈论“空间智能”、“因果关系”和“物理涌现”,那么马斯克的风格就符合“暴力美学”:雇佣最昂贵的人,做最疯狂的事情。今年夏天,马斯克的 xAI 从 Nvidia 挖来了几位顶尖研究员,包括 Zeeshan Patel 和 Ethan He,组建了“Omni Team”。这些专家的年薪高达44万美元(约合人民币320万元)。不仅如此,马斯克的xAI还在社交平台媒体上公开招聘“游戏导师”,马斯克赌在2026年底前推出一款完全由AI生成的伟大游戏。(图片由AI生成)对于马斯克来说,游戏只是一个训练场。世界模型在3D环境下的表现将直接关系到他的人形机器人擎天柱能否有效折叠现实中的衣服,以及特斯拉的FSD(完全自动驾驶)能否处理复杂的物理紧急情况。正如NVIDIA所说:世界模型市场的潜在规模大致等于现有全球经济的规模。 5、1900亿美元的诱惑和10亿美元的赌博。为什么巨头们都专注于游戏?据 Newzoo 称,全球视频游戏行业今年预计将产生近 1900 亿美元的收入。但辉煌数据的背后却是越来越难以为继的成本危机: ·一款3A大作的开发周期延长至5至7年。 · 生产成本很容易超过 10 亿美元。 · 成千上万的艺术家机械地执行着“磨皮”、“搬砖”等枯燥的工作。 (AI 生成的图片) Genie 3 项目负责人 Frukert 预测:“游戏创作将在未来几年内彻底转变。”目前的人工智能现在可以帮助开发者将视频游戏开发速度提高4倍。谷歌云今年的调查显示,近 90% 的视频游戏开发者使用 AI 代理来提高效率。有用户预测,2026年,用户可以直接提示AI创造出类似《上古卷轴》的RPG游戏。以开发手游《异形大战僵尸:入侵》的Game Gears工作室为例。其首席执行官亚历山大·瓦申科 (Alexander Vaschenko) 断言:“很快,如果不依赖人工智能,电影和游戏行业将无法生存。”一些用户甚至认为传统的3A游戏开发模式已经死了。如今,人工智能允许工作室开发预告片和游戏玩法来测试玩家的兴趣,然后再决定是否投资开发,从而大大降低了风险。人工智能将使游戏行业从通常需要数年时间和数亿美元的开发阶段转向高效的原型测试。在不久的将来,所谓的“3D建模”和“复杂的开发软件”将成为过去。一个普通玩家坐在电脑前,对着麦克风说:“我制作了一个指环王风格的开放世界,但我喜欢它的粉红色”,AI可以实时为你构建独特的游乐场。 (AI 生成的图像) 6. 进步的代价? “内容浪费”和工会愤怒 然而,每一个技术奇点的背后都有一个阴影。本月,六个欧洲视频游戏联盟对人工智能的过度使用发起了愤怒的集体抗议。他们认为,公司强迫员工使用这些工具,但代价是工作条件恶化和大规模裁员。更大的冲突是关于艺术的完整性。批评者担心,当AI世界模型可以创造出无限的3D环境时,玩家将面临大量的“垃圾内容”——看似美丽、逻辑性强,但没有灵魂、没有审美人性温情的平庸作品。 (图片由 AI 生成)《博德之门 3》开发商 Larian Studios 负责人 Michael Douse 给 X 泼了一盆冷水:“游戏行业缺少的不是他认为行业需要的不是更多“数学生成、心理训练的玩法循环”,而是需要人的情感表达。 7、结论:在数字世界中“寻求乐趣” 面对争议,DeepMind 专家、育碧前制作人 Alexandre Moufarek 给出了较为温暖的看法。(图片由 AI 生成)他回忆起自己在传统核心工厂制作游戏的日子:圣诞节临近,由于工期如此紧张, “我希望世界模型能够把时间还给开发者,让他们重新‘找到乐趣’并承担风险,而不是被重复的手工工作压垮。”这句话表达了创新的初衷:让AI承担物理世界的负担,让人们重新回到创造精神世界(AI生成的图像)的背后。李飞飞、杨立坤和马斯克的不同路径却达到了同一个目标,这是人工智能进化逻辑的根本一步。从LLM的“人云亦云”到世界模型的“洞察物理”,AI完成了其认知难题中最关键的部分。在这场豪赌中,游戏行业是第一个被选中的“幸运儿”。我们所见证的不仅仅是游戏开发方式的颠覆,更是AI从“观察者”到“创造者”的惊人转变。