华体会体育app 杨立昆发布史上最“轻”宇宙模子, 单GPU可训, 盘算速率提高48倍

2026-03-30 21:56 点击次数：71

华体会体育app 杨立昆发布史上最“轻”宇宙模子，单GPU可训，盘算速率提高48倍

在通往通用智能（AGI）的说念路上，宇宙模子（World Model）正被视为最重要的下一步。

平时来说，宇宙模子就像是给 AI 装上了一个“大脑模拟器”。它让机器东说念主不再只是是机械地奉行领导，而是具备了在遐想空间中预演将来的智商。当一个机械臂试图握取杯子时，宇宙模子允许它在真实脱手前，先在脑海中模拟不同动作可能导致的隔断。

为了构建这种模子，图灵奖得主杨立昆建议了斡旋镶嵌展望架构（JEPA）。该技艺抗拒直让 AI 展望复杂的画面变化，而是先把画面“压缩”成一串浅易的中枢特征，再让 AI 学若何展望这些中枢特征的变化。这么一来，AI 无谓缓和画面的细枝小节，只握重要规章，效用会高好多。

但是，传统 JEPA 技艺打造的 “模拟器”，弥远存在核肉痛点，成为其落地利用的阻难。

其一，检修易 “示意崩溃”，踏实性差。为了马虎完成特征展望任务，AI 会出现“偷懒”活动：将总共不同的视觉输入映射为险些疏通的潜特征，看似展望精确，实则这些特征毫无实践价值，这一问题被称为“示意崩溃”；其二，超参数繁琐，调参本钱极高。主流端到端 JEPA 技艺如 PLDM 领有 6 个可调超参数，参数的隐微变化齐会导致模子性能天差地远，调参不仅需要多半的时刻和筹谋资源，且参数无法跨任务复用，换一个任务就需要从头调试，门槛极高。

其三，筹谋本钱高，盘算启动迟缓。部分技艺为幸免“示意崩溃”，会依赖提前检修好的超大视觉预检修模子四肢基础，虽能提高踏实性，却让模子体积肥胖、编码效用低下，AI 完成一次方案盘算需要耗尽多半时刻。

近日，杨立昆团队发表的论文，建议了一款名为 LeWorldModel（简称 LeWM）的全新宇宙模子，中枢管理了传统 JEPA 检修不踏实、易崩溃、超参数多、筹谋本钱高的问题，是首个能从原始像素数据端到端踏实检修的宇宙模子。总共这个词模子就 2 个中枢组件、2 个死亡项，15M 参数，单 GPU 几小时就能训完，只好 1 个有用可调超参数。

LeWM 的构成相等精简，包括两部分。一个是编码器，用轻量的视觉模子，把录像头拍的彩色画面，形成一串节略的中枢特征，收拢画面里的重要信息；另一个是展望器，字据 “现时的中枢特征以及要作念的动作”，精确展望下一步的中枢特征，比如 “推一下方块，它的位置特征会形成什么样”，学懂环境的启动规章。

LeWM 最中枢的突破，在于用两个浅易且有科学因循的检修办法，从压根上管理了传统 JEPA 的“示意崩溃”问题，透顶摈弃了训诲性技能。其一为展望死亡，是让 AI 精确展望将来的中枢特征，保证学的规章有用；其二是 SIGReg 正则化，逼着 AI 把中枢特征散布得均匀种种，华体会体育不让它把总共画面齐映射成相似的特征。

同期，LeWM 把调参的难度降到了最低，昔时要调 6 个参数，咫尺只需要调 1 个，况且调参的技艺相等浅易，无谓反复试错，普通东说念主也能上手。

在实践性能测试中，琢磨团队在二维导航、机械臂收尾、推方块等经典一语气收尾任务上测试了 LeWM，并与现时主流的 JEPA 技艺（DINO-WM、PLDM）、活动克隆（GCBC）、离线强化学习（GCIVL、GCIQL）等技艺张开对比。

在二维导航任务中，智能体需要从一个房间穿过唯独的门，导航至另一个房间的指定办法位置，老到 AI 的旅途盘算和环境感知智商。LeWM 在该任务中虽略逊于传统技艺，但其潜特征仍能精确捕捉智能体的位置信息，后续琢磨阐述，这一弘扬相反并非源于特征学习不及，而是浅易环境的内在维度与 SIGReg 的正则化条目存在适配性问题，并非模子自身的性能纰谬。

图 | LeWM 在不同任务测试中的弘扬（开端：上述论文）

在推方块任务中，LeWM 收尾了性能突破，奏效用比主流端到端技艺 PLDM 跳动 18%，更重要的是，仅依靠纯像素输入的 LeWM，性能竟稀薄了额酬酢融机器东说念主实践感受信息（要津情景、畅通数据）的 DINO-WM，充分讲解其能从纯视觉画面中，精确捕捉到任务所需的一说念重要规章，无需颠倒信息援助。

除此以外，LeWM 的盘算效用更是收尾了质的飞跃。因为模子轻、特征浅易，LeWM 作念方案盘算的速率，最高是传统大模子技艺的 48 倍，单次盘算不到 1 秒，不同任务、不同环境下速率齐很踏实。

同期，LeWM 的检修踏实性远超传统技艺：传统 PLDM 的检修弧线波动剧烈，像“坐过山车”，而 LeWM 的检修弧线平滑单调管理，展望死亡稳步着落，SIGReg 死亡在检修初期快速着逾期趋于隆重，且不同就地种子下的检修隔断方差极小，可复现性大幅提高，透顶管理了传统技艺“一次奏效、次次翻车”的问题。

图 | LeWM 检修旅途（开端：上述论文）

最猛烈的是，LeWM 造的 “模拟器”，不是单纯靠死记硬背数据，而是确切学懂了物理宇宙的规章。

实验中，琢磨东说念主员能从 LeWM 的中枢特征里，精确索要出物体位置、角度、速率这些物理量，精度比传统技艺高好多；更意念念的是，给 LeWM 看三种视频：物体正常畅通、物体状貌顷刻间变了、物体顷刻间瞬移（违抗物理规章），LeWM 对瞬移会弘扬出显着的骇怪（展望差错骤增），对状貌变化却险些没反馈。这说明它能分清“只是外不雅变了”和“物理规章被逼迫了”，真实意见了宇宙的启动逻辑，而不是只记起画面的名义特征。

固然，咫尺 LeWM 还有一些小短板：比如咫尺只可作念短期的方案盘算，盘算太久会蓄积差错；在相等浅易的环境里，部分检修规矩的后果会打扣头；检修时还需要明确的“动作标签”，比如“推方块”要标注出推的标的和力度。

针对这些问题，琢磨团队也指出了将来的更变标的，比如把长任务拆成短任求收尾持久盘算、让模子从海量当然视频里学通用物理规章、让模子我方从画面里学动作，无谓颠倒标注。

参考邻接：

运营/排版：何晨龙华体会体育app

澳洲幸运5官方网站

上一篇：华体会体育app官网下属对你莫得称号, 根柢原因就3点!

下一篇：华体会体育 AOC“Q27G20SM”27 英寸露出器发售, 2099 元