华体会app下载
2026-03-30 21:56 点击次数:71

在通往通用智能(AGI)的说念路上,宇宙模子(World Model)正被视为最重要的下一步。
平时来说,宇宙模子就像是给 AI 装上了一个“大脑模拟器”。它让机器东说念主不再只是是机械地奉行领导,而是具备了在遐想空间中预演将来的智商。当一个机械臂试图握取杯子时,宇宙模子允许它在真实脱手前,先在脑海中模拟不同动作可能导致的隔断。
为了构建这种模子,图灵奖得主杨立昆建议了斡旋镶嵌展望架构(JEPA)。该技艺抗拒直让 AI 展望复杂的画面变化,而是先把画面“压缩”成一串浅易的中枢特征,再让 AI 学若何展望这些中枢特征的变化。这么一来,AI 无谓缓和画面的细枝小节,只握重要规章,效用会高好多。
但是,传统 JEPA 技艺打造的 “模拟器”,弥远存在核肉痛点,成为其落地利用的阻难。
其一,检修易 “示意崩溃”,踏实性差。为了马虎完成特征展望任务,AI 会出现“偷懒”活动:将总共不同的视觉输入映射为险些疏通的潜特征,看似展望精确,实则这些特征毫无实践价值,这一问题被称为“示意崩溃”;其二,超参数繁琐,调参本钱极高。主流端到端 JEPA 技艺如 PLDM 领有 6 个可调超参数,参数的隐微变化齐会导致模子性能天差地远,调参不仅需要多半的时刻和筹谋资源,且参数无法跨任务复用,换一个任务就需要从头调试,门槛极高。
其三,筹谋本钱高,盘算启动迟缓。部分技艺为幸免“示意崩溃”,会依赖提前检修好的超大视觉预检修模子四肢基础,虽能提高踏实性,却让模子体积肥胖、编码效用低下,AI 完成一次方案盘算需要耗尽多半时刻。
近日,杨立昆团队发表的论文,建议了一款名为 LeWorldModel(简称 LeWM)的全新宇宙模子,中枢管理了传统 JEPA 检修不踏实、易崩溃、超参数多、筹谋本钱高的问题,是首个能从原始像素数据端到端踏实检修的宇宙模子。总共这个词模子就 2 个中枢组件、2 个死亡项,15M 参数,单 GPU 几小时就能训完,只好 1 个有用可调超参数。

LeWM 的构成相等精简,包括两部分。一个是编码器,用轻量的视觉模子,把录像头拍的彩色画面,形成一串节略的中枢特征,收拢画面里的重要信息;另一个是展望器,字据 “现时的中枢特征以及要作念的动作”,精确展望下一步的中枢特征,比如 “推一下方块,它的位置特征会形成什么样”,学懂环境的启动规章。
LeWM 最中枢的突破,在于用两个浅易且有科学因循的检修办法,从压根上管理了传统 JEPA 的“示意崩溃”问题,透顶摈弃了训诲性技能。其一为展望死亡,是让 AI 精确展望将来的中枢特征,保证学的规章有用;其二是 SIGReg 正则化,逼着 AI 把中枢特征散布得均匀种种,华体会体育不让它把总共画面齐映射成相似的特征。
同期,LeWM 把调参的难度降到了最低,昔时要调 6 个参数,咫尺只需要调 1 个,况且调参的技艺相等浅易,无谓反复试错,普通东说念主也能上手。
在实践性能测试中,琢磨团队在二维导航、机械臂收尾、推方块等经典一语气收尾任务上测试了 LeWM,并与现时主流的 JEPA 技艺(DINO-WM、PLDM)、活动克隆(GCBC)、离线强化学习(GCIVL、GCIQL)等技艺张开对比。
在二维导航任务中,智能体需要从一个房间穿过唯独的门,导航至另一个房间的指定办法位置,老到 AI 的旅途盘算和环境感知智商。LeWM 在该任务中虽略逊于传统技艺,但其潜特征仍能精确捕捉智能体的位置信息,后续琢磨阐述,这一弘扬相反并非源于特征学习不及,而是浅易环境的内在维度与 SIGReg 的正则化条目存在适配性问题,并非模子自身的性能纰谬。

图 | LeWM 在不同任务测试中的弘扬(开端:上述论文)
在推方块任务中,LeWM 收尾了性能突破,奏效用比主流端到端技艺 PLDM 跳动 18%,更重要的是,仅依靠纯像素输入的 LeWM,性能竟稀薄了额酬酢融机器东说念主实践感受信息(要津情景、畅通数据)的 DINO-WM,充分讲解其能从纯视觉画面中,精确捕捉到任务所需的一说念重要规章,无需颠倒信息援助。
除此以外,LeWM 的盘算效用更是收尾了质的飞跃。因为模子轻、特征浅易,LeWM 作念方案盘算的速率,最高是传统大模子技艺的 48 倍,单次盘算不到 1 秒,不同任务、不同环境下速率齐很踏实。
同期,LeWM 的检修踏实性远超传统技艺:传统 PLDM 的检修弧线波动剧烈,像“坐过山车”,而 LeWM 的检修弧线平滑单调管理,展望死亡稳步着落,SIGReg 死亡在检修初期快速着逾期趋于隆重,且不同就地种子下的检修隔断方差极小,可复现性大幅提高,透顶管理了传统技艺“一次奏效、次次翻车”的问题。

图 | LeWM 检修旅途(开端:上述论文)
最猛烈的是,LeWM 造的 “模拟器”,不是单纯靠死记硬背数据,而是确切学懂了物理宇宙的规章。
实验中,琢磨东说念主员能从 LeWM 的中枢特征里,精确索要出物体位置、角度、速率这些物理量,精度比传统技艺高好多;更意念念的是,给 LeWM 看三种视频:物体正常畅通、物体状貌顷刻间变了、物体顷刻间瞬移(违抗物理规章),LeWM 对瞬移会弘扬出显着的骇怪(展望差错骤增),对状貌变化却险些没反馈。这说明它能分清“只是外不雅变了”和“物理规章被逼迫了”,真实意见了宇宙的启动逻辑,而不是只记起画面的名义特征。
固然,咫尺 LeWM 还有一些小短板:比如咫尺只可作念短期的方案盘算,盘算太久会蓄积差错;在相等浅易的环境里,部分检修规矩的后果会打扣头;检修时还需要明确的“动作标签”,比如“推方块”要标注出推的标的和力度。
针对这些问题,琢磨团队也指出了将来的更变标的,比如把长任务拆成短任求收尾持久盘算、让模子从海量当然视频里学通用物理规章、让模子我方从画面里学动作,无谓颠倒标注。
参考邻接:
运营/排版:何晨龙华体会体育app
澳洲幸运5官方网站