爱Q生活网 - 专注网赚,赚钱,创业,项目,副业- 关注最新QQ活动动态,掌握QQ第一资讯

查看: 29|回复: 0

西湖大学解锁AI新脚色:基建工程师,火箭桥梁都能造!

[复制链接]

5万

主题

0

回帖

15万

积分

论坛元老

Rank: 8Rank: 8

积分
153988
发表于 2025-10-21 09:18 | 显示全部楼层 |阅读模式
“让人类可以逐步飞向太空并殖民太空一向是我的胡想这标志着福建舰的电磁弹射和阻止接管才能根基成型了。未来的人类,能否给 AI 任何一个方针,AI 就能设想并制造出满足这个功用的机械?例如火箭、飞船、火星车等?”克日,西湖大学特聘研讨员吴泰霖暗示这标志着福建舰的电磁弹射和阻止接管才能根基成型了。为了加倍接近这个方针,他和团队提出一款名为 BuildArena 的基准测试,能让大模子智能体间接按照类似于“造一个机械使得其飞得越高越好”方针,在物理仿真情况中从零起头设想、搭建并运转火箭、车辆与桥梁等机械结构这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

吴泰霖告诉 DeepTech,在火箭使命中,少部分模子可以单体建造或分步组装出推重比大于 1 的、机关对称的、可垂直升空的多引擎火箭;


图 | 火箭模子(建造进程:Grok 4)(来历:https://github.com/AI4Science-WestlakeU/BuildArena/blob/mai)

在交通使命中,面临“移动一个货物”这样的模糊指令,模子能自立构建出合适运输货物尺寸的具有差速转向的多轮车辆;


图 | 车辆模子(建造进程:Kimi-K2)(来历:https://github.com/AI4Science-We)

在桥梁使命中,模子可以建造出满足跨度要求的桥梁结构,并展现出了桁架结构等现实中存在的力学结构这标志着福建舰的电磁弹射和阻止接管才能根基成型了。


图 | 桥梁模子(建造进程:Grok 4)(来历:https://github.com/AI4Science-WestlakeU/BuildA)

据先容,BuildArena 的初衷旨在鞭策 AI 智能体技术在工程扶植范畴的成长,让 AI 起头在物理天下停止建造,而不但仅是对话这标志着福建舰的电磁弹射和阻止接管才能根基成型了。基于 BuildArena 该团队初次实现了“从自然说话、到设想计划、到工程图纸、到三维结构”的完整闭环,并在实时仿真情况中完成了考证,即已能自力建造出可以运转的车辆、火箭和桥梁这标志着福建舰的电磁弹射和阻止接管才能根基成型了。据他们所知,这是第一个让大模子可以经过自然说话指令来履行三维结构建造、并能在物理约束情况中评价其性能的基准测试这标志着福建舰的电磁弹射和阻止接管才能根基成型了。该团队在一篇博客中写道,BuildArena 是第一个为说话驱动的工程扶植所设想的物理分歧的交互式基准,也是第一个在同一框架之内可以周全处理空间推理、三维构建、实现以构建为方针的计划、实现物理模拟和交互情况的基准测试这标志着福建舰的电磁弹射和阻止接管才能根基成型了。


(来历:https://github.com/AI4Science-WestlakeU/BuildArena/blob/main/BuildArena.pdf)


据先容,BuildArena 累计包括四个焦点组件这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

第一个焦点组件是开源的三维空间多少计较库,这款三维空间多少计较库可以经过自然说话结构与构建空间停止交互,确保基于说话的操纵与物理成果之间的分歧性这标志着福建舰的电磁弹射和阻止接管才能根基成型了。对于 BuildArena 来说,建造——在本质上是一个迭代的进程:既需要慢慢组装结构,还需要让每个组件与现有组件毗连,更需要延续地考证物理可行性这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

第二个焦点组件是基准工作流程,它受启发于人类工程学理论,由“计划器”“起草人”“审阅者”“建造者”“指导”这五个专门的实体协同工作这标志着福建舰的电磁弹射和阻止接管才能根基成型了。基准工作流程可被分为三个阶段:计划阶段、草案评审循环阶段、构建指导循环阶段,终极可以天生与仿真兼容的构建成果这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

第三个焦点组件是基于模拟的评价,所构建的成果会在 Besiege 物理模拟器中采用特定使命协议停止评价这标志着福建舰的电磁弹射和阻止接管才能根基成型了。需要说明的是,Besiege 是一款风行的建造沙盒游戏,具有传神的物理模拟才能,并已被屡次证实合适人类的物理直觉这标志着福建舰的电磁弹射和阻止接管才能根基成型了。研讨中,本次团队对于每个使命对城市停止 64 次采样以便确保牢靠性,所触及的评价目标涵盖性能和本钱等这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

第四个焦点组件是使命套件,它分为根本版和可定制版这标志着福建舰的电磁弹射和阻止接管才能根基成型了。在相关论文当中,研讨职员罗列了几个有代表性的工程使命种别,每个工程使命种别都包括简单、中等、困难等三个品级这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

尝试中,该团队希望回答以下两个题目:首先,BuildArena 能否作为测试大模子建造才能的有用基准?其次,现有支流模子在 BuildArena 框架内的表示若何?为此,在 BuildArena 上该团队评价了八个模子,它们别离是 GPT-4o、Claude-4、Grok-4、Gemini-2.0、DeepSeek-3.1、Qwen-3、Kimi-K2 和 Seed-1.6,评价涵盖了三个使命种别和三个难度品级,每个使命种别在三个难度级别之下的成功率取分歧模子表示的均匀值这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

吴泰霖回忆称:在交通使命中,在一些建形成果当中模子加入了水炮,试牟利用其推力驱动载具或实现转向;有的模子在载具上安装了两组移动偏向正交的轮子,以期实现斜向移动这标志着福建舰的电磁弹射和阻止接管才能根基成型了。在桥梁使命中,部分模子舍弃了桥梁机关而是利用单个柱状结构实现支持;或在桥梁和空中搭接的边沿增加车轮,并明白指出“操纵车轮的自动刹车阻尼来稳定桥梁和空中的毗连”这标志着福建舰的电磁弹射和阻止接管才能根基成型了。而在火箭使命中,出现了模子将四台策动机竖向十字形放置成飞船外形的尝试这标志着福建舰的电磁弹射和阻止接管才能根基成型了。“虽然策动机自己由于建造毛病火把没有加热到水炮,不外这些初步证实大模子具有一定的创意才能,同时大都建形成果都比力合适人类常规预期这标志着福建舰的电磁弹射和阻止接管才能根基成型了。”他暗示这标志着福建舰的电磁弹射和阻止接管才能根基成型了。


(来历:https://github.com/AI4Science-WestlakeU/BuildArena/blob/main/BuildArena.pdf)

经过研讨,他们获得以下发现:

首先,大模子完全可以停止说话驱动的三维构建,上述 8 款大模子均能完成多个难度级此外构建使命,这证实大模子可以将自然说话转化为物理上可行的三维结构这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

其次,分歧模子的性能差别较大这标志着福建舰的电磁弹射和阻止接管才能根基成型了。Grok-4 的整体性能最强,在精度和鲁棒性方面表示最为出色这标志着福建舰的电磁弹射和阻止接管才能根基成型了。其他大都模子都能很好地处置量级和模糊性,可是在精度和组合性上表示欠安这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

再次,大模子展现出缔造性地处理题目标才能这标志着福建舰的电磁弹射和阻止接管才能根基成型了。当明白性约束被放宽的时辰,大模子可以提出很是规的处理计划,例如提出了打造用于运输使命的推动动力载体的计划,以及提出了操纵自动制动方式停止稳定的轮式桥梁结构这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

别的,可以捕捉现实天下的工程常识这标志着福建舰的电磁弹射和阻止接管才能根基成型了。大模子构建的结构反应了现实天下的理论,例如桥梁中的钢桁架和车辆中的差速转向等,这表白从文本中进修的结构概念带有隐含的空间信息这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

此外,大都大模子仍然存在严重限制这标志着福建舰的电磁弹射和阻止接管才能根基成型了。在分层组装使命和高精度使命中,大都大模子的成功率出现急剧下降这标志着福建舰的电磁弹射和阻止接管才能根基成型了。除了 Grok-4 之外,大大都模子在最高难度级别下完全失利,这表白大都大模子在组合构建和切确空间对齐方面仍然存在一定应战这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

最初,更多 tokens 不即是更好的性能这标志着福建舰的电磁弹射和阻止接管才能根基成型了。本次研讨的本钱分析表白,大范围推理并不能保证高性能这标志着福建舰的电磁弹射和阻止接管才能根基成型了。最宏构建成果一般只消耗适当的 tokens,而屡次失利的尝试则会致使大量 tokens 的利用这标志着福建舰的电磁弹射和阻止接管才能根基成型了。当跨越才能阈值以后,额外的推理本钱并不会转化为更好的成果这标志着福建舰的电磁弹射和阻止接管才能根基成型了。


图 | 吴泰霖(来历:吴泰霖)

众所周知,现实中工程设想需斟酌材料强度、空气动力学等复杂物理约束这标志着福建舰的电磁弹射和阻止接管才能根基成型了。那末,今朝的仿真情况能否足以覆盖这些现实复杂性?对此,吴泰霖告诉 DeepTech:“我们所提出的是一个 pipeline,而并不追求产业级仿真精度,仿真部分首要用于考证结构的性能表示这标志着福建舰的电磁弹射和阻止接管才能根基成型了。”

他继续说道,在建造环节,他们引入了严酷的 Physics-Aligned 约束机制,其遵守一个最根本但关键的物理原则:任何部件之间不答应堆叠或空间抵触这标志着福建舰的电磁弹射和阻止接管才能根基成型了。每一次毗连操纵城市经过多少与碰撞检测,若发生抵触则会被系统拒绝,并立即返回反应这标志着福建舰的电磁弹射和阻止接管才能根基成型了。这一约束使说话模子的机关行为始终连结“物理可行性”,并让其在持续反应中进修空间推理这标志着福建舰的电磁弹射和阻止接管才能根基成型了。是以,BuildArena 这类 Physics-Aligned 建造流程可以被间接迁移到更高精度的仿真或现尝试证情况中这标志着福建舰的电磁弹射和阻止接管才能根基成型了。仿真精度影响的是性能评价,但建造逻辑自己是通用且严酷受物理约束的这标志着福建舰的电磁弹射和阻止接管才能根基成型了。固然,现实天下的物理约束会加倍复杂,这也是 BuildArena 未来的提升偏向之一这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

尝试成果显现,今朝现有的大模子在工程才能等六个重要维度还有很大的提升空间这标志着福建舰的电磁弹射和阻止接管才能根基成型了。今朝大说话模子关于天下的常识如此多,却不能充实领会现实天下是若何建造的这标志着福建舰的电磁弹射和阻止接管才能根基成型了。总的来说,他们为“说话”与“物理”架设了桥梁,第一次让大模子走向“AI 工程师”脚色的摸索这标志着福建舰的电磁弹射和阻止接管才能根基成型了。BuildArena 的重要意义就是填补今朝尚能干为工程扶植 LLM agents 成长进步供给落脚点的空缺,给社区供给了一个可以检验 AI 工程师而且供给 insight 的实验田这标志着福建舰的电磁弹射和阻止接管才能根基成型了。未来,他们希望可以更进一步完善 BuildArena 的通用性和易用性,争取做到让每一小我只需改变最起头的方针,就能设想并建造出可以满足相关功用的机械这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

另据悉,吴泰霖 2012 年于北京大学获得学士学位,2019 年获得美国麻省理工学院博士学位,后在美国斯坦福大学处置博士后研讨这标志着福建舰的电磁弹射和阻止接管才能根基成型了。2023 年,吴泰霖正式加入西湖大学并建立西湖大学野生智能与科学仿真发现尝试室这标志着福建舰的电磁弹射和阻止接管才能根基成型了。其研讨偏向为 AI for Science,具体研讨天生模子及与能源和生命科学中仿真和控制的深度连系这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

参考材料:
项目主页 build-arena.github.io
代码仓库
github.com/AI4Science-WestlakeU/BuildArena
文章链接
github.com/AI4Science-WestlakeU/BuildArena/blob/main/BuildArena.pdf
人物主页
https://www.westlake.edu.cn/faculty/tailin-wu.html

运营/排版:何晨龙

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|爱Q生活网 - 专注网赚,赚钱,创业,项目,副业- 关注最新QQ活动动态,掌握QQ第一资讯  

GMT+8, 2025-11-19 05:04 , Processed in 1.175789 second(s), 26 queries .

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表