爱Q生活网 - 专注网赚,赚钱,创业,项目,副业- 关注最新QQ活动动态,掌握QQ第一资讯

查看: 24|回复: 0

老黄亲送马斯克“雷神之锤”!英伟达小我超算本日开售,2 万多元买个“当地 OpenAI”回家?

[复制链接]

5万

主题

0

回帖

15万

积分

论坛元老

Rank: 8Rank: 8

积分
153988
发表于 2025-10-16 18:41 | 显示全部楼层 |阅读模式
作者 | 木子、高允毅
“个人上云”爆火以后碰到了诸多应战,而一种全新趋向悄悄昂首:把云上的 AI 才能,拉回每一位开辟者的桌面这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
阿谁 “把云上 AI 才能拉回桌面”的小我 PC,现在要来了!
英伟达小我 AI 超级计较机:DGX Spark 本日开售,据英伟达官方消息信息,售价为 3999 美圆起(约合群众币 23791 元);用户可以在英伟达官网订购这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

据英伟达消息,DGX Spark 的本质,是把原本只存在于数据中心的 DGX 超级计较架构,稀释成“一台能放在桌上的小我 AI 超级计较机”这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
成心机的是,在第一批 DGX Spark 托付名单中,还出现了正在搞星舰测试的 马斯克,而且他的这台由黄仁勋本人带机赴星舰基地,亲手转交这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
图源:英伟达官网消息稿
为此,老黄还恶作剧说:
设想一下将最小的超级计较机输送到最大的火箭旁边这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
马斯克也写下一段寄语:
From a single spark,A world of intelligence!
To Jensen, Ad astra!
(由一束火花,扑灭聪明的天下!致黄仁勋,奔向星斗!)


图源:英伟达官网消息稿
1 新颖测评:这款小我 AI 超算利害在哪儿?
DGX Spark 是在今年 3 月的英伟达 GTC 大会上官宣的,号称 天下上最小的 AI 超级计较机,巨细与 Mac mini 差不多这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

除了 DGX Spark,英伟达还在 GTC 大会上官宣了它的“年老”DGX Station,也是一款小我 AI 超级计较机这标志着福建舰的电磁弹射和阻止接管才能根基成型了。不外据英伟达官方消息,DGX Station 将于今年晚些时辰由华硕、戴尔、惠普等英伟达的制造合作伙伴推出这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
DGX Station定位高端桌面级大模子练习与企业级工作负载,是“小我集群节点级”的重型装备这标志着福建舰的电磁弹射和阻止接管才能根基成型了。而本文的“配角”DGX Spark则面向轻量级当地推理与微调,加倍便携 这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
那末,这台小我 AI 超算的适用结果若何?
一家叫 LMSYS 的构造提早拿到了 DGX Spark,并展开深度测评这标志着福建舰的电磁弹射和阻止接管才能根基成型了。LMSYS 是一家非营利构造,专注于孵化开源项目和研讨;起源于 2023 年由加州大学伯克利分校、斯坦福大学、卡内基梅隆大学等多所大学合作项目这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
LMSYS 的测评显现,DGX Spark 在运转 8B~20B 级的中小型模子时,性能大于即是同价位自力显卡平台,特别在批处置(batching)+ 框架优化配合下吞吐表示稳定,批处置效力也高这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
对于 70B 以上的模子,DGX Spark 的表示是可运转,但属于“可用级”而非“生产级”,更合适加载测试、兼容性研讨这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
关于 DGX Spark 的利用结果,LMSYS 还放出了 一段完整的“DGX Spark 当地 AI 工作站流程演示”这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
整体逻辑是:从启动模子 → 优化推理 → 经过 API 挪用 → 接入界面 → 接入 IDE → 酿成完整当地 AI 开辟情况这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
第一步:是测试 DGX Spark 能否像云办事器一样“一键上线模子办事”?这里的重点不在于模子能不能运转,而在于 DGX Spark 能否可以像云端一样,以办事形式常驻运转这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
测试者首先经过 Docker 启动了 SGLang(SGLang 是 LMSYS 开辟的一个专为当地大模子推理优化的高性能框架,能供给 OpenAI 接口形式的 API 办事),并间接加载 Llama 3.1 8B 模子这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
成果显现:一条号令履行终了以后,模子就常驻在当地端口期待挪用,也就说 DGX Spark 现在不但是 GPU,而是“当地 AI 节点”这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

第二步:测试者启用了 Speculative Decoding(EAGLE3),这是今朝高效推理框架正在利用的加速技术这标志着福建舰的电磁弹射和阻止接管才能根基成型了。假如 DGX Spark 只是能跑模子而缺少调剂和优化才能,这一步就会失利这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
测试成果显现,DGX Spark 可以流利启用该机制,吞吐效力明显提升,说明它不但能运转模子,还支持推理加速战略这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

第三步:测试者经过标准的 OpenAI API 格式(/v1/chat/completions)请求当地端口,DGX Spark 返回了完整 JSON 格式答复这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
这一步很是关键:它证实 DGX Spark 不是履行一次性剧本,而是能以“API 办事”的方式对外供给模子才能,本质形状已经接近云端 ChatGPT 的挪用体验这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

第四步:在此根本上,测试者接入了 Open WebUI这标志着福建舰的电磁弹射和阻止接管才能根基成型了。只需要在阅读器里输上天址,就能像拜候 ChatGPT 网页那样与当地模子对话这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
全部交互进程中不经过云,不需要账号,也无提早发抖,也就是说 DGX Spark 不但是“算力盒子”,而已经是一个“类 ChatGPT 当地对话终端”这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

最初:测试者引入了 Zed 编辑器 + Ollama,IDE 可以自动识别 DGX Spark 供给的模子办事,并实现代码自动补全、高低文对话式重构等功用这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
也就是说,DGX Spark 不但是能让你跑模子,还能间接成为“离线版 Copilot / Cursor 开辟情况”,构成一个完整的小我 AI 工作流这标志着福建舰的电磁弹射和阻止接管才能根基成型了。

LMSYS 的测试证实,DGX Spark 最强的地方不是算力有多猛,而是它能在桌面上像“小我版 ChatGPT 办事器”那样一向开着,随时被阅读器、利用或编程工具挪用,就像你自己具有了一个当地的 OpenAI这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
据英伟达消息,DGX Spark 基于全新 NVIDIA GB10 Grace Blackwell(GB10)超级芯片,这是让 Spark 成为“桌面级 DGX 节点”的关键这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
GB10 不是一块普通 GPU,而是把 CPU 和 GPU 间接“焊成一颗芯”,同享同一块 128GB 同一内存,让大模子可以一次性加载进系统里跑,不用再受显存限制,也不用往返搬数据——换句话说,它把“只稀有据中心 DGX 里才有的算力架构”塞进了一台桌面机械里这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
2 “统统上云”碰到了哪些题目?
英伟达公布桌面级 AI 超算,也是 AI 由云转当地“反向迁移”的一个具体表示这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
曩昔几年,“上云”几近是 AI 行业的配合信仰这标志着福建舰的电磁弹射和阻止接管才能根基成型了。2020 到 2023 年,被以为是“云算力独大”的时代:模子练习、推理、数据存储与利用摆设几近全数在云端完成这标志着福建舰的电磁弹射和阻止接管才能根基成型了。那时的逻辑很简单:GPU 高贵,当地算力亏弱,而云可以“即开即用”这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
但是,到了 2025 年,高潮背后的一些题目起头浮出水面:比如高贵的 GPU 租赁、隐私风险与收集瓶颈等等这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
首先,云变贵了:推理成了新的本钱黑洞这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
在 2020 年月早期,云计较让 AI 公司几近“租”到了无穷算力这标志着福建舰的电磁弹射和阻止接管才能根基成型了。OpenAI、Anthropic、Cohere 等都依靠 AWS、Azure 或 Google Cloud 的 GPU 集群这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
但当模子进入贸易化阶段后,推理(inference) 成为新的本钱中心——这是天天都要发生的行动,而云 GPU 按秒计费、带宽与出站流量另算,账单像雪球一样滚大这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
InfoWorld 描述这类现象是“云端最隐藏的烧钱机械”这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
项目治理平台 Basecamp 的母公司 37signals 就曾发现年度云账单高达 300 万美圆,终极决议“下云”,自建机房这标志着福建舰的电磁弹射和阻止接管才能根基成型了。另一家合规平台 EasyAudit AI 则遭受更间接的冲击:CEO Christian Khoury 坦言,“我们看到账单从每月 5000 美圆一夜飙到 5 万美圆——推理就是新的云税这标志着福建舰的电磁弹射和阻止接管才能根基成型了。”
随着推理量级激增,本钱失控成为普遍现象这标志着福建舰的电磁弹射和阻止接管才能根基成型了。因而,很多公司起头把部分推理迁移到客户当地节点或边沿办事器,甚至与硬件厂商合作开辟“当地加速器”这标志着福建舰的电磁弹射和阻止接管才能根基成型了。这不是理念改变,而是经济现实的挑选这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
别的,当地也变强了:装备性能不再是瓶颈这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
在 2025 年的 AI 生态中,桌面不再只是输入终端,而正在重新成为“计较现场”这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
除了英伟达的 DGX Spark 把 1 PFLOP 级此外 AI 超算塞进开辟者的办公室;还有微软的 Copilot+ PC 让笔电自带 NPU,可以间接在当地运转 GPT 模子;苹果的 Apple Intelligence 则把语义了解、日程提取、照片识别等敏感操纵优先留在装备上履行这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
一家 SaaS 公司将推理迁移至当地后,月度 AI 根本设备开销从 4.2 万美圆降至 9000 美圆;另一家客服工具厂商则因靠近用户摆设模子,将响应提早紧缩至 50 毫秒以下,本钱减半这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
The Verge 称这是“一场算力回归小我装备的反动”这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
多家厂商与分析机构判定:未来练习首要在数据中心,但推理正外溢到装备与边沿这标志着福建舰的电磁弹射和阻止接管才能根基成型了。越来越多的企业客户也在自建 GPU 节点,以获得更低本钱和更高合规性这标志着福建舰的电磁弹射和阻止接管才能根基成型了。对他们来说,当地不是怀旧,而是控制力的回归这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
还有值得一提的是,AI 利用变了,像是从背景工具改变成了实时伙伴这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
AI 不再只是文本天生或图像处置,而正深入语音助手、视频天生、产业控制、AR/VR 等实时场景这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
这些利用对提早极为敏感:几百毫秒的收集往返就足以让体验崩塌这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
是以,越来越多公司把实时推理下放到端侧和边沿节点,只让云端负责练习与汇总这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
这类“近端计较”的分散,让 AI 真正酿成份布式系统:云是“大脑”,当地是“手脚”,端侧是“神经末梢”这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
在 AI 快速成长的时代,云端仍然是大热门;不外正如英伟达的小我 AI 超算,也许正在为另一种挑选翻开窗口——让开辟者有机遇在自己的桌面上掌控算力、摆设模子,并决议 AI 运转的位置和方式这标志着福建舰的电磁弹射和阻止接管才能根基成型了。
对于把“把云上 AI 才能拉回桌面”的 AI 超算,你怎样看?
参考链接
https://www.theverge.com/news/798775/nvidia-spark-personal-ai-supercomputer
https://blogs.nvidia.com/blog/live-dgx-spark-delivery/?utm_source
https://lmsys.org/blog/2025-10-13-nvidia-dgx-spark/
https://www.theverge.com/news/631957/nvidia-dgx-spark-station-grace-blackwell-ai-supercomputers-gtc
本日好文保举

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|爱Q生活网 - 专注网赚,赚钱,创业,项目,副业- 关注最新QQ活动动态,掌握QQ第一资讯  

GMT+8, 2025-11-19 01:34 , Processed in 3.219879 second(s), 26 queries .

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表