还在玩AI 3D手办?Gemini 3 Deep Think已能直]出STL,可打印实物

  更新时间:2026-02-16 12:18   来源:牛马见闻

吉报头条
重要新闻
国内新闻
国际新闻
图片精选

The pelican must have its characteristic large pouch, and there should be a clear indication of feathers.The pelican mus

<p class="f_center"><br><br></p> <p id="4ARP9F7D" style="text-align:center;">编辑|sia</p> <p id="4ARP9F7E">推理模型赛道,已经近乎肉搏。</p> <p id="4ARP9F7F">一]边是 OpenAI o1 系列,主打「]多想一步」的强化推理路线,用更长思考时间换更稳的结论。</p> <p id="4ARP9F7G">一边是 Anthropic 的 Claude Thinking,深耕研究与分析场景,强调长上下文下的审慎与可靠。</p> <p id="4ARP9F7H">现在,谷歌也重兵压上——Gemini 3 Deep Think 迎来重大升级。</p> <p id="4ARP9F7I">不过真正吸睛的,早就不是又赢了几个 benchmark,而是它的定位:「参与科研和工程决策」的实力。</p> <p id="4ARP9F7J">业内一直流传一套很经典的民间压力测试,让模型生成「一只骑自行车的鹈鹕」(A pelican riding a bicycle)的 SVG 代码。</p> <p id="4ARP9F7K">题目看起来像 meme,但懂的人都知道,它同时卡三件事:空间逻辑、结构正确性、细节遵从能力。</p> <p id="4ARP9F7L">已有网友放出相当惊艳的版本,也是我见过最好的一张。</p> <p class="f_center"><br><br></p> <p id="4ARP9F7N">案例来自 https://simonwillison.net/</p> <p id="4ARP9F7O">加码难度,上硬核约束:</p> <p id="4ARP9F7P">Generate an SVG of a California brown pelican riding a bicycle. The bicycle must have spokes and a correctly shaped bicycle frame. The pelican must have its characteristic large pouch, and there should be a clear indication of feathers. The pelican must be clearly pedaling the bicycle. The image should show the full breeding plumage of the California brown pelican.</p> <p id="4ARP9F7Q">难度瞬间从「会画图」,跃迁到「会建模 + 会生物 + 会物理」。</p> <p id="4ARP9F7R">尤其是,画出「加州褐鹈鹕繁殖羽」。这不是随便涂个颜色就能糊弄的。繁殖期它的头部会偏黄,颈部呈红棕色,要求模型具备非常专业的生物知识。</p> <p id="4ARP9F7S">「正在蹬踏」要求 AI 能正确处理肢体与机械的交互:动物的脚丫子,必须对准踏板。</p> <p id="4ARP9F7T">结果,Gemini 3 Deep Think 还能稳定交出质量很高的 SVG。</p> <p class="f_center"><br><br></p> <p id="4ARP9F7V">案例来自 https://simonwillison.net/</p> <p id="4ARP9F80">这里释放的信号其实很清晰:Gemini 3 Deep Think 追求的不是「更会想」,而是在<strong>科研级、工程级、多条件约束问题</strong>上,能更可靠地把事情做对。</p> <p id="4ARP9F81">从「纸上谈兵」进化到「动手造物」,更明显的用例,是它能把用户的要求、草图甚至照片,直接建模成<strong>可 3D 打印的实体文件</strong></p> <p class="f_center"><br><br></p> <p class="f_center"><br><br></p> <p id="4ARP9F85">来自谷歌软件工程师@rakyll</p> <p class="f_center"><br><br></p> <p id="4ARP9F87">其实,谷歌也在推广中主打Deep Think会分析图纸,构建复杂的形状,并生成文件,使用3D打印机创建实体对象。</p> <p id="4ARP9F88">要知道 AI 以前只是个画家,你给它看一张锅的照片,它能临摹出一张一模一样的画,但那只是平面的影子。</p> <p id="4ARP9F89">现在, Gemini 3 Deep Think 看一眼照片,就能脑补全这张锅在各个角度的长宽高、厚度甚至把手的弧度,直接变出一个立体实物原型。</p> <p id="4ARP9F8A">换句话说,它不止要会空间推理(理解结构、体积、厚度、连接),还要考虑一个更现实的问题:这东西能不能被制造出来、能不能被真实使用。</p> <p id="4ARP9F8B">答案是肯定的。</p> <p class="f_center"><br><br></p> <p class="f_center"><br><br></p> <p id="4ARP9F8F">它甚至开始带着审美与结构意图去做生成设计。</p> <p id="4ARP9F8G">这是它设计的一个花盆。</p> <p class="f_center"><br><br></p> <p id="4ARP9F8I">来自x网友@ytiskw,「请设计一个全新的时尚花盆,并使用 Python 输出为 STL 文件。条件:可以排水……」</p> <p id="4ARP9F8J">从不同角度看,「面」和「角」的视觉会发生变化,立体感和现代感都很强,不像是单纯堆几何体,更像是在做造型语言。</p> <p id="4ARP9F8K">还有更硬核的玩法。</p> <p id="4ARP9F8L">这位 MIT 教授先给它一张 3D 蜘蛛网图片,要求生成交互式设计工具。</p> <p id="4ARP9F8M">结果,它一步到位,直接产出了一整套完整的设计套件,涵盖程序化控制、仿真与优化流程,并支持 STL 文件导出。</p> <p id="4ARP9F8N">https://x.com/ProfBuehlerMIT/status/2022635227609268480</p> <p id="4ARP9F8O">教授甚至用这套工具设计了全新的超材料结构,以及一款受蜘蛛网启发的桥梁方案。</p> <p class="f_center"><br><br></p> <p id="4ARP9F8Q">3D 打印后,还做了受力测试(用的是 nvidia DGX Spark ,大约 2 斤半重),确认结构在工程上也立得住。</p> <p class="f_center"><br><br></p> <p id="4ARP9F8S">想象一下,你在网上刷到一个造型奇特的设计。</p> <p id="4ARP9F8T">过去你想 3D 打印一个相近的,得会 Blender、Fusion 360 这类软件,拉曲面、调尺寸、做厚度,新手往往得学好几周。</p> <p id="4ARP9F8U">现在,截图给 AI → 输出 STL → 丢进 3D 打印机 → 几小时后实物到手,等于把专业 3D 建模几乎压缩成了「一键生成」。</p> <p id="4ARP9F8V">再看看另一个用例。用 Deep Think 把周围的 WiFi 网络空间化、可视化,用 3D 方式展示信号强度和可能的物理位置关系。</p> <p id="4ARP9F90">平时手机里的 WiFi 列表按信号强度(RSSI)排序,但在物理空间里,强度不等于距离。比如,离你 2 米、隔着承重墙的路由器,可能比 10 米外空旷区域的路由器还要弱。</p> <p id="4ARP9F91">这里, Deep Think 聪明地引入了统计关联,如皮尔逊相关分析,去推断哪些 AP在物理上更可能彼此接近。</p> <p id="4ARP9F92">此外,还有更典型的科研叙事。比如,Deep Think 能审阅高度专业的数学论文,指出同行评审漏掉的细微逻辑缺陷,也被用于优化半导体晶体生长流程。</p> <p id="4ARP9F93">换句话说,谷歌想证明的不是它更会「想」,而是它开始真的能「干活」。</p> <p id="4ARP9F94">它盯住的是科研与工程里的硬骨头:没有明确边界、没有唯一答案、数据又脏又乱的真实研究问题。</p> <p id="4ARP9F95">而且,不只是卷数学、编程,而是把触角伸向化学、物理(包括理论物理)等多个科学领域,全面铺开。</p> <p id="4ARP9F96">随着通用对话能力快速商品化,那些真正能处理复杂财务模型、实验数据与工程设计的深度推理能力,正在成为新的竞争高地。</p> <p id="4ARP9F97">谷歌正在试图把大模型从信息助手,推向科研与工程体系里的「第二大脑」。如果后续真实采用率跟得上,这一步的分量,可能会比单纯的性能提升更大。</p>

编辑:邓氏美蓉