Gemini 3.5 Flash上线“计算机使用”功能,AI智能体落地提速?

谷歌于2026年6月25日正式宣布在其最新版本的轻量级人工智能模型 Gemini 3.5 Flash 中引入“计算机使用”(Computer Use)功能。这一更新标志着该模型首次具备直接与操作系统交互、执行用户授权任务的能力,不再局限于文本生成或对话响应。尽管谷歌未在公告中详述技术细节,但此举被市场广泛解读为其在AI智能体(AI Agent)赛道加速落地的关键一步。
“计算机使用”功能:从语言模型到操作代理的跃迁
Gemini 3.5 Flash 是谷歌面向高吞吐、低延迟场景优化的推理模型,主打成本效益与快速响应,适用于移动端、浏览器插件及企业自动化流程。此次新增的“计算机使用”功能,意味着该模型可在用户明确授权下,调用本地或云端计算资源,执行如文件管理、数据提取、跨应用操作等任务。例如,用户可指令模型“整理上周所有来自客户的Excel报价单,并汇总成一份PDF报告”,模型将自动访问指定文件夹、读取文档、处理数据并生成输出。
这一能力的核心在于将大语言模型(LLM)与操作系统API深度集成,形成闭环执行环境。不同于传统AI仅提供“建议”或“代码片段”,Gemini 3.5 Flash 现在能作为“数字员工”直接完成端到端操作。值得注意的是,该功能默认处于关闭状态,需用户主动启用并授予具体权限,以符合隐私与安全规范。
目前尚无官方文档披露其底层架构是否基于Project Astra或与Android系统深度协同,但结合谷歌近年在AI原生操作系统(如Android 16的AI Core)上的布局,此次更新很可能为未来设备端智能体生态铺路。
发布时机与产品演进逻辑
Gemini 3.5 Flash 最初于2026年5月发布,定位为Gemini 3.5系列中的高效推理版本,强调速度与性价比。此次6月25日的功能更新,距离初版发布仅一个月,显示出谷歌在AI产品迭代上的激进节奏。对比5月版本,新功能并未提升基础模型参数或上下文长度,而是聚焦于“行动能力”的扩展——这反映出谷歌正从“更强的语言理解”转向“更广的任务执行”战略。
值得注意的是,此次更新发生在谷歌云服务遭遇区域性中断的敏感时期。根据2026年6月24日路透社报道,位于印度新德里的STT-Tata数据中心于6月初发生严重火灾,导致包括谷歌云在内的多家科技企业服务受损。谷歌在6月9日的事故通报中承认,该事件迫使紧急切断网络设备供电,截至6月23日仍未完全恢复,部分客户仍面临延迟问题。
在此背景下推出具备本地化操作潜力的AI功能,或许隐含战略考量:通过增强终端设备的自主处理能力,降低对中心化云基础设施的依赖。Gemini 3.5 Flash 的“计算机使用”若能在设备端完成更多任务,将减少数据上传与远程调用频次,从而提升系统韧性——尤其在云服务不稳定地区。
市场影响与竞争格局
谷歌此举直接对标OpenAI的“Computer Use”实验性功能(此前在GPT-4o中测试)以及Anthropic在Claude中推进的工具调用(Tool Use)能力。然而,Gemini 3.5 Flash 的差异化在于其轻量化设计与谷歌生态整合优势。该模型可无缝嵌入Chrome浏览器、Workspace套件及Android设备,形成从云端到终端的统一智能体接口。
对开发者而言,这意味着更低门槛的AI自动化方案。企业无需部署重型模型即可实现日常办公自动化,如邮件分类、会议纪要生成、数据库查询等。对普通用户,未来可能通过Gemini直接控制电脑完成复杂操作,模糊人机交互边界。
不过,安全与滥用风险仍是关键挑战。允许AI直接操作系统权限,可能被恶意利用进行数据窃取或系统破坏。谷歌强调所有操作需经用户显式授权,并采用沙箱隔离机制,但实际防护效果仍有待大规模部署后验证。
投资者关注点:商业化路径与生态协同
谷歌母公司Alphabet(GOOG.O)当前正全力推动AI变现,Gemini已深度集成至广告、搜索、云及硬件业务。Gemini 3.5 Flash 的“计算机使用”功能虽属技术升级,但其商业价值取决于应用场景的拓展速度。短期内,该功能可能首先面向Google Cloud客户开放,作为Vertex AI平台的增值服务;长期则有望成为Android设备的标配能力,驱动硬件销售与服务粘性。
此外,该更新强化了谷歌在“AI智能体”竞赛中的位置。相较于Meta聚焦社交AI、微软绑定Windows Copilot,谷歌凭借跨设备、跨平台的统一模型策略,试图构建更开放的操作系统级智能体生态。若Gemini能成功将语言理解转化为可靠行动力,将显著提升其在企业自动化市场的竞争力。
截至2026年6月25日,谷歌尚未公布该功能的具体上线时间表或定价策略,但鉴于Flash版本本就面向高并发场景,预计将以API调用次数或任务复杂度计费。投资者可密切关注后续季度财报中关于Gemini API使用量及客户采用率的披露。
总体而言,Gemini 3.5 Flash 引入“计算机使用”功能,不仅是技术迭代,更是谷歌AI战略从“对话助手”向“行动代理”转型的明确信号。在全球数据中心稳定性面临挑战、企业对自动化需求激增的当下,这一能力或将成为其巩固AI领导地位的关键支点。












