1. 首页 > 市场  > 谷歌I/O开发者大会:AI发货史上最快 智能体进驻浏览、搜索及Gemini

谷歌I/O开发者大会:AI发货史上最快 智能体进驻浏览、搜索及Gemini

  谷歌的2025年度Google I/O开发者大会开幕。

  大会的主题演讲刚开场,登台的Alphabet兼谷歌CEO 皮查伊(Sundar Pichai)就强调了谷歌AI助手Gemini的重要性,称“在谷歌,每天都是Gemini季”。

  皮查伊说,自上次I/O大会以来,谷歌已推出十多款模型和20项AI功能,谷歌的发货速度已经是史上最快:

  “我们希望尽快将最好的模型和产品交到大家手中,因此我们的发货速度比以往任何时候都快。”

  皮查伊透露,Gemini 2.5 Pro模型已在大语言模型(LLM)测评LLM Arena的所有类别排行榜上名列前茅。Gemini是热门AI代码编辑器Cursor上增长最快的模型。

  他介绍,一年来,谷歌系统每月处理的token数量激增,从去年的9.7万亿增加到现在的480 万亿,增长将近50倍。Gemini的App每月有 4 亿多活跃用户。每月有15 亿用户在搜索中使用谷歌的AI概览,这意味着谷歌提供生成式AI服务的用户规模超过其他公司。

  皮查伊宣布,谷歌将智能体(agent)功能带到Chrome、搜索以及大模型Gemini。

  谷歌发布名为Google Beam 的新产品。它是一个AI驱动的视频通信平台,让人们的视频感觉如同面对面聊天。它是谷歌3D视频会议系统项目Starline 技术的升级版。谷歌与惠普合作,将Google Beam 系统商业化,今年晚些时候,惠普将推出首批Google Beam设备。

  Google Beam 采用六个摄像头阵列,从不同角度捕捉拍摄对象、比如人物。AI视频模型将实时拼接这些视图,渲染成类似 3D 的画面,从而创建3D 人物。谷歌表示,该系统拥有近乎完美的头部追踪技术,精度可达毫米级,以视频帧率每秒60 帧(fps)的实时渲染速度呈现。

  谷歌高层介绍,Gemini 2.5 Pro 很快就能实现实时翻译。Gemini模型产品团队负责人Tulsee Doshi现场进行了实时翻译的演示,让AI语音先用英语说话,在说到一半时切换到印地语。

  Doshi 还表示,Gemini 2.5 Pro 更加安全,具有针对提示注入这种网络共计的保护措施。提示注入是指,利用恶意或非预期提示词诱骗 AI执行不应执行的操作。

  谷歌的在线视频会议服务Google Meet本周二推出实时语音翻译功能,目前支持英语到西班牙语的互译,更多语言将在未来几周内推出。该服务功能首先面向订阅用户,今年晚些时候扩大到企业用户。

  谷歌介绍,谷歌的推理模型Gemini 2.5 Flash效率更高。在实现相同性能的情况下,它使用的token更少,这样一来,效率就提升了22%。如果用户使用 Gemini 2.5 Flash 进行构建,使用的token会更少的。