本届Google I/O开发者大会更像“AI阅兵”？-翊众世纪

5月23日消息，周二，谷歌在位于加州山景城的海岸线圆形剧场举办一年一度的Google I/O开发者大会。会上谷歌宣布了涉及智能搜索、智能邮件回复、智能眼镜、音视频工具等一系列新功能，还发布了新的音视频人工智能工具。如其说是开发者大会，不如说是“AI阅兵”，主要亮点如下：

向全美搜索用户推送AI模式

谷歌宣布，开始向美国所有搜索用户全面推广人工智能模式。早在今年3月初，谷歌便在旗下实验室Labs的测试项目中首次向部分用户开放预览版人工智能模式，随后几个月逐步扩大开放范围，最近甚至已经开始覆盖普通搜索用户。谷歌在Google I/O开发者大会上公布了多项即将上线的人工智能模式新功能，包括购物助手、自动比价工具，以及可用于查询金融和体育类信息的自定义图表生成器。

Gemini登陆Chrome浏览器

谷歌还宣布，人工智能助手Gemini即将登陆Chrome浏览器。

Chrome中的Gemini将于本周三正式上线。初期将先面向18岁及以上、使用Windows和macOS的英语用户开放体验。谷歌副总裁兼Chrome总经理帕里莎·塔布里兹（Parisa Tabriz）表示，主要面向Google AI Pro和Ultra订阅用户，以及Chrome的beta、canary和dev渠道用户。

一系列音视频AI工具

谷歌周二正式发布了能够生成视频并同步嵌入音频的人工智能工具Veo 3。

这款工具对标OpenAI的Sora视频生成器，但与后者最大的区别在于Veo 3能够将音频一并融入生成视频中。谷歌表示，Veo 3不仅可以生成角色对话，还能合成动物叫声等环境音效。

这款人工智能音视频工具已于周二向订阅Ultra计划的美国用户开放。Veo 3也将面向Google Vertex AI企业平台用户提供服务。

谷歌还同步发布了新一代图像生成工具Imagen 4，称其可通过用户提示生成质量更高的图像。此外，谷歌还推出了一款名为Flow的全新电影制作工具，用户只需描述场景、镜头和风格偏好，即可生成具有电影质感的视频。Flow可通过Gemini、Whisk、Vertex AI和Workspace访问使用。

此外，谷歌还升级了Veo 2视频生成器，增加用户通过文本指令添加或移除视频中物体的功能。同时，谷歌还开放了Lyria 2音乐生成模型。

升级Gmail智能回复

谷歌还宣布，Gmail的智能回复功能将迎来重大升级：不仅能从用户正在阅读的一系列邮件中获取信息，还能深入挖掘Gmail收件箱和Google Drive文件，生成更贴近用户语气、内容更精准的回复建议。

这项改进是去年智能回复功能加入“上下文理解能力”后进一步提升功能。当时升级让智能回复不再局限于“好的”或“没问题”等简短内容，而是可以生成更长更完整的回应。不过，那时智能回复只能参考往来邮件中的内容。而现在人工智能能够调用邮件之外的信息，关联更多上下文。

此外，新的智能回复还会根据用户与收件人的关系来调整语气和风格。比如在给上司写邮件时，可能会建议使用更正式的措辞；而如果是和朋友互动，预期则会更轻松随意。

升级后的智能回复将首先上线英文版，适用于网页版、iOS和Android客户端，并将于今年7月份在Google Labs推出Alpha测试版。正式版预计会在今年第三季度开放。

需要注意的是，升级后的智能回复属于付费服务，面向Google Workspace付费用户以及Google One AI Premium订阅用户开放。

合作打造潮流智能眼镜

谷歌还宣布将与三星、Gentle Monster以及Warby Parker合作，共同打造人们“愿意佩戴”的智能眼镜。

此次合作表明谷歌这次在“外观设计”上的确动了真格，因为Warby Parker、Gentle Monster都是当下炙手可热的潮牌眼镜。这一波合作明显表明谷歌开发的Android XR不仅想做人人可戴的“日常眼镜”，还想吸引那些追逐潮流的时尚先锋。

谷歌似乎还将XR智能眼镜的硬件部分交给三星负责。谷歌XR部门副总裁沙赫拉姆·伊扎迪(Shahram Izadi)表示，公司正在“深化与三星的合作，从头戴设备拓展至眼镜产品”。此外，谷歌还宣布，首款搭载Android XR的智能眼镜将由Xreal打造，项目代号为Project Aura。

谷歌特别强调，这款XR智能眼镜将是Gemini AI的理想载体。原型眼镜配备摄像头、麦克风和扬声器，通过人工智能助理实时感知并解读用户周围环境。演示功能包括拍照、导航以及实时语言翻译。近几个月来，谷歌陆续公开了相关功能。

综合来看，谷歌显然是在参考Meta智能眼镜的成功经验，相当于正面承认Meta与雷朋合作的成绩斐然。今年2月，Meta公布旗下雷朋智能眼镜销量已达200万副，成其是人工智能助理的理想硬件。