5月23日消息,周二,谷歌在位于加州山景城的海岸线圆形剧场举办一年一度的Google I/O开发者大会。会上谷歌宣布了涉及智能搜索、智能邮件回复、智能眼镜、音视频工具等一系列新功能,还发布了新的音视频人工智能工具。如其说是开发者大会,不如说是“AI阅兵”,主要亮点如下:
向全美搜索用户推送AI模式
谷歌宣布,开始向美国所有搜索用户全面推广人工智能模式。早在今年3月初,谷歌便在旗下实验室Labs的测试项目中首次向部分用户开放预览版人工智能模式,随后几个月逐步扩大开放范围,最近甚至已经开始覆盖普通搜索用户。谷歌在Google I/O开发者大会上公布了多项即将上线的人工智能模式新功能,包括购物助手、自动比价工具,以及可用于查询金融和体育类信息的自定义图表生成器。
Gemini登陆Chrome浏览器
谷歌还宣布,人工智能助手Gemini即将登陆Chrome浏览器。
Chrome中的Gemini将于本周三正式上线。初期将先面向18岁及以上、使用Windows和macOS的英语用户开放体验。谷歌副总裁兼Chrome总经理帕里莎·塔布里兹(Parisa Tabriz)表示,主要面向Google AI Pro和Ultra订阅用户,以及Chrome的beta、canary和dev渠道用户。
一系列音视频AI工具
谷歌周二正式发布了能够生成视频并同步嵌入音频的人工智能工具Veo 3。
这款工具对标OpenAI的Sora视频生成器,但与后者最大的区别在于Veo 3能够将音频一并融入生成视频中。谷歌表示,Veo 3不仅可以生成角色对话,还能合成动物叫声等环境音效。
这款人工智能音视频工具已于周二向订阅Ultra计划的美国用户开放。Veo 3也将面向Google Vertex AI企业平台用户提供服务。
谷歌还同步发布了新一代图像生成工具Imagen 4,称其可通过用户提示生成质量更高的图像。此外,谷歌还推出了一款名为Flow的全新电影制作工具,用户只需描述场景、镜头和风格偏好,即可生成具有电影质感的视频。Flow可通过Gemini、Whisk、Vertex AI和Workspace访问使用。
此外,谷歌还升级了Veo 2视频生成器,增加用户通过文本指令添加或移除视频中物体的功能。同时,谷歌还开放了Lyria 2音乐生成模型。
升级Gmail智能回复
谷歌还宣布,Gmail的智能回复功能将迎来重大升级:不仅能从用户正在阅读的一系列邮件中获取信息,还能深入挖掘Gmail收件箱和Google Drive文件,生成更贴近用户语气、内容更精准的回复建议。
这项改进是去年智能回复功能加入“上下文理解能力”后进一步提升功能。当时升级让智能回复不再局限于“好的”或“没问题”等简短内容,而是可以生成更长更完整的回应。不过,那时智能回复只能参考往来邮件中的内容。而现在人工智能能够调用邮件之外的信息,关联更多上下文。
此外,新的智能回复还会根据用户与收件人的关系来调整语气和风格。比如在给上司写邮件时,可能会建议使用更正式的措辞;而如果是和朋友互动,预期则会更轻松随意。
升级后的智能回复将首先上线英文版,适用于网页版、iOS和Android客户端,并将于今年7月份在Google Labs推出Alpha测试版。正式版预计会在今年第三季度开放。
需要注意的是, 升级后的智能回复属于付费服务,面向Google Workspace付费用户以及Google One AI Premium订阅用户开放。
合作打造潮流智能眼镜
谷歌还宣布将与三星、Gentle Monster以及Warby Parker合作,共同打造人们“愿意佩戴”的智能眼镜。
此次合作表明谷歌这次在“外观设计”上的确动了真格,因为Warby Parker、Gentle Monster都是当下炙手可热的潮牌眼镜。这一波合作明显表明谷歌开发的Android XR不仅想做人人可戴的“日常眼镜”,还想吸引那些追逐潮流的时尚先锋。
谷歌似乎还将XR智能眼镜的硬件部分交给三星负责。谷歌XR部门副总裁沙赫拉姆·伊扎迪(Shahram Izadi)表示,公司正在“深化与三星的合作,从头戴设备拓展至眼镜产品”。此外,谷歌还宣布,首款搭载Android XR的智能眼镜将由Xreal打造,项目代号为Project Aura。
谷歌特别强调,这款XR智能眼镜将是Gemini AI的理想载体。原型眼镜配备摄像头、麦克风和扬声器,通过人工智能助理实时感知并解读用户周围环境。演示功能包括拍照、导航以及实时语言翻译。近几个月来,谷歌陆续公开了相关功能。
综合来看,谷歌显然是在参考Meta智能眼镜的成功经验,相当于正面承认Meta与雷朋合作的成绩斐然。今年2月,Meta公布旗下雷朋智能眼镜销量已达200万副,成其是人工智能助理的理想硬件。