财中社 冯静涵 2024-12-13 10:53 1.2w阅读
华金证券发布报告称,12月12日Google发布其迄今最强大的AI大模型Gemini2.0,...
12月13日,华金证券发布报告称,12月12日Google发布其迄今最强大的AI大模型Gemini2.0,新功能包括原生图像生成和音频输出的多模态输出,并支持原生调用谷歌搜索、地图、Lens等工具,目标直指多模态+AIAgent。头部公司AI通用模型重磅更新迭代,持续为AIAgent生态筑基强基,赋能引领行业发展。
Google基于Gemini 2.0 Flash发布系列新品,丰富AIAgent生态。本次Google发布的第一款新模型是Gemini 2.0 Flash的实验版本,速度相较Gemini 1.5 Pro提升了100%。基于Gemini 2.0 Flash,谷歌推出一系列AIAgent新品,包括今年5月轰动业界的通用AI助手原型Project Astra、能够作为实验性扩展在Google Chrome浏览器中完成多步骤复杂任务的Project Mariner、实验性AI编程Agent Jules、以及游戏Agent。
由Gemini 2.0提供支持的Project Astra可实现Agent能力,包括但不限于:10分钟的视频记忆上限,可记录更多对话以及用户展现的个人偏好,以更好地提供个性化服务;多语种和混合语言交谈,对口音和生僻词的理解力提升;通过使用Gemini 2.0的内置Agent框架,对必要工具进行即时调用;对话体验提升。实验性功能Project Mariner作为单一Agent设置实现了83.5%的最佳工作结果;AI编程Agent Jules直接集成了GitHub,目标构建在所有领域(包括编程)都有帮助的AIAgent;而游戏Agent可帮助用户在视频游戏的虚拟世界中导航,仅根据屏幕上的动作来推理游戏,并在实时对话中提供下一步操作的建议。
Google表示,新模型专为AIAgent时代而设计,主打多模态+AIAgent。此外,Google将于本周开始在搜索的AI概览中测试Gemini 2.0。预计Gemini 2.0 Flash将于2025年1月全面上市,同时将推出更多模型尺寸。同时,Gemini 2.0将于明年初被扩展到更多Google产品中。头部模型持续迭代将持续延展AIAgent可能性边界为业界提供方法论指导,长效赋能生产力提升。