谷歌发布Gemini 2.0人工智能模型,开启智能体时代新篇章

用户头像
AIFUC
3 月前
0
13
1
新闻图片

12月11日,全球科技巨头谷歌(GOOGL.US)正式推出了其最新一代人工智能模型——Gemini 2.0系列的首个版本,标志着该公司在人工智能领域迈出了重要一步。这一全新模型不仅在性能上实现了显著提升,更预示着人工智能正朝着更加智能、更加实用的代理时代迈进。

Gemini 2.0系列的首个版本被命名为Gemini 2.0 Flash,其聊天版本已面向全球用户开放使用。与此同时,具备文本到语音和图像生成功能的实验性多模式版本则专门供开发人员使用。谷歌表示,Gemini 2.0是他们迄今为止最强大的人工智能模型,专为智能体时代设计。

在发布Gemini 2.0模型的同时,谷歌还介绍了多个基于该模型构建的智能体应用(AI Agent)。这些智能体应用能够执行各种任务,从简单的信息查询到复杂的任务处理,为用户提供更加便捷、高效的服务。

谷歌表示,Gemini 2.0模型将首先开放给开发者和受信任的测试人员使用,并逐步将其整合到谷歌的各种产品中。这一模型基于谷歌定制的第六代TPU Trillium硬件平台构建而成,该硬件平台为Gemini 2.0的训练和推理提供了100%的算力支持。

谷歌首席执行官Sundar Pichai在一份声明中强调:“如果说Gemini 1.0是关于组织和理解信息,那么Gemini 2.0则是关于让信息变得更有用。”他表示,Gemini 2.0不仅具备强大的多模态能力,还支持原生工具的使用,能够为用户提供更加智能化、个性化的服务。

目前,谷歌完全对外开放的新模型是Gemini 2.0 Flash体验版。这一模型在保持低延迟的同时,性能得到了显著提升。与之前的1.5 Flash版本相比,Gemini 2.0 Flash在同样快速的响应时间下性能进一步增强,甚至在关键基准测试中超越了此前的旗舰模型1.5 Pro,速度提升了两倍。

除了性能上的提升,Gemini 2.0 Flash还具备多种新功能。它能够支持图片、视频和音频等多模态输入,并可以生成多模态输出,如图像与文本混合的内容以及可控的多语言文本转语音(TTS)音频。此外,Gemini 2.0 Flash还可以原生调用Google Search、代码执行以及第三方用户定义的函数等工具,为用户提供更加便捷的服务。

作为提供给开发者的体验版模型,Gemini 2.0 Flash现在可以通过Google AI Studio和Vertex AI中的Gemini API获取。所有开发者均可使用多模态输入和文本输出功能进行开发。谷歌表示,该产品将于明年1月全面上市,届时将推出更多型号供用户选择。

在发布Gemini 2.0 Flash的同时,谷歌还着重介绍了其智能体Project Astra。谷歌认为,Project Astra展示了通用AI助手的曙光。这一智能体具备实时语音和视觉处理能力,能够通过手机或谷歌眼镜进行跨文本、音频、视频的多模态实时推理。谷歌表示,Project Astra能够流畅地在多种语言和混合语言之间进行对话,并能够理解不同口音和生僻单词。借助Gemini 2.0,Project Astra可以与Google Search、Google Lens和Google Maps等工具相结合,为用户提供日常生活中的助手服务。

此外,谷歌还增强了Project Astra的记忆能力。这一助手现在能够记住长达10分钟的会话内容,并可以回忆起过去与它进行的更多对话,从而为用户提供更加个性化的服务。

除了Project Astra的升级版,谷歌还发布了其他多个智能体应用。其中,Project Mariner是一个能够完成复杂任务的智能体,它能够帮助用户理解和推理网页上的各类信息,并通过Chrome扩展程序协助用户完成任务。Jules则是一个面向开发者的AI代码代理,它可以直接集成到GitHub工作流程中,协助开发者解决问题和执行任务。

在推进这些创新的同时,谷歌也特别强调了安全性和负责任发展的重要性。公司采取了多项措施确保AI代理的安全使用,包括与责任与安全委员会(RSC)合作识别和了解潜在风险、改进AI辅助红队方法提升风险评估和缓解能力、为多模态输入输出建立安全评估和训练机制以及在Project Mariner中加入防范恶意指令的保护机制等。

Gemini 2.0系列模型的发布被视为谷歌在科技行业竞争日益激烈的人工智能竞赛中的最新努力。其竞争对手包括微软(MSFT.US)、Meta(META.US)以及OpenAI等初创公司。然而,谷歌表示,他们将继续以负责任的方式推进AI技术的发展,在探索新可能性的同时确保安全和道德标准。

随着Gemini 2.0系列模型的逐步推广和应用,用户将能够体验到更加智能、更加实用的AI助手服务。这不仅将提升用户的生活质量和工作效率,还将为谷歌在人工智能领域的发展注入新的动力。然而,谷歌也承认,AI代理技术仍处于早期阶段,需要继续通过与可信测试者的合作来收集反馈,不断改进和完善这项技术。未来,随着技术的不断进步和应用场景的不断拓展,谷歌有望在人工智能领域取得更加辉煌的成就。

THE END
新闻
AI代理
Gemni2.0
谷歌
支持一下吧
点赞
评论 (0)
请先登录