12月11日,b谷歌宣布推出Gemini 2.0,这是迄今为止最先进的人工智能模型,世界科技巨头竞相在这项快速发展的技术中占据领先地位。
首席执行官桑达尔·皮查伊表示,新模型将标志着该公司所谓的人工智能发展的“新代理时代”,人工智能模型旨在理解你周围的世界并做出决定。
皮查伊在声明中表示:“Gemini 2.0的目的是让信息变得更有用。”他强调了该模型在理解上下文、提前多步思考以及代表用户采取监督行动方面的能力增强。
他补充说,这些发展“使我们更接近我们的通用助手愿景”。
该消息发布后,谷歌的股价在华尔街飙升了4%以上,此前一天,该公司在突破性量子芯片发布后股价已经上涨了3.5%。
科技巨头们正疯狂地采取措施,推出更强大的人工智能模型,尽管它们的成本巨大,而且它们对更广泛经济的直接效用也存在一些问题。
人工智能“代理”是硅谷的最新趋势,是一种数字助手,应该能够感知周围环境,做出决定,并采取行动实现特定目标。
这些科技巨头承诺,代理将成为人工智能革命的下一个阶段,这场革命是由2022年推出的ChatGPT引发的,该技术风靡全球。
Gemini 2.0最初面向开发人员和可信赖的测试人员,并计划在b谷歌的产品之间进行更广泛的集成,特别是在搜索和Gemini平台上。
没有英伟达
该技术由b谷歌的第六代TPU(张量处理单元)硬件提供支持,该硬件被称为Trillium,该公司现已向客户普遍提供。
谷歌强调,Trillium处理器专门用于训练和运行Gemini 2.0。
大多数人工智能培训一直被芯片巨头英伟达(Nvidia)垄断,该公司因人工智能的爆炸式增长而一跃成为全球市值最高的公司之一。
谷歌表示,数以百万计的开发人员已经在使用Gemini技术构建应用程序,该技术已集成到7个谷歌产品中,每个产品为超过20亿用户提供服务。
双子座2.0的能力预计将于2025年初用于b谷歌的搜索应用程序,该应用程序仍然是该公司的主要赚钱工具。
2.0系列的第一个版本将是Flash,在处理多种类型的输入(文本、图像、视频、音频)和输出(包括生成的图像和语音)时提供更快的性能。
该公司表示,Gemini的全球用户已经可以使用仅供聊天的Flash版本,测试人员可以使用可以解读图像和周围环境的多模式版本。
b谷歌还表示,它正在试验一款可以像人类用户一样使用软件应用程序、网站和其他在线工具的产品。OpenAI和Anthropic也推出了类似的功能。
该公司还发布了新版的Project Astra,这是一款智能手机数字助理,类似于苹果的Siri,可以对图像和口头命令做出反应。ta charset="UTF-8" /> -法新社