感恩节和圣诞节之间的日子通常是发布新技术的死期,但对于Alphabet Inc .的谷歌来说,这段时间是绝望的。
一年前,这个笨拙的搜索巨头被ChatGPT打了个措手不及,它一直渴望描绘一幅自己快速前进的画面。在有关推迟发布的报道之后,该公司周三突然发布了一款新的人工智能模型Gemini,它可以发现戏法,并在会计考试中取得好成绩。谷歌发布的一段演示视频(见下图)在社交媒体上引起了轰动——但这是一项壮举。从技术角度来看,谷歌仍然在后面追赶OpenAI。
故事有限公司
继续下面的广告删除广告
让我们从技术细节开始。以下是谷歌发布的Gemini与OpenAI顶级模型GPT-4的排名:
谷歌的表格显示,Gemini Ultra(蓝色)在大多数标准基准测试中都优于GPT-4。这些测试在高中物理、专业法律和道德场景等方面测试人工智能模型,而当前的人工智能竞赛几乎完全是由这些能力定义的。
但在大多数基准测试中,Gemini Ultra只比OpenAI的GPT-4高出几个百分点。换句话说,谷歌的顶级人工智能模型只对OpenAI至少一年前完成的工作进行了有限的改进。"奥特拉"还处于保密状态。
如果它像谷歌建议的那样在1月初发布,那么Gemini Ultra可能不会在顶级机型上呆太久。在谷歌赶上OpenAI的时间里,这个更灵活的玩家有将近一年的时间来开发它的下一个人工智能模型GPT-5。
然后是下面的视频演示,技术人员在X网站(前身为Twitter)上描述为“令人瞠目结舌”:
乍一看,这是令人印象深刻的东西。该模型能够从塑料杯下追踪纸球,或者在画出点对点的图片之前就推断出它是一只螃蟹,这些都显示出谷歌DeepMind人工智能实验室多年来培养的推理能力。这是其他人工智能模型所缺少的。但上面展示的许多其他功能并不是独一无二的,ChatGPT Plus也可以复制,沃顿商学院教授伊森?莫里克已经在这里和这里证明了这一点。
故事有限公司
继续下面的广告删除广告
谷歌也承认视频是经过编辑的。它在YouTube上的描述中说:“为了这个演示的目的,延迟已经减少,Gemini的输出也缩短了。”这意味着每个回答所花费的时间实际上比视频中要长。
在现实中,演示也不是实时或语音进行的。当《彭博意见》(Bloomberg Opinion)问及这段视频时,谷歌的一位发言人表示,这段视频是“使用视频中的静止图像帧,并通过文本提示”制作的。他们还指出,有一个网站展示了其他人如何通过自己的手、绘画或其他物体的照片与Gemini互动。换句话说,演示中的声音正在读出他们给Gemini做的人工提示,并向他们展示静态图像。这似乎与谷歌所暗示的完全不同:一个人可以与Gemini进行流畅的语音对话,因为它可以实时观察周围的世界并做出反应。
视频也没有说明这个演示(可能)是Gemini Ultra,这款还没有上市的机型。对这些细节的捏造表明,谷歌在这里进行了更广泛的营销努力:谷歌希望我们记住,它拥有世界上最大的人工智能研究团队之一,并且比其他任何人都能获得更多的数据。正如它在周三所做的那样,它希望通过在Chrome、Android和Pixel手机上推出功能较差的Gemini版本,提醒我们它的部署网络有多庞大。
但在科技领域,无处不在并不总是看起来那么有优势。早期的手机霸主诺基亚(Nokia Oyj)和黑莓(Blackberry Ltd .)在本世纪头十年经历了惨痛的教训,苹果(Apple)推出了功能更强大、更直观的产品iPhone,抢走了它们的午餐。在软件领域,市场的成功来自于拥有性能最好的系统。
几乎可以肯定的是,谷歌的炫耀是为了利用OpenAI最近的动荡。据《华尔街日报》(the Wall Street Journal)报道,当这家规模较小的人工智能初创公司的董事会发生政变,暂时罢免了首席执行官萨姆·奥特曼(Sam Altman),并使公司的未来受到质疑时,谷歌迅速发起了一场销售活动,说服OpenAI的企业客户转向谷歌。现在,随着双子座的发射,它似乎正在驾驭这股不确定性的浪潮。
但令人印象深刻的演示只能让你走到这里,谷歌之前已经展示了不可思议的新技术,但没有任何进展。(记得双吗?)到目前为止,谷歌庞大的官僚机构和层层的产品经理使其无法像OpenAI那样灵活地发布产品。随着社会努力应对人工智能的变革性影响,这并不是一件坏事。但对谷歌(Google)的最新冲刺表现持保留态度。它仍然从后面追上来。
帕米·奥尔森是彭博观点的专栏作家。观点不代表本出版物的立场。
邀请你的朋友和家人注册MC Tech 3,我们的每日通讯,打破了当天最大的技术和创业故事
DAILY-EVENING
订阅你的收件箱里最热门的科技和创业故事,以此结束你的一天
DAILY-EVENING
订阅你的收件箱里最热门的科技和创业故事,以此结束你的一天