华盛顿[美国],12月22日(ANI):谷歌的高级人工智能助手Gemini对Files by谷歌应用程序进行了一次值得注意的更新,现在可以识别屏幕上打开的PDF文件,使用户可以直接查询文件内容。
据The Verge报道,该功能是Gemini更广泛推出的上下文感知功能的一部分,旨在增强用户与数字文件交互的方式。
据The Verge报道,该功能已经开始向Gemini Advanced用户推出。当用户在Files by b谷歌应用程序中查看PDF文件时,他们可以召唤Gemini并点击一个名为“询问此PDF”的新按钮。这个选项允许用户提出关于PDF内容的特定问题,类似于人们如何与ChatGPT这样的会话AI互动。
这个特性显著改善了用户与其文件的交互方式。例如,你可以打开一份pdf文件——无论是研究论文、电子书还是报告——然后无缝地问双子座:“这份文件的摘要是什么?”或者“你能解释一下这个部分吗?”助理会给出详细的总结或澄清,就像私人助理为你解释文件一样。
b谷歌在2024年5月的I/O开发者大会上首次展示了这一功能,现在Gemini Advanced用户可以使用该功能。虽然目前仅限于这一群体,但该功能有望在未来扩展到更广泛的受众。
PDF识别能力是谷歌努力使Gemini在各种媒体上更具上下文感知能力的一部分。此前,Gemini允许用户询问有关网页和YouTube视频的问题。现在,它可以解释设备屏幕上显示的内容,为移动用户开辟了新的可能性。
对于还不支持Gemini上下文感知功能的应用程序或文件,该助手仍然可以通过抓取屏幕截图并根据屏幕截图回答问题来提供帮助。例如,当用户在浏览器中阅读一篇文章或观看YouTube视频时,可以点击“询问此屏幕”,让Gemini分析内容并做出回应。
这种互动功能使双子座不仅仅是一个助手;它成为一种高度直观的工具,用于跨设备浏览数字内容。
要使用这项新功能,用户需要订阅b谷歌的高级人工智能助手服务Gemini Advanced。虽然这项功能仍在推出,但它标志着数字助理在解读内容、与内容互动、简化信息检索和日常任务方面取得了重大进展。
将这些人工智能驱动的工具集成到广泛使用的应用程序中,如谷歌的Files,反映了数字助理日益成为生产力和内容管理不可或缺的趋势。无论是审阅报告、阅读PDF文件,还是浏览复杂的信息,Gemini的功能都旨在使处理过程更快、更有效和更具互动性。(ANI)