Google Lens 现在可以基于视频和图像进行搜索。此功能现已在 Apple iOS 和 Android 上供搜索实验室或相应参与者使用。谷歌首次暗示最早将于 2024 年 5 月将此类视频集成引入 Google Lens。


事实上,您甚至可以将新的视频支持与音频输入结合起来。例如,您可以录制有鱼的水族馆的视频,并询问有关鱼的游泳行为的口头问题。然后,Google Lens 在后台使用 Gemini 使用 AI 来评估您的问题并提供适当的答案。

谷歌表示,谷歌镜头和 Gemini 本质上将视频处理为一系列单独的图像,因此您可以使用常规的计算机视觉技术。然而,仍然缺少的是: B. 有机会识别视频中的音频并提出有关它的问题。谷歌目前正在幕后进行试验,但尚未真正实现。
Google Lens:您还可以询问有关您照片的口头问题
将来,您在使用照片搜索时将能够提出口头问题。与视频类似,您可以通过将相机对准感兴趣的对象并按住快门按钮,使用语音开始提问。此前,口头信息只能在拍照后获得,而不能在拍照过程中获得。

一个缺点是:这些通过 Google Lens 提出的口头问题目前仅支持英语。此外,前提条件是您已加入实验搜索实验室并在那里注册,专门用于“人工智能导论”等实验。目前尚不清楚谷歌何时能够更广泛地向所有普通用户分发此功能并提供其他语言版本。

