Page 1 of 1

多模式:理解不同类型的信息

Posted: Tue Mar 18, 2025 8:34 am
by Fgjklf
谷歌的下一个算法不仅能够分析不同类型的内容(文本、图像、视频和音频),还能够处理各种格式的查询。这要归功于 Google Lens。此工具可让您拍摄图像并将其用作参考。事实上,当我写下这些内容时,我看到该工具已经添加到我的智能手机上的 Google 搜索栏中……这是我在笔记本中使用它时得到的结果。

移动设备上的 Google Lens 搜索的屏幕截图
但随着 Google MUM 的出现,演变将会更加深入。事实上,可以向图像添加文本查询。为了说明这个例子,谷歌通过添加搜索“我可以穿着这双鞋去富士山徒步旅行吗?”显示了一双鞋的照片。搜索引擎随后将理解搜索意图,并能够根据在互联网上获得的信息提供问题的答案。关于登山鞋的博客搜索结果也将添加到 SERP 中。

多任务处理:提供即时且相关的结果
说明性图片:Google 的 MUM 多任务算法
尽管情况一直如此,但 Google 正在尝试进一步提高其结果页面的质量, 电话线索 而无需等待时间。当您在搜索栏中输入查询时,算法会同时考虑您的用户数据及其数据库,几乎立即显示相关答案。但有了 Google MUM,这一切就更进一步了!

除了谷歌已经做的功能之外,未来的算法将能够同时执行更多任务。

关键字分组
多语言分析
搜索所有内容类型(文本、图像、视频和音频)
翻译
事实上,谷歌决定重点关注这一改进轴线,因此谷歌 MUM (多任务统一模型)这一名称十分恰当。