此次,苹果提出的多模态大语言模型(MLLM) Ferret-UI ,专门针对移动用户界面(UI)屏幕的理解进行了优化,其具备引用、定位和推理能力。
来自主题: AI技术研报
4350 点击 2024-05-20 18:56
此次,苹果提出的多模态大语言模型(MLLM) Ferret-UI ,专门针对移动用户界面(UI)屏幕的理解进行了优化,其具备引用、定位和推理能力。
一句话Siri就能帮忙打开美团外卖下订单的日子看来不远啦!
不得不感叹,国外AI大模型的迭代速度,就像是坐火箭????。