IBM发布LLM工具调用判断器ToolRM,工具调用准确率提高25%
IBM发布LLM工具调用判断器ToolRM,工具调用准确率提高25%Tool-Calling作为Agent的核心模块,智能体的双手,这项关键能力允许 LLM 调用外部函数,例如应用程序接口(APIs)、数据库、计算器和搜索引擎,决定了AI Agent的可执行边界。
Tool-Calling作为Agent的核心模块,智能体的双手,这项关键能力允许 LLM 调用外部函数,例如应用程序接口(APIs)、数据库、计算器和搜索引擎,决定了AI Agent的可执行边界。
近来,由AI生成的视频片段以前所未有的视觉冲击力席卷了整个互联网,视频生成模型创造出了许多令人惊叹的、几乎与现实无异的动态画面。
Gemini核心开发者Dustin Tran昨日官宣跳槽xAI!马斯克也已转发推文确认。在谷歌的8年,从Gemini 1到最新尚未公布的Gemini,背后都有他的身影。他的到来,能为Grok带来哪些变化?
xAI重磅推出Grok 4 Fast,创新融合推理与非推理双模式,支持200万token上下文。在NYT Connections基准和AA智能指数中表现卓越,超越多家顶级模型,标志着AI智能获取门槛的进一步降低。
一个崭新的战场——AI支付又慢慢浮出水面。Stripe宣布将推出自己的支付L1,Tempo,Paypal宣布投资了Kite.AI,而就在前几天,Google宣布将推出自己的开源支付协议Agent Payments Protocol(AP2, 智能体支付协议),并将于Coinbase之前推出的X402一起合作,将X402整合到Google自己开发的A2A框架中去。
智能体开发平台3.0(ADP3.0)面向全球上线,腾讯优图实验室的关键智能体技术也将持续开源。据说,这次新版本打磨了3个月,完成近600个功能上线,从RAG能力到Workflow,从Multi-Agent协同到应用评测,再到插件生态,看样子是把所有模块都更新了一遍。
Wayve,一家总部位于英国的无人驾驶初创公司,有望凭一己之力拿到其中的五分之一。该公司日前宣布,已与英伟达签署意向书,后者将在其下一轮融资中“评估 5 亿美元的投资”。同时,Wayve 即将推出的 Gen 3 硬件平台,将完全基于英伟达的 DRIVE AGX Thor 车载计算平台打造。
谢集,浙江大学竺可桢学院大四学生,于加州大学伯克利分校(BAIR)进行访问,研究方向为统一多模态理解生成大模型。第二作者为加州大学伯克利分校的 Trevor Darrell,第三作者为华盛顿大学的 Luke Zettlemoyer,通讯作者是 XuDong Wang, Meta GenAl Research Scientist、
TwinMind的创始人Daniel George在JPMorgan工作时深深体验了这种痛点,当时他每天要参加无数个会议,于是他开发了一个脚本来录制音频、转录文本,并输入到ChatGPT中。神奇的事情发生了,随着时间的推移,ChatGPT开始真正理解他的项目,甚至能生成可用的代码。
印度首部100%AI短剧 成本降低75% Netflix搞AI主打越挫越勇 华纳、迪士尼、环球起诉MJ 海外AI内容乱成一锅粥 起猛了,OpenAI也开始秀AI动画的肌肉了? Los Angeles