多模态长文档新基准来了!20多项任务覆盖理解推理定位,GPT-4o也就刚及格
多模态长文档新基准来了!20多项任务覆盖理解推理定位,GPT-4o也就刚及格GPT-4o仅得分64.5,其余模型均未及格! 全面、细粒度评估模型多模态长文档理解能力的评测集来了~ 名为LongDocURL,集成了长文档理解、数值推理和跨元素定位三个主任务,并包含20个细分子任务。
GPT-4o仅得分64.5,其余模型均未及格! 全面、细粒度评估模型多模态长文档理解能力的评测集来了~ 名为LongDocURL,集成了长文档理解、数值推理和跨元素定位三个主任务,并包含20个细分子任务。
a16z 合伙人 Jennifer Li 最近分享了她对生成式 AI 的最新见解,特别提到了设备端运行的小型模型在未来的重要性。
2024年已经结束,2025年对于AI又意味着什么?田渊栋最新长文中对过去一年做了全面的总结。
微软又把OpenAI的机密泄露了??在论文中明晃晃写着: o1-preview约300B参数,GPT-4o约200B,GPT-4o-mini约8B……
12月31日,上海高级别自动驾驶引领区数据采集车发车仪式在上海浦东举行,30辆全新的智己L6数据采集车盛装列队并集中发车。上海正谋划打造人工智能“模塑申城”,建设高级别自动驾驶引领区,按照“单车智能为基础,车路云协同为关键支撑”技术路线,持续推动上海智能网联汽车产业生态培育。
1月2日,IBM原全球副总裁、大中华区首席技术官谢东博士去向明确,正式出任人工智能创新型国企北京电子数智科技有限责任公司(简称“北电数智”)首席技术官。谢东博士的加入,将加速北电数智在 AI前沿技术的研究探索、科研成果转化,以及行业场景化解决方案开发与落地。
OpenAI发布旗舰推理模型o3和o3-mini,成为他们2024年的收官之作,制造了一波小热潮。和往常一样,Twitter (x.com)依然是外网讨论的主阵地。
2024年12月31日,阿里云宣布2024年度第三轮大模型降价,通义千问视觉理解模型全线降价超80%。
2024年,所有的3C数码新品基本都绕不开“AI”这个词,更具体地说,是绕不开AI大模型。而反过来说,AI大模型也脱离不了硬件,毕竟任何新产品都绕不开3个质问:落地场景究竟是什么,怎么样被市场接受,和怎么赚钱。
闪极AI眼镜业务的第一阶段目标为年出货量50万台,销售额超过6个亿。