集成500+多模态现实任务!全新MEGA-Bench评测套件:CoT对开源模型反而有害?
集成500+多模态现实任务!全新MEGA-Bench评测套件:CoT对开源模型反而有害?MEGA-Bench是一个包含500多个真实世界任务的多模态评测套件,为全面评估AI模型提供了高效工具。研究人员发现,尽管顶级AI模型在多个任务中表现出色,但在复杂推理和跨模态理解方面仍有提升空间。
MEGA-Bench是一个包含500多个真实世界任务的多模态评测套件,为全面评估AI模型提供了高效工具。研究人员发现,尽管顶级AI模型在多个任务中表现出色,但在复杂推理和跨模态理解方面仍有提升空间。
产品上线四周,ARR 收入从零到 400 万美元;
在硅星人首届AI创造者大会(ACC 2024)上,五位AI Agent领域的先行者展开了一场关于技术落地与商业化的深度对话。来也科技联合创始人胡一川、实在智能创始人&CEO孙林君、汇智智能创始人&CEO孙志明、澜码科技创始人&CEO周健,以及主持人、AI创业者李博杰共同探讨了一个核心问题:AI Agent如何从学术概念真正转变为驱动企业增长的工具?
在未来,得AI者才能得天下。 今年年初,OpenAI发布了“文生视频”的工具Sora,仅凭几段视频,就让很多人见识到了AI生成视频的力量。
11月11日,谷歌推出了一款名为“Learn About” 的实验性的新 AI 工具,它不同于此前的聊天机器人,如 Gemini 和 ChatGPT。
“过去24个月,AI行业发生的最大变化是什么?是大模型基本消除了幻觉。”11月12日,百度创始人李彦宏在百度世界2024大会上,发表了主题为《应用来了》的演讲,发布两大赋能应用的AI技术:检索增强的文生图技术(iRAG)和无代码工具“秒哒”。文心iRAG用于解决大模型在图片生成上的幻觉问题,极大提升实用性;无代码工具“秒哒”让每个人都拥有程序员的能力,将打造数百万“超级有用”的应用。
社交平台X(原Twitter)正在为其AI聊天助手Grok开启免费用户测试。这款由马斯克旗下xAI公司开发的AI工具此前仅向付费会员开放,如今有望迎来重大变革。
在当前AI写作工具迅速发展的背景下,华盛顿大学的这项研究选择了一个独特的切入点。研究团队没有去探讨AI是否应该用于创意写作这个争议性话题,而是直接走进了那些已经在使用AI的作家的创作现场。这18位作家来自不同背景:
7月29日,AI图像生成平台「LiblibAI哩布哩布AI」宣布,在一年内已完成三轮融资。
黑森林实验室(Black Forest Labs)最近推出了FLUX1.1 [pro]的Ultra模式和Raw模式,为图像生成工具带来突破性升级,让创作者在AI生成图像领域有了前所未有的选择。